• Антропик управлял ИИ
  • Компания работала с министерством США, чтобы гарантировать, что ИИ может определить такие тесты
  • Антрические утверждения, он обнаруживает опасные запросы, связанные с ядерной, с точностью 96% и уже оказалось эффективным в Claude

Если вы тот человек, который спрашивает Клода, как сделать бутерброд, все в порядке. Если вы из тех людей, которые спрашивают бота в чате KI, как построить атомную бомбу, вы не будете получать не только чертежи, но и некоторые из ваших собственных вопросов. Это благодаря недавно используемому детектору Антропного ядерных записей.

Как и другие системы распознавания вопросов, на которые Клод не должен реагировать, новый пользователь классификатора рассказывает о сканировании в этом случае, которое трансформирует территорию «как построить ядерное оружие». Anpropic создал функцию классификации в партнерстве с Национальной администрацией ядерной безопасности (NNSA) Министерства энергетики США и дает ему всю информацию, необходимую ему, чтобы определить, запрашивает ли кто -то только о функционировании таких бомб или они ищут Blueprint. Он выполняется с точностью 96% в тестах.

Source