Ключевые обновления
Компания Anthropic объявила о выпуске усовершенствованной версии Claude 3.5 Sonnet и новой модели Claude 3.5 Haiku. Главным нововведением стала революционная функция computer use, позволяющая ИИ управлять компьютером подобно человеку. Это первая модель AI на рынке, предлагающая такую возможность в открытом бета-тестировании.
Возможности функции computer use
Находящаяся в открытой бета-версии функция computer use позволяет ИИ взаимодействовать с компьютерным интерфейсом: просматривать экран, перемещать курсор, нажимать кнопки и вводить текст. Несмотря на экспериментальный характер и некоторые ограничения, технология уже используется такими компаниями как Asana, Canva и DoorDash для автоматизации сложных многоэтапных задач.
В тестах на платформе OSWorld, оценивающей способность ИИ использовать компьютер подобно человеку, Claude 3.5 Sonnet достиг показателя 14.9% в категории работы со скриншотами, значительно превзойдя ближайшего конкурента с результатом 7.8%. При увеличении количества доступных шагов для выполнения задачи показатель вырос до 22.0%.
Улучшения в моделях
Обновленная версия Claude 3.5 Sonnet демонстрирует значительный прогресс в области программирования, достигнув показателя 49% в тесте SWE-bench Verified, что превосходит все публично доступные модели. При этом стоимость использования и скорость работы остались на прежнем уровне.
Компания GitLab, тестировавшая модель для задач DevSecOps, отметила улучшение качества рассуждений до 10% по различным сценариям использования без увеличения задержек. The Browser Company подтвердила, что Claude 3.5 Sonnet превзошел все ранее тестируемые ими модели в автоматизации веб-процессов.
Особенности Claude 3.5 Haiku
Claude 3.5 Haiku, самая быстрая модель компании, теперь соответствует производительности предыдущей флагманской модели Claude 3 Opus, сохраняя при этом высокую скорость работы и доступную стоимость. Особенно впечатляющие результаты модель показывает в задачах программирования, достигая 40.6% в SWE-bench Verified, что превосходит показатели многих современных моделей, включая первоначальную версию Claude 3.5 Sonnet и GPT-4o.
Благодаря низкой задержке, улучшенному следованию инструкциям и более точному использованию инструментов, Claude 3.5 Haiku особенно хорошо подходит для пользовательских продуктов, специализированных подзадач и генерации персонализированного опыта на основе больших объемов данных.
Доступность и безопасность
Обновленная версия Claude 3.5 Sonnet уже доступна всем пользователям. Функция computer use доступна черезAPI Anthropic, Amazon Bedrock и Google Cloud Vertex AI. Выпуск Claude 3.5 Haiku запланирован на конец текущего месяца, первоначально только для работы с текстом, поддержка изображений появится позже.
Для обеспечения безопасности новой функции computer use компания разработала специальные классификаторы, способные определять использование этой функции и выявлять потенциальные угрозы. Перед выпуском обновленная модель Claude 3.5 Sonnet прошла тестирование в Институтах безопасности искусственного интеллекта США и Великобритании.
Обновления программ, что нового
• Arm проиграл в суде: Qualcomm продолжит использовать технологию Oryon в своих процессорах
• Обновление Intel ARC Game On Driver 32.0.101.6253 Non-WHQL: Исправления для Intel Arc B-серии «Battlemage»
• OpenAI представила новые ИИ-модели o3 и o3-mini с возможностью «рассуждения»
• Samsung Display Assistant: Расширенное управление экраном Galaxy S24
• Обновление Intel Graphics Drivers (legacy) 31.0.101.2134 WHQL для процессоров Intel 7-10 поколения
• OpenAI анонсировала возможность позвонить ChatGPT