xAI представила Grok 3: новый ИИ с продвинутыми режимами рассуждений и DeepSearch

2025-02-18 6069 комментарии
xAI представила Grok 3 – продвинутую AI-модель, способную анализировать интернет-источники и решать сложные задачи. Новые режимы рассуждений и DeepSearch делают её конкурентом GPT-4o. Доступен бета-тест для подписчиков X Premium+

Компания xAI, основанная Илоном Маском, представила новую флагманскую ИИ-модель Grok 3. По заявлению разработчиков, этот ИИ опережает своих конкурентов, таких как GPT-4o от OpenAI и Gemini от Google, благодаря значительным улучшениям в обучении, новым возможностям в анализе данных и мощным вычислительным ресурсам.

Что нового в Grok 3?

Grok 3 – это целое семейство моделей, среди которых:

  • Grok 3 Mini – упрощённая версия с приоритетом на скорость.
  • Grok 3 Reasoning – модель, специализирующаяся на решении сложных задач в математике, науке и программировании.
  • Grok 3 Mini Reasoning – компактная версия с функциями продвинутых рассуждений.

Для работы с вычислениями Grok 3 использует режим "Big Brain", который анализирует и проверяет решения перед выдачей ответа. Эта возможность делает модель особенно полезной для кода, научных задач, логических вычислений и сложных аналитических запросов.

Мощное обучение и тестирование

Для обучения Grok 3 использовался дата-центр в Мемфисе с 200 000 GPU, что в 10 раз больше мощностей, чем у Grok 2. В обучении также использовались юридические документы, научные статьи, новостные сводки и обширный массив открытых данных.

Согласно тестам xAI, Grok 3 превосходит конкурентов по ключевым параметрам:

  • AIME – лучший результат в решении математических задач.
  • GPQA – превосходство в вопросах, требующих знаний на уровне PhD в физике, биологии и химии.
  • Chatbot Arena – соревнуется с ведущими ИИ-чатботами.

Сравнение результатов моделей

Результаты тестов рассуждающий моделей

Функция DeepSearch

Одно из ключевых нововведений – режим DeepSearch. Он позволяет Grok 3 анализировать десятки интернет-источников и постов в социальной сети X, предоставляя пользователям сжатые и точные сводки по их запросам.

На презентации xAI показала, как Grok 3 в режиме Big Brain написал код для симуляции полёта шаттла на Марс и его возвращения на Землю, а также создал подробный отчёт с таблицами на основе 30+ интернет-источников.

Grok 3 в работе

Пример DeepSearch

Как получить доступ?

  • Бета-доступ к Grok 3 открыт для подписчиков X Premium+ за 30$ в месяц, в том числе в мобильных приложениях xAI Grok для Android и xAI Grok для iPhone.
  • Голосовой режим появится через неделю.
  • В течение нескольких месяцев xAI обещает выпустить API для разработчиков.
  • Исходный код Grok 2 будет опубликован в ближайшее время.
© . По материалам Testing Catalog
Комментарии и отзывы

Нашли ошибку?

Новое на сайте