DeepSeek представила улучшенную ИИ-модель DeepSeek-V3. Она превосходит Claude и GPT-4.5 в ряде задач

2025-03-25 1744 комментарии
Китайская компания DeepSeek выпустила масштабное обновление модели DeepSeek V3 (DeepSeek-V3-0324), продемонстрировав рекордные результаты в математике и программировании

Китайский стартап DeepSeek представил масштабное обновление своей популярной модели DeepSeek V3. Новая версия, получившая название DeepSeek-V3-0324, доступна на платформе Hugging Face и уже показала выдающиеся результаты в тестах на математику и программирование. По ряду метрик она превосходит последние версии моделей Claude и GPT от OpenAI.

Чем примечательна новая DeepSeek V3-0324

DeepSeek V3-0324 значительно улучшила показатели по сравнению с предыдущей версией, особенно в таких задачах, как логическое рассуждение и написание кода. Согласно результатам бенчмарков, опубликованным на Hugging Face, модель добилась существенного прироста в нескольких ключевых тестах:

  • MMLU-Pro: рост с 75,9 до 81,2 (+5,3)
  • GPQA: улучшение с 59,1 до 68,4 (+9,3)
  • AIME: значительный скачок с 39,6 до 59,4 (+19,8), установив новый рекорд
  • LiveCodeBench: рост с 39,2 до 49,2 (+10,0)

Обновлённая модель DeepSeek обошла показатели Claude 3.5 (последняя версия не была представлена в сравнении), хотя, по заявлениям разработчиков, она превосходит также и более новую Claude 3.7.

Что ещё улучшилось в модели?

Разработчики подчёркивают заметный прогресс в веб-разработке:

  • Код стал чище и лучше исполняется без ошибок.
  • Генерируемые веб-страницы и игровые интерфейсы теперь выглядят более эстетично.

Также значительно улучшилась работа функции Function Calling, то есть вызова кастомных инструментов. DeepSeek-V3-0324 отлично справляется с чтением и обработкой данных из файлов, а также результатами веб-поиска. Это делает модель перспективной для использования в агентских системах и интеграции с такими инструментами, как Cursor.

Ещё один интересный момент — модель успешно запускается локально на мощных компьютерах, таких как Mac Studio, показывая скорость примерно 20 токенов в секунду. Это не так быстро по меркам серверных решений, но для локального запуска модели такого масштаба результат впечатляющий.

Усиливающаяся конкуренция с OpenAI и Anthropic

Выпуск новой модели стал очередным шагом DeepSeek в борьбе за глобальный рынок искусственного интеллекта. Компания быстро завоевала популярность, предлагая мощные решения с низкими операционными затратами по сравнению с западными аналогами. На фоне обновлений DeepSeek конкуренция на рынке генеративных моделей заметно обострилась, особенно между китайскими стартапами и американскими гигантами вроде OpenAI и Anthropic.

Таким образом, новая версия DeepSeek V3-0324 показывает, что китайские компании продолжают активно наступать на лидирующие позиции западных разработчиков ИИ, предлагая мощные и доступные инструменты для разработчиков и бизнеса.

© .
Комментарии и отзывы

Нашли ошибку?

Новое на сайте