Китайский стартап DeepSeek представил масштабное обновление своей популярной модели DeepSeek V3. Новая версия, получившая название DeepSeek-V3-0324, доступна на платформе Hugging Face и уже показала выдающиеся результаты в тестах на математику и программирование. По ряду метрик она превосходит последние версии моделей Claude и GPT от OpenAI.
Чем примечательна новая DeepSeek V3-0324
DeepSeek V3-0324 значительно улучшила показатели по сравнению с предыдущей версией, особенно в таких задачах, как логическое рассуждение и написание кода. Согласно результатам бенчмарков, опубликованным на Hugging Face, модель добилась существенного прироста в нескольких ключевых тестах:
- MMLU-Pro: рост с 75,9 до 81,2 (+5,3)
- GPQA: улучшение с 59,1 до 68,4 (+9,3)
- AIME: значительный скачок с 39,6 до 59,4 (+19,8), установив новый рекорд
- LiveCodeBench: рост с 39,2 до 49,2 (+10,0)
Обновлённая модель DeepSeek обошла показатели Claude 3.5 (последняя версия не была представлена в сравнении), хотя, по заявлениям разработчиков, она превосходит также и более новую Claude 3.7.
Что ещё улучшилось в модели?
Разработчики подчёркивают заметный прогресс в веб-разработке:
- Код стал чище и лучше исполняется без ошибок.
- Генерируемые веб-страницы и игровые интерфейсы теперь выглядят более эстетично.
Также значительно улучшилась работа функции Function Calling, то есть вызова кастомных инструментов. DeepSeek-V3-0324 отлично справляется с чтением и обработкой данных из файлов, а также результатами веб-поиска. Это делает модель перспективной для использования в агентских системах и интеграции с такими инструментами, как Cursor.
Ещё один интересный момент — модель успешно запускается локально на мощных компьютерах, таких как Mac Studio, показывая скорость примерно 20 токенов в секунду. Это не так быстро по меркам серверных решений, но для локального запуска модели такого масштаба результат впечатляющий.
Усиливающаяся конкуренция с OpenAI и Anthropic
Выпуск новой модели стал очередным шагом DeepSeek в борьбе за глобальный рынок искусственного интеллекта. Компания быстро завоевала популярность, предлагая мощные решения с низкими операционными затратами по сравнению с западными аналогами. На фоне обновлений DeepSeek конкуренция на рынке генеративных моделей заметно обострилась, особенно между китайскими стартапами и американскими гигантами вроде OpenAI и Anthropic.
Таким образом, новая версия DeepSeek V3-0324 показывает, что китайские компании продолжают активно наступать на лидирующие позиции западных разработчиков ИИ, предлагая мощные и доступные инструменты для разработчиков и бизнеса.
Обновления программ, что нового
• Яндекс выложил в открытый доступ YandexGPT 5 Lite Instruct — компактную, но мощную ИИ-модель
• Нейросеть Яндекса ускоряет уборку мусора в заповедниках с помощью аэрофотоанализа
• Apple готовит «ИИ-тренера» в обновлённом приложении «Здоровье» — запуск ожидается в 2026 году
• Сервисы «Яндекса» столкнулись с крупным сбоем из-за аварии в дата-центре
• Обновление Comss.one DNS: Доступ к T3 Chat, Guilded, MongoDB и другим популярным сервисам
• Обновление Intel Graphics Drivers (legacy) 31.0.101.2135 WHQL для процессоров Intel 7-10 поколения