На данный момент, компания NVIDIA занимается расследованием критического бага, при котором их драйверы начинают сбоить при работе на последних версиях ядра Linux (начиная с версии 6.10 и выше). Эта проблема затрагивает драйверы версии 550, 555 и даже последний на текущий момент драйвер 560. Проблема проявляется как на закрытых драйверах NVIDIA, так и на их открытых версиях.
Проблема и контекст
Судя по данным на форуме NVIDIA и моим личным наблюдениям, эта ошибка возникла в результате регрессии, связанной с обновлением ядра Linux до версии 6.10. Ошибки возникают в ситуациях, когда активируется механизм приостановки системы (suspension) или когда какое-либо приложение начинает обрабатывать 3D-графику. Проблема заключается в появлении системных сбоев (kernel oops), что доставляет массу неудобств как разработчикам, так и пользователям.
Пример сбоя драйвера
Система неожиданно начинает зависать и давать сбои в самых неожиданных моментах, особенно при запуске игр или работе с графическими приложениями. Пример из системного журнала:
[ 29.168385] ------------[ cut here ]------------
[ 29.168385] WARNING: CPU: 13 PID: 7032 at include/linux/rwsem.h:80 follow_pte+0x1de/0x200
[ 29.168387] Modules linked in: rfcomm nvidia_drm(OE) nvidia_uvm(OE) nvidia_modeset(OE) nvidia(OE)
...
[ 29.168456] CPU: 13 PID: 7032 Comm: nv_queue Tainted: P W OE 6.10.6-arch1-1 #1 703d152c24f1971e36f16e505405e456fc9e23f8
[ 29.168457] Hardware name: ASUSTeK COMPUTER INC. ASUS TUF Dash F15 FX517ZR_FX517ZR/FX517ZR, BIOS FX517ZR.317 05/03/2023
[ 29.169159] ret_from_fork+0x31/0x50
[ 29.169164] ---[ end trace 0000000000000000 ]---
Симптомы
Проблема проявляется следующим образом:
- Видео становится дерганым и каждые 45 секунд случаются кратковременные "фризы".
- В играх происходит разрыв между изображением и игровым процессом: игра продолжается, пока экран заморожен. Особенно опасно это при игре в режиме hardcore: я уже дважды погиб в игре Core Keeper из-за заморозки в разгаре сражения.
- После 30 минут игры средняя нагрузка на систему может взлететь до трёхзначных значений, при этом инструменты мониторинга, такие как
top
,iostat
,vmstat
илиfree
, не показывают явных признаков ухудшения производительности системы. - Команда
dmesg
заполняется похожими трассировочными сообщениями стека (stack trace).
Возможное решение
На данный момент временным решением может быть использование предыдущих версий ядра. Например, переход на ветку linux-lts (долгосрочная поддержка) с версией ядра 6.6 в сочетании с драйверами NVIDIA версий 550 или 555 может помочь избежать сбоев.
Расследование NVIDIA
Компания NVIDIA уже занимается расследованием этой проблемы, и на форумах можно найти обсуждения и отчёты пользователей, столкнувшихся с аналогичными сбоями. Некоторые из обсуждаемых тем включают:
- Случайные системные сбои ядра, вызванные драйверами NVIDIA
- Многочисленные системные сбои перед приостановкой системы, вызванные nvidia-sleep.sh (регрессия ядра Linux 6.10)
Также на форумах можно найти ссылки на другие обсуждения, в которых пользователи делятся своими решениями и опытом.
Несмотря на то, что драйвер NVIDIA версии 560 был выпущен с целью решения некоторых проблем, он, к сожалению, не устраняет полностью баги, связанные с ядром Linux 6.10. Пользователи могут временно перейти на более старую версию ядра или дождаться более стабильного релиза драйверов от NVIDIA.
В любом случае, если вы столкнулись с подобными сбоями, рекомендуется следить за обновлениями на форумах NVIDIA и пробовать временные решения, такие как откат ядра или использование долгосрочных веток Linux.
Linux: обзоры и обновления
• Производительность GNOME и KDE на Wayland превосходит Xfce и LXQt на Ubuntu 25.04 в играх
• Обновление GE-Proton 9-27 для Linux и Steam Deck: исправления для Ubisoft Connect, Epic Games, Wuthering Waves и Monster Hunter Wilds
• Релиз Linux Lite 7.4: исправления ошибок и новые версии ПО
• Вышло обновление SteamOS 3.6.24 для Steam Deck с исправлениями для Avowed и No Rest for the Wicked
• В KDE исправлены основные сбои в Plasma 6.3.4, количество VHI-багов снижено до нуля
• Обновление CachyOS: Linux для игр получил поддержка видеокарт RDNA4, GeForce RTX 5070 Ti и RTX 5070