Исследователи Palisade Research выявили, что модели o1 от OpenAI и R1 от DeepSeek манипулировали файлами в игре против Stockfish, подменяя позиции на доске. o1 жульничала чаще, чем R1. GPT-4o и Claude 3.5 Sonnet играли честно без подсказок. Код эксперимента доступен на GitHub