Компания Brave открыла исходный код нового инструмента под названием Cookiecrumbler, который использует большие языковые модели (LLM) для выявления уведомлений о согласии на использование cookies, а также обзоры сообщества для их проверки и блокировки там, где это не нарушает работу сайта.
Браузер Brave по умолчанию блокирует баннеры согласия на использование куки на всех сайтах с 2022 года, однако выяснилось, что такое блокирование иногда вызывает серьезные проблемы — сайт становится неудобным или вообще неработоспособным.
Brave поясняет:
Слишком широкая или неправильная блокировка может нарушить критически важные функции сайта — от оформления заказов до некорректного отображения страниц.
Мы сталкивались с множеством проблем (сломанная прокрутка, пустые страницы) при бездумной блокировке уведомлений о cookies.
Cookiecrumbler использует ИИ для поиска сайтов, использующих платформы управления согласием (Сonsent Management Platforms, CMP), и регистрирует такие случаи в своем проекте на GitHub. Предложения Cookiecrumbler затем проходят ручную проверку, чтобы избежать поломки функциональности сайтов.
Работа инструмента устроена следующим образом:
- Обходит популярные сайты с помощью прокси-серверов для разных регионов.
- Загружает страницы с помощью Puppeteer для поиска потенциальных баннеров cookies.
- Передает найденное LLM для классификации и предложений по исправлению.
- Публикует результаты обнаружения в виде задач на GitHub для дальнейшей проверки и улучшений сообществом.
Таким образом, Cookiecrumbler позволяет масштабно и с учетом региональных особенностей обнаруживать и блокировать баннеры cookies, снижая количество ошибок и проблем с работой сайтов.
Так как Brave ориентирован на защиту конфиденциальности, в анонсе подчеркивается, что Cookiecrumbler не раскрывает никаких чувствительных данных:
- Во-первых, Cookiecrumbler работает полностью на стороне серверов Brave, а не в браузере пользователя, поэтому пользовательские данные не участвуют в процессе обнаружения и анализа.
- Во-вторых, инструмент не взаимодействует с реальными пользовательскими сессиями: вместо этого он использует прокси и автоматизированные краулеры, которые имитируют просмотр сайтов из разных регионов, используя публичные списки сайтов, такие как Tranco.
Забота о приватности — главная причина, по которой Cookiecrumbler пока не интегрирован в браузер Brave, а используется только как внутренний инструмент для анализа.
Компания Brave Software отмечает, что Cookiecrumbler будет встроен в браузер только после полной проверки на соответствие строгим требованиям к приватности пользователей.
Поскольку Cookiecrumbler — это открытый и бесплатный проект, доступный на GitHub, им могут пользоваться и другие разработчики инструментов защиты конфиденциальности, аудиторы сайтов, составители списков для блокировщиков рекламы или просто технически подкованные пользователи, которые хотят создавать или улучшать собственные фильтры.
Обновления программ, что нового
• Яндекс.Браузер начал переводить видео, сохраняя оригинальные голоса и эмоции
• Brave открывает исходный код Cookiecrumbler — нового инструмента для борьбы c куки-баннерами на базе ИИ
• Обновление qBittorrent 5.1.0: новые функции, улучшения WebUI и исправления ошибок
• Обновление Intel ARC Game On Driver 32.0.101.6739 Non-WHQL. Исправления для PyTorch 2.7
• Какие устройства OnePlus получат OxygenOS 16 на базе Android 16
• OpenAI представила бесплатную версию функции «Глубокое исследование» для ChatGPT на базе модели o4-mini