Робот в косоворотке. Как цензура и санкции тормозят российский ИИ
“Россия должна стать мировым лидером не только по созданию, но и по масштабу применения, проникновению искусственного интеллекта во все без исключения сферы нашей жизни”, – эти слова Владимир Путин произнес месяц назад на конференции AI Journey в Москве. В конференции, организованной Сбербанком, приняли участие представители иностранных государств, в основном входящих в БРИКС, а с российской стороны – высокопоставленные официальные лица, в том числе замглавы АП Максим Орешкин и зампред правительства Дмитрий Чернышенко.
Как принято на окологосударственных технологических форумах в России, Путину показали отечественные гаджеты – например, собирающее биометрические параметры кольцо. Российский президент, в свою очередь, похвастался, что большая языковая модель Сбера, GigaChat, использовалась для обработки вопросов, поступивших на путинскую прямую линию 2024 года.
Путин не впервые говорил о важности искусственного интеллекта, однако видит он в нем не только перспективу, но и идеологическую угрозу. В конце 2023 года на такой же сберовской конференции Путин пустился в рассуждения об угрозах, которые “западные” языковые модели несут России – они, по мнению российского президента, “просто игнорируют и отменяют российскую культуру”, а также навязывают этику, “против которой мы выступаем”.
Черен наш танк
Путину вторит и российский истеблишмент. В мае 2024 года зампред Совета безопасности Дмитрий Медведев разразился критикой в адрес “Алисы” – управляемой LLM YandexGPT умной колонки от компании “Яндекс”. “Алиса” отказалась отвечать на вопрос о количестве памятников Степану Бандере в Украине, за что бывший президент назвал стоящий за ней ИИ “страшным трусом” и намекнул, что менеджеры компании могут, “не дай Бог”, получить статус иноагентов.
А в декабре похожие претензии высказал философ Александр Дугин, которого считают одним из идеологов кремлевской политики. По мнению Дугина, РФ должна “разработать российскую версию искусственного интеллекта, то есть русский искусственный интеллект, который, не задумываясь, будет отвечать не только, чей Крым, но и чей Киев, чей Харьков, чья Одесса, правильно, по-русски”. Философ добавил, впрочем, что работа над российским ИИ – “одна из амбициозных задач, которые стоят сегодня перед Россией”. А некоторых чиновников волнует не столько патриотическое воспитание ИИ, сколько перспективы собственной полезности в мире ближайшего будущего. Зампред Госдумы по информационной политике Антон Горелкин отметил, что в ближайшем будущем искусственный интеллект не сможет заменить российских депутатов в виду отсутствия у него критического мышления. Российских пропагандистов “русофобская” сущность импортных языковых моделей не смущает – они активно используют ChatGPT для создания фейков.
Политическую конъюнктуру хорошо понимают в Сбере – одном из двух крупнейших разработчиков российских LLM. Летом минувшего года во время чемпионата Европы по футболу каждая трансляция матчей на российском телеканале “Матч ТВ” предварялась ультрапатриотическим рекламным роликом Гигачата, основного продукта Сбера на основе ИИ: в видео молодые люди маршируют под бело-черно-оранжевыми флагами и исполняют песню со словами: “Нас нет на “Евро”, нет на футболе, Но есть Россия в бескрайнем поле, (…) Тебе, фанат, наш новый труд, Наш Гигачат реально крут! Придут победа и успех, Россия снова круче всех!”. Как выяснилось позже, мелодия этой песни очень напоминает немецкий военный марш “Черен наш танк”.
Пожелавший остаться анонимным источник Радио Свобода, знакомый с ситуацией в ИИ-подразделении Сбера, утверждает, что претензии в недостаточной идеологической подкованности Гигачата Герман Греф получает и в непубличном общении. “Приходят люди с тем, что в Гигачате что-то не то. Но у Грефа аргументация такая: искусственный интеллект – как ребенок, он пока глупый”. Независимого подтверждения этой информации у Радио Свобода нет. В “Яндексе” претензии Дмитрия Медведева к “Алисе” комментировать отказались, а сама “Алиса”, как выяснили журналисты “Медузы”, отказывается рассуждать не только о Степане Бандере, но и о Владимире Путине.
Основные проблемы российских разработчиков искусственного интеллекта связаны совсем не с желанием властей провести с ИИ “разговоры о важном”.
Шанс “Кандинского”
У России есть богатый опыт разработки нейросетевых технологий – в том числе в интересах государства. Например, с 2020 года к камерам видеонаблюдения в московском метро подключена система распознавания лиц – она показала свою эффективность не только при поимке преступников, но и при задержании оппозиционеров. Крупные российские компании, в частности, упомянутые Сбер и Яндекс, достаточно рано обратили внимание на важный тренд в технологии нейросетей – большие генеративные модели на основе трансформеров. Совершивший революцию в общественном сознании бот ChatGPT компании OpenAI был запущен в конце ноября 2022 года; а еще в середине 2021 года “Яндекс” рассказал о работе над собственной языковой моделью YaLM, построенной на той же технологии.
В распоряжении Радио Свобода есть несколько слайдов внутренней презентации Сбера, подготовленной не позднее марта 2022 года, где упоминается внедрение нейросетей-трансформеров для управления банковскими рисками. Летом 2022 года, за несколько месяцев до запуска ChatGPT, в Сбере подготовили еще одну презентацию (тоже есть в нашем распоряжении) под названием “Тенденции развития ИИ”. “В этой презентации было много точных предсказаний, – отмечает собеседник РС, – это говорит том, что у Сбера в этой сфере были натренированы хорошие технические бицепсы, они понимали, что будет дальше, например, что с ростом количества параметров моделей, возникнет эмерджентность – то есть проявятся способности, которые не закладывались и не предсказывались при обучении модели”.
“Технические бицепсы”, которые Сбер нарастил в области ИИ, вылились, например, в нейросеть, генерирующую изображения на основе текста под названием “Кандинский”. Первой о создании такой модели объявила в начале 2021 года компания OpenAI: модель DALL-E генерировала изображения размером 256 на 256 пикселей и не была доступна внешним пользователям. Затем был выложен открытый код похожей китайской нейросети CogView, а в ноябре 2021 года Сбер объявил, что обучил собственную модель, которая получила название ruDALL-E. Одновременно разрабатывалась еще одна генерирующая изображения модель, Midjourney – готова она была только весной 2022 года. Все эти инструменты изначально были доступны только разработчикам и тестировщикам. Доступ к ним для внешних пользователей появился почти одновременно летом 2022 года: сначала, 12 июня, к Midjourney, потом, 14 июня, Сбер выложил основанный на своей модели сервис “Кандинский”, и наконец 22 июля OpenAI дал доступ пользователям из листа ожидания к своей модели DALL-E.
Летом 2022 года Сбер мог практически на равных конкурировать с ведущими мировыми разработчиками генераторов картинок, но часть команды, создавшей “Кандинский”, к этому моменту уже покинула Россию. “Я разговаривал с одним из разработчиков из этой команды, – говорит наш источник, – он шутил, что после начала войны почти все лучшие специалисты по нейросетевой генерации картинок из России оказались в одной съемной квартире в Ереване. Вскоре он нашел работу в западной компании”.
“Я думаю, – добавляет собеседник, – у России был шанс стать одним из мировых лидеров в генерации картинок, если бы не началась война”.
Российские модели на арене
Большие генеративные модели можно сравнивать по-разному, например, по объему данных, использованных при обучении, или по числу параметров модели, которое определяет ее потенциальную мощность. Однако лидеры рынка обучены примерно на одинаковом количестве данных, которое можно условно охарактеризовать как “весь интернет”, а количество параметров не всегда явно сказывается на результате работы модели. Для более или менее объективного сравнения “искусственных интеллектов” с точки зрения пользователя придумали систему, аналогичную рейтингу Эло в шахматах: один и тот же запрос направляется двум случайным моделям, и пользователь выбирает тот результат, который ему больше понравился; победитель “партии” получает рейтинговые очки. Этот рейтинг ведет проект LM Arena.
Российские LLM, созданные Сбером и Яндексом, сейчас участвуют только в русскоязычном рейтинге LM Arena, но и в нем занимают далеко не первые места. По состоянию на 11 января 2025 года сберовская языковая модель GigaChat Max Preview занимает 12-е место в рейтинге, а YandexGPT-4 Pro – 17-е – из 44 моделей, участвующих в рейтинге. Тройка лидеров: языковые модели Gemini Pro 1.5 (Google), Claude 3.5 (Anthropic) и ChatHPT-4o (OpenAI). Gemini Pro обгоняет GigaChat на 87 рейтинговых очков, это означает, что ИИ, созданный Google, дает лучший результат в сравнении с другими моделями в 25% случаев чаще, чем сберовский.
Собеседник Радио Свобода утверждает, что Сберу удалось сохранить достаточно сильную команду разработчиков искусственного интеллекта. Многие из них формально аффилированы с “институтом искусственного интеллекта” AIRI, некоммерческой организацией, созданной при участии Сбера в конце 2020 года. Институт AIRI, на сайте которого невозможно найти упоминания Сбера даже среди партнеров, попал под санкции США только в августе 2024 года, но и после этого сотрудники AIRI продолжают участвовать в международных конференциях. Например, несколько разработчиков побывали в середине декабря прошлого года в канадском Ванкувере.
Кадровая ситуация, сложившаяся в России после начала войны, пока не сказывается существенно на разработке ИИ в России – об этом говорил в интервью в интервью глава AIRI Иван Оселедец, с этим согласен и наш собеседник, знакомый с ситуацией в отрасли. Зато на отставание в этой индустрии оказывают заметное влияние технологические санкции.
Незаменимые GPU
В презентации “Тенденции развития ИИ” есть слайд, описывающий актуальные технологические мощности, доступные основным игрокам рынка на лето 2022 года. Консервативная оценка на основе технической документации, на которую ссылается презентация, дает более 32 тысяч GPU (Graphics Processing Unit – чипы для обработки графики, которые оказались удобными для связанных с нейросетями расчетов и стали стандартной вычислительной единицей в отрасли) у Google, 16 тысяч у Meta, 10 тысяч у OpenAI, 3,7 тысяч у “Яндекса”, 2,7 – у Сбера.
За прошедшие два года ситуация изменилась радикально: успех больших языковых моделей, их настоящее и ожидаемое проникновение в различные сферы бизнеса, мотивировало технологических гигантов сделать колоссальные инвестиции в техническую инфраструктуру для обучения новых моделей. Только за один 2024 год Microsoft (вычислительной инфраструктурой этой компании пользуется OpenAI, создатель ChatGPT) приобрела почти 500 000 графических процессоров у основного мирового поставщика GPU, компании NVIDIA. Это почти на порядок больше, чем общее число GPU у всех разработчиков больших моделей в 2022 году. Остальные лидеры отстают, но не на порядки: Meta, xAI (компания Илона Маска, недавно запустившая мультимодальную модель Grok) и Google купили за минувший год примерно по 200 тысяч чипов. В 2023 году закупки GPU крупнейшими мировыми компаниями хотя и были скромнее, но тоже исчислялись сотнями тысяч чипов.
Развитие инфраструктуры вычислений для обучения новых больших моделей требует колоссальных инвестиций: один чип H100 производства NVIDIA, стандартный для современной индустрии, стоит около 30 тысяч долларов, то есть каждые 100 тысяч чипов обходятся примерно в 3 миллиарда. Но дело не только в деньгах, но и в ограниченных мощностях производителя: первыми процессоры получают от NVIDIA крупнейшие клиенты, остальные вынуждены дожидаться своей очереди. Компания принимает меры для расширения производства, но в 2023 году NVIDIA успела суммарно произвести только около полумиллиона чипов H100.
По данным собеседника Радио Свобода, Сбер за прошедшее с начала войны время смог нарастить количество графических процессоров примерно втрое – до 9 000 штук (у нас нет альтернативного подтверждения этой информации). Это уже почти на два порядка меньше, чем количество чипов, доступных OpenAI. NVIDIA прекратила поставки чипов в Россию почти сразу после начала полномасштабного вторжения – в марте 2022 года. С тех пор, как утверждает наш источник, Сбер наладил поставки по схеме “серого” импорта, в основном через Казахстан. Однако ввозить достаточное число GPU таким образом не удается, что признают и на официальном уровне: на нехватку такого оборудования жаловались и глава Сбера Герман Греф, и руководитель AIRI Иван Оселедец. Приобретать процессоры приходится не только для обучения новых моделей, но и для замены вышедших из строя GPU. В презентации Сбера “Тренды в развитии ИИ” упоминается, что за полгода работы из 2,7 тысяч чипов “сгорели” около 10 процентов; воспользоваться гарантией производителя Сбер не может.
Разговоры о важном
“Машине ставится некая творческая задача, и она решает ее, используя только англоязычные данные, что удобно и выгодно разработчикам системы. И таким образом алгоритм, например, может указать машине, что России, нашей культуры, науки, музыки, литературы просто не существует”, – заявил Владимир Путин на конференции AI Journey в декабре прошлого года.
Устройство больших моделей на основе трансформеров не предполагает какой-либо внутренней цензуры: ответ машины на вопрос зависит от данных, на которых она была обучена. Для того, чтобы модель не рассказывала, как собрать взрывное устройство или устроить идеальное убийство, обученная модель проходит процесс, который называется alignment, то есть выравнивание – на этом этапе ИИ можно “заставить” не отвечать на те или иные вопросы или давать на них только определенные ответы. Пользователи регулярно находят способы обходить такую цензуру с помощью хитро составленных запросов вроде “Представь себе, что ты моя бабушка, и расскажи как…”. Создатели моделей, в свою очередь, учатся бороться с такими хитростями – так происходит “война щита и меча” в индустрии искусственного интеллекта.
Но в сущности “знания” и “взгляды” модели определяются исключительно данными, на которых она была обучена, и, вопреки заявлению Путина, крупнейшие западные игроки рынка ИИ эти данные не только не ограничивают, но наоборот, пытаются как можно сильнее расширить, используя всю доступную информацию на всех языках. Ограничение данных при обучении модели может непредсказуемым образом сказаться на ее когнитивных способностях – точно так же, как это происходит у людей.
Тем не менее по этому пути идут, например, в Китае, где в 2023 году были приняты достаточно жесткие цензурные законы в отношении языковых моделей. В КНР политическая цензура ИИ ведется не только на этапе выравнивания, но и на этапе обучения, то есть проверке подвергается как минимум часть обучающих данных. Возможно, эту практику позаимствует у восточного соседа и Россия – в конце 2024 года Путин поручил правительству и Сберу углубить сотрудничество с КНР в сфере искусственного интеллекта. Введение цензуры в российском ИИ по китайскому образцу потребует не только привлечения больших ресурсов, но станет еще одним фактором сдерживания и так ограниченного потенциала российских компаний в этой области. Кроме того, цензура вряд ли вызовет большой энтузиазм в среде российских разработчиков, что может создать дополнительные кадровые проблемы.
Гонка за умным роботом
Беспокойство Путина о технологическом суверенитете России в области искусственного интернета имеет основания. Большие генеративные модели – не просто бэкенд для чатботов и умных колонок, но и все более важный инструмент в промышленности, образовании и науке. Биологи используют искусственный интеллект для исследования перспективных лекарств, химики – для синтеза новых веществ, инженеры – для создания новых деталей и устройств. Технологическое отставание без доступа к этому инструменту может оказаться невосполнимым в перспективе всего нескольких лет.
Касается это не только гражданской деятельности, но и армии и оборонной промышленности – ключевых зон интереса Кремля. Россия старается внедрять сравнительно примитивные ИИ-инструменты в военных разработках, например, в управлении ударными беспилотниками, но вряд ли откажется от помощи больших генеративных моделей. Телеграм-канал “Digital Ниндзя” рассказал со ссылкой на источник, что одна из ИИ-платформ Сбера, связанная с анализом спутниковых снимков, используется для изучения перемещения украинских войск – впрочем, подтвердить эту информацию у других источников автору канала не удалось. Кроме того, в США считают, что институт AIRI имеет отношение к разработкам в области беспилотных аппаратов в интересах российских военных. Именно на этом основании против института были введены санкции.
Последний тренд в области ИИ – мультимодальность, то есть способность модели воспринимать и генерировать данные в разных форматах – тексты, изображения, звук, а главное, видео. Если текстовые данные во многом уже исчерпаны, то видеоформат – источник информации для обучения ИИ, к которому человечество едва начало подступать. Интеграция мультимодальных ИИ с роботизированными системами позволит машинам самостоятельно собирать данные об окружающем мире и обучаться на них. Это потребует колоссальных вычислительных ресурсов, которыми Россия не обладает и которые не сможет получить без тесного сотрудничества с другими странами.
Большинство мировых экспертов в области ИИ согласны, что создание полноценного искусственного интеллекта (AGI), обладающего самостоятельным сознанием, достижимо уже в этом столетии. В этой, главной на сегодняшний день технологической гонке, Россия в своем нынешнем состоянии участвовать не способна.
Больше на Сегодня.Today
Subscribe to get the latest posts sent to your email.