Когда DeepSeek и другие разработчики из КНР выпустили ряд дешевых моделей ИИ с открытым кодом, компания OpenAI впервые за шесть лет также представила открытую модель.

Администрация Дональда Трампа призывает больше американских компаний идти по этому пути.

Что такое открытая модель ИИ

Открытая модель или open source — это программное обеспечение, код которого открыт для просмотра, использования и модификации. Такое ПО должно соответствовать четким правилам распространения и доступности.

Для моделей ИИ это означает, что разработчики должны предоставить информацию о данных, на которых обучалась модель, и позволить другим пользоваться ею, изменять и исследовать систему без ограничений.

Противоположностью являются закрытые модели – их нельзя изменять, а внутренние принципы работы остаются непрозрачными.

Кто из техногигантов открывает свои модели

Многие компании рекламируют свои модели как open source, но на практике не все соответствуют этому термину. Например, Meta (модели Llama), французский стартап Mistral и китайская DeepSeek предоставляют открытые «веса» моделей – это числовые параметры, полученные во время обучения, которые позволяют адаптировать систему. Но при этом компании не раскрывают данные, на которых обучали ИИ.

Meta также не дает полного доступа к коду и данным, а ее лицензии содержат ограничения на коммерческое использование. DeepSeek в январе заявила, что открыла модель R1, но не предоставила ни кода, ни обучающего набора, что вызвало сомнения в прозрачности.

OpenAI, несмотря на название, большинство своих моделей не открывает. Но после популярности DeepSeek глава компании Сэм Альтман признал, что OpenAI следует пересмотреть свою стратегию.

В августе OpenAI опубликовала две open-weight модели GPT-oss-120b и GPT-oss-20b на платформе Hugging Face. Они могут генерировать текст в ответ на запросы, но не работают с изображениями или видео.

Почему открытые модели набирают популярность

Преимущества open source:

доступность – модели без лицензионных платежей;

прозрачность – можно проверить, как работает система;

инновации – снижение затрат способствует развитию технологий;

конкуренция – открытость сдерживает монополию нескольких гигантов.

Например, Meta благодаря открытым моделям смогла расширить влияние в сфере ИИ, привлекая разработчиков к сотрудничеству.

Однако есть и риски:

безопасность – открытые модели могут использоваться во вредных целях;

шпионаж – данные пользователей могут попасть во враждебные страны;

техническое преимущество – другие государства могут использовать открытые разработки США для создания собственных моделей.

Почему DeepSeek выбрала открытый путь

DeepSeek, открыв часть данных, могла снизить беспокойство по поводу контроля Китая над технологиями. Это также облегчило иностранным разработчикам доступ к китайскому ИИ.

Таким образом, компания пошла тем же путем, что и Meta, чтобы усилить свои позиции в мировой ИИ-экосистеме.

– Это большое геополитическое соревнование, и Китай очень активно в него включился. Если должна существовать общая открытая модель, мы должны стремиться, чтобы это была американская модель, – заявил тогда основатель Meta Марк Цукерберг.

Модель DeepSeek R1, как и модели от OpenAI или Google, способна имитировать человеческое мышление – “думая” над запросом перед ответом. Она основана на предыдущей версии V3.

Вместо мощных чипов, которые запрещено экспортировать в Китай, команда DeepSeek использовала более слабые ресурсы, но оптимизировала работу с помощью метода обучения с подкреплением – система “награждается” за правильные ответы и “штрафуется” за ошибки.

В США это вызвало двойную реакцию. С одной стороны, пришлось признать инженерную эффективность, с другой есть подозрения, что DeepSeek могла использовать западные разработки, обойдя расходы на создание собственной языковой модели.

Позиция Вашингтона в отношении открытых моделей ИИ

В 2024 году администрация Джо Байдена решила не вводить ограничения на открытые модели, но оставила возможность сделать это в будущем.

Вместо этого администрация Дональда Трампа поддержала open source и open-weight модели. В июльском AI Action Plan Белого дома указано, что такие системы могут стать глобальным стандартом в науке и бизнесе, поэтому имеют геостратегическое значение.

