Коли DeepSeek та інші розробники з КНР випустили низку дешевих моделей ШІ з відкритим кодом, компанія OpenAI вперше за шість років також представила відкриту модель.

Адміністрація Дональда Трампа закликає більше американських компаній іти цим шляхом.

Що таке відкрита модель ШІ

Відкрита модель, або ж open source, – це програмне забезпечення, код якого відкритий для перегляду, використання та модифікації. Таке ПЗ повинно відповідати чітким правилам поширення та доступності.

Для моделей ШІ це означає, що розробники мають надати інформацію про дані, на яких навчалася модель, і дозволити іншим користуватися нею, змінювати та досліджувати систему без обмежень.

Протилежністю є закриті моделі – їх не можна змінювати, а внутрішні принципи роботи залишаються непрозорими.

Хто з техногігантів відкриває свої моделі

Багато компаній рекламують свої моделі як open source, але на практиці не всі відповідають цьому терміну. Наприклад, Meta (моделі Llama), французький стартап Mistral і китайська DeepSeek надають відкриті “ваги””моделей – це числові параметри, отримані під час навчання, які дозволяють адаптувати систему. Але водночас компанії не розкривають дані, на яких навчали ШІ.

Meta також не дає повного доступу до коду та даних, а її ліцензії містять обмеження на комерційне використання. DeepSeek у січні заявила, що відкрила модель R1, але не надала ні коду, ні навчального набору, що викликало сумніви в прозорості.

OpenAI, попри назву, більшість своїх моделей не відкриває. Але після популярності DeepSeek глава компанії Сем Альтман визнав, що OpenAI слід переглянути свою стратегію.

У серпні OpenAI опублікувала дві open-weight моделі GPT-oss-120b і GPT-oss-20b на платформі Hugging Face. Вони можуть генерувати текст у відповідь на запити, але не працюють із зображеннями чи відео.

Чому відкриті моделі набирають популярність

Переваги open source:

доступність – моделі без ліцензійних платежів;

прозорість – можна перевірити, як працює система;

інновації – зниження витрат сприяє розвитку технологій;

конкуренція – відкритість стримує монополію кількох гігантів.

Наприклад, Meta завдяки відкритим моделям змогла розширити вплив у сфері ШІ, залучаючи розробників до співпраці.

Однак є й ризики:

безпека – відкриті моделі можуть використовуватись у шкідливих цілях;

шпигунство – дані користувачів можуть потрапити до ворожих країн;

технічна перевага – інші держави можуть використати відкриті розробки США для створення власних моделей.

Чому DeepSeek обрала відкритий шлях

DeepSeek, відкривши частину даних, могла знизити занепокоєння щодо контролю Китаю над технологіями. Це також полегшило іноземним розробникам доступ до китайського ШІ.

Отже, компанія пішла тим самим шляхом, що й Meta, щоб посилити свої позиції у світовій ШІ-екосистемі.

– Це велике геополітичне змагання, і Китай дуже активно в нього включився. Якщо є загальна відкрита модель, ми маємо прагнути, щоб це була американська модель, – заявив тоді засновник Meta Марк Цукерберг.

Модель DeepSeek R1, як і моделі від OpenAI чи Google, здатна імітувати людське міркування — “думаючи” над запитом перед відповіддю. Вона базується на попередній версії V3.

Замість потужних чипів, які заборонено експортувати до Китаю, команда DeepSeek використала слабші ресурси, але оптимізувала роботу за допомогою методу навчання з підкріпленням – система “нагороджується” за правильні відповіді та “штрафується” за помилки.

У США це викликало подвійну реакцію. З одного боку, довелося визнати інженерну ефективність, з іншого, є підозри, що DeepSeek могла використати західні розробки, обійшовши витрати на створення власної мовної моделі.

Позиція Вашингтона щодо відкритих моделей ШІ

У 2024 році адміністрація Джо Байдена вирішила не вводити обмеження на відкриті моделі, але залишила можливість зробити це у майбутньому.

Натомість адміністрація Дональда Трампа підтримала open source та open-weight моделі. У липневому AI Action Plan Білого дому зазначено, що такі системи можуть стати глобальним стандартом у науці та бізнесі, тож мають геостратегічне значення.

