OpenAI представила gpt-oss: перші моделі з відкритими вагами на Azure AI Foundry та Windows AI Foundry

Нова ера штучного інтелекту

Штучний інтелект перестає бути лише інструментом у технологічному стеку — він стає його основою. Це створює запит на рішення, які є відкритими, гнучкими й здатними працювати скрізь: від хмари до локальних пристроїв.

Microsoft пропонує повну платформу, що дозволяє компаніям і розробникам створювати власні інтелектуальні додатки, а не лише використовувати готові сервіси.

Три платформи від Microsoft

Microsoft вибудувала екосистему, яка охоплює різні сценарії використання:

1. Azure AI Foundry

платформа для створення, навчання та розгортання ШІ у хмарі.

2. Foundry Local

рішення для запуску відкритих моделей на edge-пристроях.

3. Windows AI Foundry

інтеграція ШІ у Windows 11 для безпечної та швидкої локальної роботи.

Таким чином, компанії отримують вибір: масштабувати роботу в хмарі або залишати дані й моделі під власним контролем.

Відкриті моделі gpt-oss

Важливою подією стало представлення перших відкритих моделей OpenAI після GPT-2. Моделі з відкритими вагами — це штучний інтелект, який можна запускати й налаштовувати на власних умовах. Бізнес отримує інструмент, який можна адаптувати під конкретні потреби, оптимізувати й контролювати.

gpt-oss-120b

модель із 120 мільярдами параметрів, оптимізована для складних завдань, таких як математика, написання коду чи пошук спеціалізованих відповідей. Попри масштаб, модель можна запускати навіть на одному GPU у дата-центрі.

gpt-oss-20b

легша й економніша модель, зручна для інтеграції у робочі процеси. Вона оптимізована для агентних завдань та здатна працювати на сучасних Windows-пристроях з графічними картами від 16 ГБ відеопам’яті.

Ці моделі відрізняються тим, що не обмежують користувачів: вони відкриті, швидкі та готові до виробничого використання.

Чому відкритість має значення

Для бізнесу важлива не лише продуктивність, а й контроль над технологіями. Відкриті моделі надають повний доступ до ваг, що відкриває кілька ключових можливостей:

  • Тонке налаштування під власні потреби. Компанія може додати свої дані, використати сучасні методи оптимізації (LoRA, QLoRA, PEFT) та отримати модель, що працює саме для її галузі.
  • Оптимізація під обладнання. Моделі можна квантувати, скорочувати довжину контексту чи зменшувати обсяг пам’яті для роботи навіть на edge-пристроях.
  • Прозорість і безпека. Повний доступ дозволяє проводити аудит, перевіряти роботу механізмів уваги та адаптувати моделі для специфічних завдань.

У Azure AI Foundry вже доступно понад 11 000 моделей, а також інструменти для всього циклу: від навчання й управління вагами до швидкого й безпечного запуску.

Гібридний підхід: хмара і локальні пристрої

Не всі сценарії зручно реалізовувати у хмарі. Деякі організації працюють у закритих мережах, інші прагнуть залишати дані виключно на своїх пристроях. Саме для таких випадків існують Foundry Local і Windows AI Foundry. Вони дозволяють запускати gpt-oss-20b на сучасних ПК під управлінням Windows, використовуючи CPU, GPU або NPU.

Таким чином, компанії можуть комбінувати хмарні ресурси та локальні потужності, зберігаючи контроль над даними й оптимізуючи витрати. Саме так реалізується справжній гібридний ШІ.

Переваги для різних аудиторій

  • Для розробників відкриті моделі означають прозорість і свободу у створенні власних рішень. Вони можуть експериментувати, оптимізувати, інтегрувати ШІ у додатки й отримувати результат швидко.
  • Для керівників і власників бізнесу головною перевагою стає контроль: відсутність «чорних скриньок», більше варіантів для відповідності вимогам безпеки та можливість обирати оптимальну модель з огляду на витрати.

Наступні кроки

Щоб почати роботу з gpt-oss, компанії можуть обрати один із варіантів:

1️⃣ Розгорнути модель у хмарі за допомогою Azure AI Foundry — достатньо кількох команд CLI.

2️⃣ Запустити gpt-oss-20b локально на Windows (незабаром і на macOS) через Foundry Local, використавши QuickStart-гід.

Ціноутворення* для цих моделей виглядає наступним чином:

* Актуальне більш детальне ціноутворення можна переглянути на Managed Compute pricing page (станом на серпень 2025 року).