Нова ера штучного інтелекту
Штучний інтелект перестає бути лише інструментом у технологічному стеку — він стає його основою. Це створює запит на рішення, які є відкритими, гнучкими й здатними працювати скрізь: від хмари до локальних пристроїв.
Microsoft пропонує повну платформу, що дозволяє компаніям і розробникам створювати власні інтелектуальні додатки, а не лише використовувати готові сервіси.
Три платформи від Microsoft
Microsoft вибудувала екосистему, яка охоплює різні сценарії використання:
1. Azure AI Foundry
платформа для створення, навчання та розгортання ШІ у хмарі.
2. Foundry Local
рішення для запуску відкритих моделей на edge-пристроях.
3. Windows AI Foundry
інтеграція ШІ у Windows 11 для безпечної та швидкої локальної роботи.
Таким чином, компанії отримують вибір: масштабувати роботу в хмарі або залишати дані й моделі під власним контролем.
Відкриті моделі gpt-oss
Важливою подією стало представлення перших відкритих моделей OpenAI після GPT-2. Моделі з відкритими вагами — це штучний інтелект, який можна запускати й налаштовувати на власних умовах. Бізнес отримує інструмент, який можна адаптувати під конкретні потреби, оптимізувати й контролювати.
gpt-oss-120b
модель із 120 мільярдами параметрів, оптимізована для складних завдань, таких як математика, написання коду чи пошук спеціалізованих відповідей. Попри масштаб, модель можна запускати навіть на одному GPU у дата-центрі.
gpt-oss-20b
легша й економніша модель, зручна для інтеграції у робочі процеси. Вона оптимізована для агентних завдань та здатна працювати на сучасних Windows-пристроях з графічними картами від 16 ГБ відеопам’яті.
Ці моделі відрізняються тим, що не обмежують користувачів: вони відкриті, швидкі та готові до виробничого використання.
Чому відкритість має значення
Для бізнесу важлива не лише продуктивність, а й контроль над технологіями. Відкриті моделі надають повний доступ до ваг, що відкриває кілька ключових можливостей:
- Тонке налаштування під власні потреби. Компанія може додати свої дані, використати сучасні методи оптимізації (LoRA, QLoRA, PEFT) та отримати модель, що працює саме для її галузі.
- Оптимізація під обладнання. Моделі можна квантувати, скорочувати довжину контексту чи зменшувати обсяг пам’яті для роботи навіть на edge-пристроях.
- Прозорість і безпека. Повний доступ дозволяє проводити аудит, перевіряти роботу механізмів уваги та адаптувати моделі для специфічних завдань.
У Azure AI Foundry вже доступно понад 11 000 моделей, а також інструменти для всього циклу: від навчання й управління вагами до швидкого й безпечного запуску.
Гібридний підхід: хмара і локальні пристрої
Не всі сценарії зручно реалізовувати у хмарі. Деякі організації працюють у закритих мережах, інші прагнуть залишати дані виключно на своїх пристроях. Саме для таких випадків існують Foundry Local і Windows AI Foundry. Вони дозволяють запускати gpt-oss-20b на сучасних ПК під управлінням Windows, використовуючи CPU, GPU або NPU.
Таким чином, компанії можуть комбінувати хмарні ресурси та локальні потужності, зберігаючи контроль над даними й оптимізуючи витрати. Саме так реалізується справжній гібридний ШІ.
Переваги для різних аудиторій
- Для розробників відкриті моделі означають прозорість і свободу у створенні власних рішень. Вони можуть експериментувати, оптимізувати, інтегрувати ШІ у додатки й отримувати результат швидко.
- Для керівників і власників бізнесу головною перевагою стає контроль: відсутність «чорних скриньок», більше варіантів для відповідності вимогам безпеки та можливість обирати оптимальну модель з огляду на витрати.
Наступні кроки
Щоб почати роботу з gpt-oss, компанії можуть обрати один із варіантів:
1️⃣ Розгорнути модель у хмарі за допомогою Azure AI Foundry — достатньо кількох команд CLI.
2️⃣ Запустити gpt-oss-20b локально на Windows (незабаром і на macOS) через Foundry Local, використавши QuickStart-гід.
Ціноутворення* для цих моделей виглядає наступним чином:
* Актуальне більш детальне ціноутворення можна переглянути на Managed Compute pricing page (станом на серпень 2025 року).