Новая эра искусственного интеллекта
Искусственный интеллект перестает быть лишь инструментом в технологическом стеке — он становится его основой. Это создает спрос на решения, которые являются открытыми, гибкими и способными работать везде: от облака до локальных устройств.
Microsoft предлагает полную платформу, позволяющую компаниям и разработчикам создавать собственные интеллектуальные приложения, а не только использовать готовые сервисы.
Три платформы от Microsoft
Microsoft построила экосистему, которая охватывает различные сценарии использования:
1. Azure AI Foundry
платформа для создания, обучения и развертывания ИИ в облаке.
2. Foundry Local
решение для запуска открытых моделей на edge-устройствах.
3. Windows AI Foundry
интеграция ИИ в Windows 11 для безопасной и быстрой локальной работы.
Таким образом, компании получают выбор: масштабировать работу в облаке или оставлять данные и модели под собственным контролем.
Открытые модели gpt-oss
Важным событием стало представление первых открытых моделей OpenAI после GPT-2. Модели с открытыми весами — это искусственный интеллект, который можно запускать и настраивать на собственных условиях. Бизнес получает инструмент, который можно адаптировать под конкретные потребности, оптимизировать и контролировать.
gpt-oss-120b
модель с 120 миллиардами параметров, оптимизированная для сложных задач, таких как математика, написание кода или поиск специализированных ответов. Несмотря на масштаб, модель можно запускать даже на одном GPU в дата-центре.
gpt-oss-20b
более легкая и экономичная модель, удобная для интеграции в рабочие процессы. Она оптимизирована для агентных задач и способна работать на современных Windows-устройствах с графическими картами от 16 ГБ видеопамяти.
Эти модели отличаются тем, что не ограничивают пользователей: они открыты, быстры и готовы к производственному использованию.
Почему открытость имеет значение
Для бизнеса важна не только производительность, но и контроль над технологиями. Открытые модели предоставляют полный доступ к весам, что открывает несколько ключевых возможностей:
- Тонкая настройка под собственные нужды. Компания может добавить свои данные, использовать современные методы оптимизации (LoRA, QLoRA, PEFT) и получить модель, которая работает именно для ее отрасли.
- Оптимизация под оборудование. Модели можно квантовать, сокращать длину контекста или уменьшать объем памяти для работы даже на edge-устройствах.
- Прозрачность и безопасность. Полный доступ позволяет проводить аудит, проверять работу механизмов внимания и адаптировать модели для специфических задач.
В Azure AI Foundry уже доступно более 11 000 моделей, а также инструменты для всего цикла: от обучения и управления весами до быстрого и безопасного запуска.
Гибридный подход: облако и локальные устройства
Не все сценарии удобно реализовывать в облаке. Некоторые организации работают в закрытых сетях, другие стремятся оставлять данные исключительно на своих устройствах. Именно для таких случаев существуют Foundry Local и Windows AI Foundry. Они позволяют запускать gpt-oss-20b на современных ПК под управлением Windows, используя CPU, GPU или NPU.
Таким образом, компании могут комбинировать облачные ресурсы и локальные мощности, сохраняя контроль над данными и оптимизируя расходы. Именно так реализуется настоящий гибридный ИИ.
Преимущества для разных аудиторий
- Для разработчиков открытые модели означают прозрачность и свободу в создании собственных решений. Они могут экспериментировать, оптимизировать, интегрировать ИИ в приложения и быстро получать результат.
- Для руководителей и владельцев бизнеса главным преимуществом становится контроль: отсутствие «черных ящиков», больше вариантов для соответствия требованиям безопасности и возможность выбирать оптимальную модель с учетом затрат.
Следующие шаги
Чтобы начать работу с gpt-oss, компании могут выбрать один из вариантов:
1️⃣ Развернуть модель в облаке с помощью Azure AI Foundry — достаточно нескольких команд CLI.
2️⃣ Запустить gpt-oss-20b локально на Windows (в скором времени и на macOS) через Foundry Local, используя QuickStart-гид.
Ценообразование* для этих моделей выглядит следующим образом:
* Актуальное более подробное ценообразование можно посмотреть на странице Managed Compute pricing page (по состоянию на август 2025 года).