Microsoft выпустила генераторы изображений и голоса MAI
Microsoft представила три новые ИИ-модели, доступные через платформы Microsoft Foundry и MAI Playground. Впервые компания выпустила под собственным брендом инструменты для распознавания речи и синтеза голоса, а также обновила генератор изображений MAI-Image-2. Все три модели доступны на платной основе и предназначены для использования в коммерческих приложениях и сервисах.
Модель MAI-Transcribe-1 обеспечивает преобразование речи в текст и поддерживает 25 языков, в том числе английский, французский, немецкий и русский. Сервис предназначен для генерации субтитров, транскрибирования переговоров и других задач, связанных с обработкой аудиоконтента. Стоимость составляет от $0,36 за час аудиозаписи, что делает инструмент доступным для широкого круга сценариев.
MAI-Voice-1 генерирует реалистичную речь с эмоциональной окраской из текстовых данных. Максимальная длина аудио — 2 минуты; стоимость — от $22 за 1 миллион символов. Обновлённый генератор изображений MAI-Image-2 преобразует текстовые промпты в визуальный контент и является улучшенной версией MAI-Image, представленного в октябре 2025 года. Стоимость — от $5 за 1 млн входных токенов и от $33 за 1 млн токенов для вывода изображения.
Все три модели реализованы как самостоятельные продукты под брендом MAI и предоставляются через единую инфраструктуру Microsoft Foundry и MAI Playground. Коммерческая доступность адресована разработчикам и бизнесу, которые встраивают ИИ-возможности в собственные продукты. Ранее Microsoft представила инструмент AI Performance для оценки производительности ИИ-систем, последовательно расширяя инструментарий для разработчиков.
Выпуск собственных генеративных моделей под брендом MAI обозначает более активное присутствие Microsoft в конкурентной борьбе за рынок инструментов искусственного интеллекта. Для специалистов в области дизайна и работы с контентом появление MAI-Image-2 и MAI-Voice-1 расширяет инструментарий генеративных решений от крупных технологических вендоров с гарантированным корпоративным уровнем поддержки.