История поиска

Войти в NeuroManual

Войдите с помощью социальных сетей, чтобы сохранять избранные нейросети и просматривать историю.

Главная / Статьи / Новости ИИ

Microsoft запустила три новые AI-модели для распознавания и генерации

07.04.2026
Microsoft запустила три новые AI-модели для распознавания и генерации

Microsoft выпускает три новые AI-модели для транскрипции, генерации речи и изображений

Компания Microsoft представила три новые базовые модели искусственного интеллекта: MAI-Transcribe-1, MAI-Voice-1 и MAI-Image-2. Все они уже доступны разработчикам через облачную платформу Microsoft Foundry, а для тестирования в MAI Playground (пока только для пользователей из США). Этот релиз знаменует первую крупную волну собственных «домашних» моделей корпорации, которая ранее в значительной степени полагалась на технологии OpenAI.

Точная транскрипция на множестве языков

Модель MAI-Transcribe-1, предназначенная для распознавания речи, демонстрирует лидирующие показатели точности. На отраслевом бенчмарке FLEURS она достигла уровня ошибок в словах (WER) всего 3,9% для топ-25 языков мира, включая японский, что является лучшим результатом среди конкурентов. Стоимость использования модели начинается от $0,36 за час транскрипции.

Быстрая и эмоциональная генерация речи

MAI-Voice-1 — это высокоскоростная модель для синтеза речи, способная генерировать 60 секунд аудио всего за одну секунду обработки. Её ключевые особенности — умение передавать интонации и эмоции, а также сохранять стабильность и узнаваемость голоса персонажа на длинных текстах. Кроме того, технология позволяет создавать пользовательские голоса на основе всего нескольких секунд образцовой записи. Цена начинается от $22 за миллион символов. Microsoft уже интегрировала эту модель в функцию Copilot Audio Expressions.

Лидер в генерации изображений

Модель MAI-Image-2, первоначально анонсированная 19 марта, уже зарекомендовала себя как один из лидеров в своей области. Она вошла в топ-3 на популярном лидерборде Arena.ai, где пользователи сравнивают качество outputs различных генераторов изображений. С момента запуска модель уже улучшила качество картинок в Copilot. По заявлению Microsoft, она генерирует изображения как минимум вдвое быстрее при сохранении того же уровня качества, что и у аналогов. Крупнейшее мировое рекламное агентство WPP уже применяет MAI-Image-2 в промышленных масштабах для своих задач.

Генеральный директор Microsoft AI Мустафа Сулейман лично продемонстрировал возможности MAI-Image-2, опубликовав в своём аккаунте в X (бывший Twitter) сгенерированное изображение — макроснимок клоун-рыбки среди пионов. Глава Microsoft Сатья Наделла анонсировал весь пакет моделей, заявив: «Мы привносим семейство MAI каждому разработчику в Foundry». Компания позиционирует новые модели как более быстрые и экономичные альтернативы решениям конкурентов.

Как вам эта новость?

Комментарии (0)

Пока нет комментариев. Будьте первым!

Оставить комментарий

Все новости