Перейти к содержимому
Артём Захаров

«Алиса AI» втрое улучшила генерацию изображений с русским текстом

«Яндекс» обновил Alice AI ART: модель втрое чаще генерирует изображения с корректным русским текстом и лучше понимает российский культурный контекст.

«Алиса AI» втрое улучшила генерацию изображений с русским текстом

Генеративные нейросети традиционно плохо справляются с русским текстом на картинках — модели обучают на открытых датасетах, где кириллица практически не встречается. «Яндекс» решил эту проблему по-своему: собрал собственный масштабный датасет и изменил архитектуру модели.

Обновлённая Alice AI ART теперь втрое чаще генерирует изображения с корректным русским текстом — без ошибок и нечитаемых букв. Это значит: постеры, афиши, открытки и рекламные баннеры с русскими надписями перестают выглядеть как результат плохого OCR.

Помимо текста, на треть выросло общее качество картинок — меньше артефактов и визуальных искажений. Модель также научили понимать русский культурный контекст: по запросу «русский народный ансамбль» она рисует гармонистов и балалаечников, а «традиционный праздничный стол» — с икрой и самоваром.

Для правильной генерации текста разработчики рекомендуют несколько простых приёмов: заключать нужные слова в кавычки, сложные слова писать заглавными буквами и разбивать длинные фразы на короткие.

Для бизнеса модель доступна в Yandex AI Studio через новый инструмент Image Generation Tool. Он позволяет встроить генерацию изображений в агентские сценарии — например, автоматически создавать карточки товаров для маркетплейсов, как только данные о них появляются в корпоративной базе.

Артём Захаров
Все статьи
Читайте также
Все статьи