«Алиса AI» втрое улучшила генерацию изображений с русским текстом
«Яндекс» обновил Alice AI ART: модель втрое чаще генерирует изображения с корректным русским текстом и лучше понимает российский культурный контекст.
Генеративные нейросети традиционно плохо справляются с русским текстом на картинках — модели обучают на открытых датасетах, где кириллица практически не встречается. «Яндекс» решил эту проблему по-своему: собрал собственный масштабный датасет и изменил архитектуру модели.
Обновлённая Alice AI ART теперь втрое чаще генерирует изображения с корректным русским текстом — без ошибок и нечитаемых букв. Это значит: постеры, афиши, открытки и рекламные баннеры с русскими надписями перестают выглядеть как результат плохого OCR.
Помимо текста, на треть выросло общее качество картинок — меньше артефактов и визуальных искажений. Модель также научили понимать русский культурный контекст: по запросу «русский народный ансамбль» она рисует гармонистов и балалаечников, а «традиционный праздничный стол» — с икрой и самоваром.
Для правильной генерации текста разработчики рекомендуют несколько простых приёмов: заключать нужные слова в кавычки, сложные слова писать заглавными буквами и разбивать длинные фразы на короткие.
Для бизнеса модель доступна в Yandex AI Studio через новый инструмент Image Generation Tool. Он позволяет встроить генерацию изображений в агентские сценарии — например, автоматически создавать карточки товаров для маркетплейсов, как только данные о них появляются в корпоративной базе.