Перейти к содержимому
Мария Шилова

Ideogram 4.0 вышел в открытый доступ: 2K-разрешение и текст в изображениях

Ideogram 4.0 вышла как открытая модель с нативным 2K-разрешением, поддержкой текста и первым местом среди open-weight моделей на DesignArena.

Ideogram 4.0 вышел в открытый доступ: 2K-разрешение и текст в изображениях

Ideogram выпустила четвёртую версию своей модели генерации изображений как open-weight — то есть веса можно скачать, запустить на своём железе и дообучить под свои задачи.

Главные улучшения: нативное разрешение 2K, прозрачные фоны, точное управление раскладкой через bounding box и заметно более качественный рендеринг текста внутри картинок. Последнее особенно важно для логотипов и постеров — именно там большинство моделей стабильно проваливаются. Редактируемый текст и слои обещают добавить позже.

На лидерборде DesignArena модель заняла первое место среди всех открытых моделей. Выше только закрытые системы OpenAI и Google.

Есть нюанс: веса лежат на GitHub бесплатно, но для коммерческого использования нужна платная лицензия. Через собственный API Ideogram модель доступна в трёх режимах — Turbo за $0.03 за изображение, Default за $0.06 и Quality за $0.10.

По независимым тестам The Decoder, Ideogram 4.0 уверенно обходит Midjourney v8 и держится примерно на уровне Flux. До GPT-Image-2 и Luma Uni-1.1 пока не дотягивается.

Модель уже работает через Hugging Face, ComfyUI, Replicate, Leonardo AI, Picsart и ещё десяток платформ — то есть интегрировать её в существующие пайплайны несложно.

Для дизайнеров и разработчиков это сейчас лучший открытый вариант с нормальным текстом в картинках. Веса доступны на GitHub — некоммерческий запуск бесплатный.

Мария Шилова
Все статьи
Читайте также
Все статьи