Ideogram 4.0 вышел в открытый доступ: 2K-разрешение и текст в изображениях
Ideogram 4.0 вышла как открытая модель с нативным 2K-разрешением, поддержкой текста и первым местом среди open-weight моделей на DesignArena.
Ideogram выпустила четвёртую версию своей модели генерации изображений как open-weight — то есть веса можно скачать, запустить на своём железе и дообучить под свои задачи.
Главные улучшения: нативное разрешение 2K, прозрачные фоны, точное управление раскладкой через bounding box и заметно более качественный рендеринг текста внутри картинок. Последнее особенно важно для логотипов и постеров — именно там большинство моделей стабильно проваливаются. Редактируемый текст и слои обещают добавить позже.
На лидерборде DesignArena модель заняла первое место среди всех открытых моделей. Выше только закрытые системы OpenAI и Google.
Есть нюанс: веса лежат на GitHub бесплатно, но для коммерческого использования нужна платная лицензия. Через собственный API Ideogram модель доступна в трёх режимах — Turbo за $0.03 за изображение, Default за $0.06 и Quality за $0.10.
По независимым тестам The Decoder, Ideogram 4.0 уверенно обходит Midjourney v8 и держится примерно на уровне Flux. До GPT-Image-2 и Luma Uni-1.1 пока не дотягивается.
Модель уже работает через Hugging Face, ComfyUI, Replicate, Leonardo AI, Picsart и ещё десяток платформ — то есть интегрировать её в существующие пайплайны несложно.
Для дизайнеров и разработчиков это сейчас лучший открытый вариант с нормальным текстом в картинках. Веса доступны на GitHub — некоммерческий запуск бесплатный.