Пожалуйста, войдите в свой аккаунт, или зарегистрируйтесь и добавьте свои Telegram-каналы и бизнес-сообщества ВКонтакте в личном кабинете.
Для бесплатной генерации поста использовался промт/статья:
<b>Сбер выпустили собственный ИИ-фотошоп Malvina</b> <b>и обновили свою text2image модель Kandinsky</b>
<emoji id="5417934298525230493">➖</emoji> Внутри свежего Kandinsky 4.1 Image лежит обновленная архитектура – теперь это диффузионный трансформер (DiT). На практике это значит – лучшая масштабируемость, ускорение и скачок в качестве.
Плюс, в этот раз, помимо обучения на огромном датасете пар «изображение – описание», Kandinsky дополнительно тюнили на большом сете отобранных вручную изображений (отбором, кстати, занималась команда аж из более 100 специалистов – художников, фотографов и дизайнеров). В результате сильно выросла эстетичность генераций, качество структур, понимание стилей и точность следования инструкциям.
<emoji id="5417934298525230493">➖</emoji> Malvina – еще более интересный релиз. Эта модель может отредактировать любое изображение просто по текстовому промпту. При этом она действительно умеет не менять исходное изображение (в отличие от GPT), а редактировать на попиксельном уровне. Может изменить цвет волос, убрать с картинки людей, заменить предметы, корректировать дефекты.
На SBS-сравнениях <a href="https://drive.google.com/drive/folders/1fjiCen9aWM38wwNRXXAuTpxTcIWL5oLG?usp=sharing">(вот они)</a> Malvina обходит на основных задачах по качеству Gemini и Grok. И нет, это не преувеличение, модель говорит сама за себя: просто взгляните на <a href="https://t.me/oulenspiegel_channel/4490">примеры.</a>
Под капотом – VLM + диффузия, так что Malvina действительно умеет очень много всего, экспериментируй – не хочу. Остаются проблемы с текстом, перемещением объектов и сменой поз людей, но разработчики обещают продолжать над этим работать.
<b>Попробовать уже можно в тг-боте </b><a href="https://t.me/gigachat_bot"><b>GigaChat</b></a>