Сбер представил новую версию нейросети Kandinsky 4.1 Image, которая может создавать более качественные и детализированные изображения, а также лучше следует текстовым инструкциям, сообщает пресс-служба Сбера.
В новой версии для нейрохудожников добавили AI-редактор Malvina, который позволяет редактировать изображения. При этом Malvina старается сохранить геометрию исходного изображения.
В Сбере отметили, что модель Kandinsky 4.1 Image не только обучалась на огромном датасете «Изображение – текстовое описание», но и дополнительно дообучалась на отработанных вручную изображениях, сбалансированных по 9 метакатегориям. В результате такого дообучения значительно выросла эстетичность и корректность генерируемых изображений во всех доменах, а также повысилось качество генерации текстур и сложных объектов.
По словам старшего вице-президента, руководителя блока «Технологическое развитие» Сбера Андрея Белевцева, теперь пользователи могут не тратить часы в графических редакторах.
«Мы специально обучали обновленную модель Kandinsky на разнообразных и при этом детально выверенных и размеченных данных, чтобы нейросеть могла работать с различными сценами: от портретов до пейзажей. Интеграция с GigaChat превращает нашу языковую модель в универсальный инструмент для творчества и работы, который может освоить любой желающий», — сказал он.