«Сбер» представил нейросеть Kandinsky 2.1

СберБанк представил новую версию генеративной нейросети Kandinsky 2.1. Она способна за несколько секунд создавать высококачественные изображения по их текстовому описанию на 101 языке, включая английский и русский.

Нейросеть также может микшировать несколько рисунков, изменять их по текстовому описанию, генерировать изображения, похожие на заданное, дорисовывать недостающие части картинки и формировать изображения в режиме бесконечного полотна.

В «Сбере» предлагают:

Теперь ваша очередь — попросите искусственный интеллект создать шедевр для вас. Введите текстовое описание в @kandinsky21_bot или сделайте запрос голосом. Для этого скажите ассистенту Салют «Запусти художника» на умных устройствах Sber и в Android-приложении Салют.

С десктопным вариантом можно познакомиться здесь. Лаконичный, интуитивно понятный интерфейс, в левом нижнем углу имеется список стилей, генерация происходит довольно быстро и качественно.

Новая модель Kandinsky 2.1 была дополнительно обучена на 170 млн пар «текст — изображение» высокого разрешения. Затем она дообучалась на отдельно собранном наборе из двух миллионов пар качественных изображений. В данный набор попали картинки с описаниями в таких традиционно сложных для нейросетей областях, как тексты и лица людей. В итоге, Kandinsky 2.1 содержит 3,3 млрд параметров вместо двух миллиардов в Kandinsky 2.0.