Kandinsky

Материал из Энциклопедия интернет-маркетинга MarketWiki

Kandinsky - семейство нейросетей для генерации изображений и видео по текстовому описанию, разработанное исследователями Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI. Нейросеть названа в честь известного русского художника-абстракциониста Василия Кандинского.

Kandinsky стал продолжением нейросети ruDALL-E, представленной 2 ноября 2021 года. Модель была дообучена на 200 млн изображений, снабжённых текстовыми русскоязычными описаниями. Ключевое преимущество Kandinsky - хорошее понимание запросов на русском языке.

История версий

[править]

Kandinsky 2.0 - 2.2

[править]

В апреле 2023 года представлена Kandinsky 2.1, способная за несколько секунд создавать высококачественные изображения по текстовому описанию на естественном языке. Модель также умеет смешивать несколько рисунков и изменять их.

В июле 2023 года вышла Kandinsky 2.2 с возможностью создавать фотореалистичные изображения с более высоким разрешением и изменять соотношение сторон при генерации.

В октябре 2023 года нейросеть научилась создавать анимационные видеоролики по текстовому описанию в режиме анимации (4-секундное видео с выбранным эффектом).

Kandinsky 3.0 - 3.1

[править]

В ноябре 2023 года представлена Kandinsky 3.0. Новая версия стала лучше понимать текстовые запросы пользователей и создавать более фотореалистичные изображения.

В апреле 2024 года улучшенная модель Kandinsky 3.1 стала доступна всем пользователям без ограничений. Обновлённая версия дообучена на увеличенном датасете изображений, что позволило повысить качество.

Kandinsky 4.0 - 4.1

[править]

В мае 2024 года представлена Kandinsky 4.0 Video - бета-версия нейросети для создания реалистичных видеороликов по текстовому описанию или стартовому изображению.

В июне 2025 года представлена Kandinsky 4.1 Image, создающая ещё более качественные и детализированные изображения, и Kandinsky 4.1 Video - качественный скачок в генерации видео по тексту.

Kandinsky 5.0

[править]

В ноябре 2025 года представлена новая линейка моделей Kandinsky 5.0 для генерации изображений и видео, доступная в «ГигаЧате».

Kandinsky 3D

[править]

В мае 2025 года стал доступен первый российский ИИ-сервис для создания 3D-моделей - Kandinsky 3D, позволяющий создавать 3D-модель с геометрией и текстурой на основе текстового описания или загруженного изображения.

Kandinsky Video Lite

[править]

В сентябре 2025 года Cloud.ru реализовал запуск открытой модели для генерации видео Kandinsky Video Lite в публичном облаке. В октябре 2025 года «Сбер» выложил модель Kandinsky Video Lite в открытый доступ по свободной лицензии.

Применение

[править]

Нейросеть Kandinsky интегрирована в сервис GigaChat, а также доступна для использования в различных продуктах и платформах. В ноябре 2023 года в «Сбербанк онлайн» появилась возможность создавать заставки для входа в приложение с помощью Kandinsky 3.0. В HR-платформу «Пульс» Сбербанка также внедрены нейросети GigaChat и Kandinsky.

Популярность

[править]

В 2023 году свыше 12 млн пользователей создали более 200 млн изображений с помощью нейросети Kandinsky. Совокупная аудитория ИИ-сервисов Сбербанка GigaChat и Kandinsky к марту 2024 года достигла 18 млн пользователей.

В мае 2024 года Сбер запустил бесплатный курс по промпт-инжинирингу для работы с GigaChat и Kandinsky.

Связанные термины

[править]