Kandinsky
Kandinsky - семейство нейросетей для генерации изображений и видео по текстовому описанию, разработанное исследователями Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI. Нейросеть названа в честь известного русского художника-абстракциониста Василия Кандинского.
Kandinsky стал продолжением нейросети ruDALL-E, представленной 2 ноября 2021 года. Модель была дообучена на 200 млн изображений, снабжённых текстовыми русскоязычными описаниями. Ключевое преимущество Kandinsky - хорошее понимание запросов на русском языке.
История версий
[править]Kandinsky 2.0 - 2.2
[править]В апреле 2023 года представлена Kandinsky 2.1, способная за несколько секунд создавать высококачественные изображения по текстовому описанию на естественном языке. Модель также умеет смешивать несколько рисунков и изменять их.
В июле 2023 года вышла Kandinsky 2.2 с возможностью создавать фотореалистичные изображения с более высоким разрешением и изменять соотношение сторон при генерации.
В октябре 2023 года нейросеть научилась создавать анимационные видеоролики по текстовому описанию в режиме анимации (4-секундное видео с выбранным эффектом).
Kandinsky 3.0 - 3.1
[править]В ноябре 2023 года представлена Kandinsky 3.0. Новая версия стала лучше понимать текстовые запросы пользователей и создавать более фотореалистичные изображения.
В апреле 2024 года улучшенная модель Kandinsky 3.1 стала доступна всем пользователям без ограничений. Обновлённая версия дообучена на увеличенном датасете изображений, что позволило повысить качество.
Kandinsky 4.0 - 4.1
[править]В мае 2024 года представлена Kandinsky 4.0 Video - бета-версия нейросети для создания реалистичных видеороликов по текстовому описанию или стартовому изображению.
В июне 2025 года представлена Kandinsky 4.1 Image, создающая ещё более качественные и детализированные изображения, и Kandinsky 4.1 Video - качественный скачок в генерации видео по тексту.
Kandinsky 5.0
[править]В ноябре 2025 года представлена новая линейка моделей Kandinsky 5.0 для генерации изображений и видео, доступная в «ГигаЧате».
Kandinsky 3D
[править]В мае 2025 года стал доступен первый российский ИИ-сервис для создания 3D-моделей - Kandinsky 3D, позволяющий создавать 3D-модель с геометрией и текстурой на основе текстового описания или загруженного изображения.
Kandinsky Video Lite
[править]В сентябре 2025 года Cloud.ru реализовал запуск открытой модели для генерации видео Kandinsky Video Lite в публичном облаке. В октябре 2025 года «Сбер» выложил модель Kandinsky Video Lite в открытый доступ по свободной лицензии.
Применение
[править]Нейросеть Kandinsky интегрирована в сервис GigaChat, а также доступна для использования в различных продуктах и платформах. В ноябре 2023 года в «Сбербанк онлайн» появилась возможность создавать заставки для входа в приложение с помощью Kandinsky 3.0. В HR-платформу «Пульс» Сбербанка также внедрены нейросети GigaChat и Kandinsky.
Популярность
[править]В 2023 году свыше 12 млн пользователей создали более 200 млн изображений с помощью нейросети Kandinsky. Совокупная аудитория ИИ-сервисов Сбербанка GigaChat и Kandinsky к марту 2024 года достигла 18 млн пользователей.
В мае 2024 года Сбер запустил бесплатный курс по промпт-инжинирингу для работы с GigaChat и Kandinsky.
