Сергей Марков: машинное обучение, искусство и шитпостинг
Машинное обучение, искусственный интеллект, искусство, мемасы, всякое личное и странноэ
Больше4 790
Подписчики
+2724 часа
+6257 дней
+61630 дней
- Подписчики
- Просмотры постов
- ER - коэффициент вовлеченности
Загрузка данных...
Прирост подписчиков
Загрузка данных...
Repost from Dendi Math&AI
Фото недоступноПоказать в Telegram
🥳 Мы выложили в открытый доступ DPF - наш фреймворк для обработки и фильтрации мультимодальных данных 🥳
С помощью Data Processing Framework мы уже готовим данные для обучения таких моделей как Kandinsky и Kandinsky Video. Репозиторий содержит фильтры для видео, изображений, различных комбинаций этих модальностей, а также удобный интерфейс к ним.
И, конечно, буду рад любому контрибьюту в этот фреймворк! 🤗
Полезные ссылки:
👉 Хабр
👉 GitHub
👍 7❤🔥 1
Фото недоступноПоказать в Telegram
🤣 48👍 7🔥 2
Показать все...
👍 15❤ 6🔥 3👏 3🎉 1
Repost from Dendi Math&AI
00:08
Видео недоступноПоказать в Telegram
🥳 Сегодня выпустили обновление нашей модели генерации полноценных видео по тексту Kandinsky Video 1.1 🥳
Kandinsky Video 1.1 представляет собой ансамбль моделей, состоящий из трёх ключевых блоков, последовательно реализующих процесс генерации видео. Первый блок фактически является моделью синтеза изображений по текстовым описаниям Kandinsky 3.0 и отвечает за создание первого кадра видео. Второй — отвечает за генерацию ключевых кадров на основе первого кадра и введенного пользователем текста. Из этих кадров и складывается структура сюжета видео. Третий блок реализует генерацию интерполяционных кадров и позволяет достичь плавности движений в финальном видео. В основе второго и третьего блоков также лежит архитектура Kandinsky 3.0. Такой подход значительно повышает общее качество видео, особенно его визуальную составляющую (и на EvalCrafter модель выбивает неплохие скоры 🔥).
В силу особенности архитектуры новая версия модели позволяет генерировать видео не только по тексту, но и по начальному изображению, то есть «оживлять» статичную картинку. Теперь также можно контролировать динамику генерируемого видео с помощью специального параметра motion score.
Поработали в том числе над датасетом для обучения - сейчас это почти 5 млн пар «текст-видео» после фильтров из разных источников (подробнее расписано в статье на Хабр).
И, самое главное, теперь каждый может сгенерировать видео на свой вкус на fusionbrain.ai или в Telegram-боте Kandinsky. Генерация видео длиной 5,5 секунд в разрешении 512x512 и FPS=32 занимает около 1,5 минут.
Полезные ссылки:
👉 Хабр
👉 Project Page
👉 GitHub
👉 Hugging Face
👉 Telegram-бот
👉 fusionbrain.ai
@dendi_math_ai
👍 20🔥 9❤🔥 7💩 1
Repost from Neural Shit
Фото недоступноПоказать в Telegram
Киберпанк, который мы заслужили
😁 47❤ 6🔥 5
«У меня есть потребность простоты и порядка. Дайте мне щей с говядиной, творогу со сливками, осетровой икры, красных перепелов в бруснике, душистого кофею, и я не попрошу ничего более. Но чтобы это было хорошо и свежо. Кажется, ну что проще? А как трудно этого добиться! Поэтому пью водку, закусываю груздями, телятиной и белугой и грущу».
Афанасий Фет, из письма Льву Толстому, 1878 год.
😁 40❤ 22👍 9🔥 3💯 3🏆 1
Фото недоступноПоказать в Telegram
Если вы вдруг сейчас на РИФ, то через примерно через полчаса я буду вот тут выступать
🔥 13👍 3
https://disk.yandex.ru/d/9B0UTZYV_eSKCw
А вот тут разные образы будущего
Образы будущего от Kandinsky 3.1
Посмотреть и скачать с Яндекс Диска
👍 4