cookie

Мы используем файлы cookie для улучшения сервиса. Нажав кнопку «Принять все», вы соглашаетесь с использованием cookies.

avatar

Сергей Марков: машинное обучение, искусство и шитпостинг

Машинное обучение, искусственный интеллект, искусство, мемасы, всякое личное и странноэ

Больше
Рекламные посты
4 790
Подписчики
+2724 часа
+6257 дней
+61630 дней

Загрузка данных...

Прирост подписчиков

Загрузка данных...

Repost from Dendi Math&AI
Фото недоступноПоказать в Telegram
🥳 Мы выложили в открытый доступ DPF - наш фреймворк для обработки и фильтрации мультимодальных данных 🥳 С помощью Data Processing Framework мы уже готовим данные для обучения таких моделей как Kandinsky и Kandinsky Video. Репозиторий содержит фильтры для видео, изображений, различных комбинаций этих модальностей, а также удобный интерфейс к ним. И, конечно, буду рад любому контрибьюту в этот фреймворк! 🤗 Полезные ссылки: 👉 Хабр 👉 GitHub
Показать все...
👍 7❤‍🔥 1
Repost from Dendi Math&AI
Немного больше генераций
Показать все...
👍 18🤔 6🔥 1
Repost from Dendi Math&AI
00:08
Видео недоступноПоказать в Telegram
🥳 Сегодня выпустили обновление нашей модели генерации полноценных видео по тексту Kandinsky Video 1.1 🥳 Kandinsky Video 1.1 представляет собой ансамбль моделей, состоящий из трёх ключевых блоков, последовательно реализующих процесс генерации видео. Первый блок фактически является моделью синтеза изображений по текстовым описаниям Kandinsky 3.0 и отвечает за создание первого кадра видео. Второй — отвечает за генерацию ключевых кадров на основе первого кадра и введенного пользователем текста. Из этих кадров и складывается структура сюжета видео. Третий блок реализует генерацию интерполяционных кадров и позволяет достичь плавности движений в финальном видео. В основе второго и третьего блоков также лежит архитектура Kandinsky 3.0. Такой подход значительно повышает общее качество видео, особенно его визуальную составляющую (и на EvalCrafter модель выбивает неплохие скоры 🔥). В силу особенности архитектуры новая версия модели позволяет генерировать видео не только по тексту, но и по начальному изображению, то есть «оживлять» статичную картинку. Теперь также можно контролировать динамику генерируемого видео с помощью специального параметра motion score. Поработали в том числе над датасетом для обучения - сейчас это почти 5 млн пар «текст-видео» после фильтров из разных источников (подробнее расписано в статье на Хабр). И, самое главное, теперь каждый может сгенерировать видео на свой вкус на fusionbrain.ai или в Telegram-боте Kandinsky. Генерация видео длиной 5,5 секунд в разрешении 512x512 и FPS=32 занимает около 1,5 минут. Полезные ссылки: 👉 Хабр 👉 Project Page 👉 GitHub 👉 Hugging Face 👉 Telegram-бот 👉 fusionbrain.ai @dendi_math_ai
Показать все...
👍 20🔥 9❤‍🔥 7💩 1
Repost from Neural Shit
Фото недоступноПоказать в Telegram
Киберпанк, который мы заслужили
Показать все...
😁 47 6🔥 5
«У меня есть потребность простоты и порядка. Дайте мне щей с говядиной, творогу со сливками, осетровой икры, красных перепелов в бруснике, душистого кофею, и я не попрошу ничего более. Но чтобы это было хорошо и свежо. Кажется, ну что проще? А как трудно этого добиться! Поэтому пью водку, закусываю груздями, телятиной и белугой и грущу». Афанасий Фет, из письма Льву Толстому, 1878 год.
Показать все...
😁 40 22👍 9🔥 3💯 3🏆 1
Фото недоступноПоказать в Telegram
Если вы вдруг сейчас на РИФ, то через примерно через полчаса я буду вот тут выступать
Показать все...
🔥 13👍 3
https://disk.yandex.ru/d/9B0UTZYV_eSKCw А вот тут разные образы будущего
Показать все...
Образы будущего от Kandinsky 3.1

Посмотреть и скачать с Яндекс Диска

👍 4
И ещё пачка
Показать все...
👍 13