⚡️
10 open-source генераторов видео достойных вашего внимания (text-to-video и image-to-video) с лицензией, разрешающей коммерческое использовани
е.
Для каждого указано: описание, лучшая категория применения, бенчмарки, кейсы использования и ресурсы для запуска.
1) HunyuanVideo (text-to-video)
Флагманская модель от Tencent (~13B параметров), обеспечивает высокое качество качество и реализм.
Категория: подходит для генерации реалистичных видео
▪
Ресурсы: 45–80 ГБ VRAM, A100/H100, поддержка FP8
🟡
Ссылка
2) Mochi (text-to-video)
Описание: модель от Genmo (~10B параметров), быстрая и мощная
▪
Категория: реализм + плавность движения
▪
Бенчмарки: качество почти на уровне Hunyuan, 30 FPS
▪
Кейсы: реклама, креативы, short-видео
▪
Ресурсы: Для работы модели требуется не менее 4 GPU H100., поддержка LoRA, FP8
🟡
Ссылка
3) Wan2.1 (text/image-to-video)
▪
Описание: универсальный генератор от Alibaba (до 14B параметров)
▪
Категория: синтез движений, анимация изображения
▪
Бенчмарки: высокая стабильность, особенно в SkyReels.
▪
Кейсы: оживление изображений, видеопрототипы
▪
Ресурсы: 12–24 ГБ VRAM (1.3B и 14B версии)
🟡
Ссылка
4) LTX-Video
▪
Описание: real time генератор от Lightricks (2B параметров).Нативная поддержка в ComfyUI
▪
Категория: анимация, контроль keyframe
▪
Бенчмарки: 24 FPS, 768p, хорошая стабильность при 2B
▪
Кейсы: раскадровки, быстрые клипы
▪Ресурсы: от 12 ГБ VRAM (RTX 3060+), рекомендуется RTX 4090
🟡
Ссылка
5) Pyramid Flow (text/image-to-video)
▪
Описание: модель на базе Flux для генерации длинных видео (до 10 сек, 768p)
▪
Категория: длительные сцены, плавные переходы
▪
Бенчмарки: превосходство в motion stability
▪
Кейсы: нарративные ролики, контент для соцсетей
▪
Ресурсы: 12–48 ГБ VRAM
🟡
Ссылка
6) CogVideo / CogVideoX (text-to-video)
▪
Описание: трансформер на 9B/5B параметров от THU
▪
Категория: стилизация, универсальность
▪
Бенчмарки: сильные CLIP/FVD, хорошая временная согласованность
▪
Кейсы: мультфильмы, обучающее видео, стилизованные ролики
▪
Ресурсы: 20–24 ГБ VRAM, оптимизирован под FP8
🟡
Ссылка
7) Step-Video-TI2V
Модель для генерации видео (до 102 кадров), производительностью
SOTA.
Принимает на вход текстовые описания и изображения.
▪
Бенчмарки: на
VBench-I2V показывает лучшие результаты по сравнению с другими современными открытыми моделями для генерации видео из изображения и текста, а также лидирует в публичном рейтинге.
🟡
Ссылка
8) AnimateDiff
Ветеран этого списка.
▪
Категория: анимация, стилизация
▪
Бенчмарки: высокая согласованность между кадрами
▪
Кейсы: оживление арта, анимированные сцены
▪
Ресурсы: от 8 ГБ VRAM, масштабируется до 24 ГБ для высокого качества
🟡
Ссылка
9) Easy Animate (image-to-video)
▪
Описание: генерация видео из одного кадра (Alibaba, EasyAnimate V5)
▪
Категория: анимация изображения
▪
Бенчмарки: стабильная идентичность объекта, плавность
▪
Кейсы: оживление фото, персонажей, иллюстраций
▪
Ресурсы: минимум 12–24 gb CPU
🟡
Ссылка
10)LTX-Video-Trainer
Проект, предоставляющий инструменты и скрипты для обучения и дообучения модели LTX-Video от компании Lightricks.
▪
Категория: с его помощью можно обучать адаптеры LoRA поверх LTX-Video, а также выполнять полное дообучение модели на ваших датасетах.
▪
Ресурсы: не менее 12 ГБ GPU для эффективного обучения и дообучения модели. RaM: Минимум 16 ГБ;
🟡
Ссылка
-
Open-Sora (и связанные проекты)
▪
Описание: Это не одна конкретная модель, а скорее инициатива разработчиков (и несколько независимых проектов) по созданию и обучению open-source модели
▪
Бенчмарки: Пока находятся в активной разработке. Сильная сторона - открытость и амбициозная цель. Результаты варьируются, но быстро улучшаются.
▪
Ресурсы: Требования сильно зависят от конкретной реализации и этапа проекта.
📌
Подробное описание моделей
Добавляйте в комментариях ссылки генераторы, которыми вы пользуетесь 👇
#ai #video #videogenerator #ml