Machinelearning

Open in Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Network:Machinelearning Russia1 272 Technologies & Applications329...

📈 Analytical overview of Telegram channel Machinelearning

Channel Machinelearning (@ai_machinelearning_big_data) in the Russian language segment is an active participant. Currently, the community unites 296 342 subscribers, ranking 329 in the Technologies & Applications category and 1 272 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 296 342 subscribers.

According to the latest data from 20 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -6 181 over the last 30 days and by -161 over the last 24 hours, overall reach remains high.

Verification status: Not verified
Engagement rate (ER): The average audience engagement rate is 8.10%. Within the first 24 hours after publication, content typically collects 5.73% reactions from the total number of subscribers.
Post reach: On average, each post receives 24 014 views. Within the first day, a publication typically gains 16 967 views.
Reactions and interaction: The audience actively supports content: the average number of reactions per post is 187.
Thematic interests: Content is focused on key topics such as openai, claude, api, gemini, контекст.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

Thanks to the high frequency of updates (latest data received on 21 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

296 342

Subscribers

-16124 hours

-1 4287 days

-6 18130 days

24 014

Post views

~ 16 96724 hours

~ 19 11248 hours

8.10%

Engagement rate

~ 5

Posts per day

Ads index

beta

Posts Archive

296 271

Если мечтаете о карьере в аналитике или машинном обучении, начните с двух бесплатных онлайн-курсов от VK Education. — «Введение в анализ данных»: вы разберётесь в основах статистики и анализа данных, научитесь проводить статистические тесты и интерпретировать результаты. — «Математика для машинного обучения» подготовит вас к работе с алгоритмами ML: изучите линейную алгебру, теорию вероятностей и научитесь анализировать сложные зависимости. Учитесь в удобном темпе, совмещая лекции от экспертов VK с учёбой в вузе или работой. Всё, что нужно для старта в IT, — уже в доступе!

296 271

🌟 Step-Video-TI2V: новый опенсорс генератрор видео из текста и изображения. Команда StepFun AI выпустила Step-Video-TI2V модель для генерации видео (до 102 кадров), производительностью SOTA. Принимает на вход текстовые описания и изображенияъ 🖼️ + ✍️ = 🎬 На бенчмарке VBench-I2V, моделька показывает лучшие результаты по сравнению с другими современными открытыми моделями для генерации видео из изображения и текста, а также лидирует в публичном рейтинге. Ключевые особенности: ▪ Контроль движения: Модель предлагает достойный баланс между стабильностью движения и гибкостью, позволяя управлять динамикой в кадре. ▪ Разнообразные движения камеры: Поддерживается имитация различных движений виртуальной камеры для создания более кинематографичных эффектов. ▪ Мастер аниме-стиля: Step-Video-TI2V особенно преуспевает в генерации видео в стиле аниме, открывая новые возможности для фанатов и создателей контента! ✨ ▪ Поддержка разных разрешений: Модель может генерировать видео в нескольких вариантах размеров. 🟢GitHub 🟢Попробовать 🟢ComfyU 🟢HF 🟢Modelscope： 🟢Tech Report @ai_machinelearning_big_data #AI #VideoGeneration #TextToVideo #ImageToVideo #GenerativeAI #MachineLearning #StepFunAI #ИИ #ГенерацияВидео #Нейросети #Аниме #OpenSource

296 271

🖥 OpenAI открывает бесплатное обучение по работе с нейросетями OpenAI запустила "Академию OpenAI", которая претендует на роль главного учебника по работе с ИИ. Платформа поможет освоить нейросети на практике, понять их возможности и научиться эффективно использовать ChatGPT и Sora в повседневной жизни и работе. ▪ Обширная база обучающих материалов доступна на отдельном сайте. ▪Live-трансляции и офлайн-мероприятия помогут глубже разобраться в технологиях. ▪ Бесплатный доступ — OpenAI стремится расширить аудиторию, а не ограничивать её ценником. Программа рассчитана на широкий круг слушателей — от технических специалистов до политиков, представителей бизнеса и академического сообщества. @ai_machinelearning_big_data 📌Начать обучение 📌 Блог #ai #freecourses #openai #ml

296 271

Repost from КПД

Scale-wise Distillation of Diffusion Models [Статья] [Демка] [Код soon] Введение Диффузионные модели на протяжении последних несколько лет удерживают пальму первенства среди семейств генеративных моделей во многих приложениях. Однако их фундаментальным ограничением является многошаговое сэмплирование, из-за чего генерация занимает много времени. Научное сообщество предложило вагон и маленькую тележку различных процедур дистилляции многошаговых моделей в малошаговые. Но при приближении количества шагов к 1-му качество неизбежно просаживается даже для самых продвинутых подходов. Отсюда мысль 🤔 - а что если ускорить генерацию за счет удешевления шагов сэмплирования? Мы с коллегами из Yandex Research предложили метод дистилляции в несколько-шаговую генерацию, где разрешение изображения увеличивается постепенно, на каждом шаге генерации (SwD). За счет этого удается достичь более чем 2х кратного ускорения по сравнению с эквивалентной дистилляцией в фиксированном разрешении.

296 271

✔️ СuML от NVIDIA: Scikit-learn на скорости GPU – без единой строчки нового кода! Все мы любим scikit-learn за его простоту и мощь. Но что если ваши модели обучаются слишком долго на больших данных? 🤔 NVIDIA предлагает решение! Вы берете свой обычный скрипт cо scikit-learn, добавляете всего две строки в начало, и он начинает работать в 10, 50, а то и 100+ раз быстрее на NVIDIA GPU! 🔥 ✨ Как это работает? Библиотека cuml от NVIDIA содержит супероптимизированные для GPU версии многих алгоритмов машинного обучения. С помощью простого вызова cuml.patch.apply() вы "патчите" установленный у вас scikit-learn прямо в памяти. Теперь, когда вы вызываете, например, KNeighborsClassifier или PCA из sklearn: ▶️Патч проверяет, есть ли у вас GPU NVIDIA. ▶️Проверяет, есть ли в cuml быстрая GPU-версия этого алгоритма. ▶️Если да – запускает ускоренную версию на GPU! 🏎️ ▶️Если нет (нет GPU или алгоритм не поддерживается) – спокойно запускает обычную CPU-версию scikit-learn. Ключевые преимущества: ✔️ Нулевые изменения кода: Ваш scikit-learn код остается прежним. Добавляете только 2 строчки: import cuml.patch и cuml.patch.apply(). ✔️ Колоссальное ускорение: Получите прирост производительности на порядки для поддерживаемых алгоритмов (KNN, PCA, линейные модели, Random Forest (инференс), UMAP, DBSCAN, KMeans и др.) за счет мощи GPU. ✔️Автоматическое переключение между GPU и CPU. Ваш скрипт будет работать в любом случае. Топ инструмент для всех, кто работает с scikit-learn на задачах, требующих значительных вычислений, и у кого есть GPU от NVIDIA. 👇 Как использовать: Установите RAPIDS cuml (лучше через conda, см. сайт RAPIDS):


python 
conda install -c rapidsai -c conda-forge -c nvidia cuml rapids-build-backend

Добавьте в начало скрипта:


import cuml.patch
cuml.patch.apply()

Используйте scikit-learn как обычно! Попробуйте и почувствуйте разницу! 😉 ▪Блог-пост ▪Colab ▪Github ▪Ускоряем Pandas @ai_machinelearning_big_data #python #datascience #machinelearning #scikitlearn #rapids #cuml #gpu #nvidia #ускорение #машинноеобучение #анализданных

296 271

✔️ ByteDance выпустила InfiniteYou: бесконечные вариации портрета. ByteDance представила InfiniteYou — ИИ-систему, которая генерирует фотореалистичные портреты, сохраняя сходство с оригиналом и точно следуя текстовым запросам. В отличие от PuLID-FLUX, в InfiniteYou черты лица обрабатываются отдельным слоем, что повышает качество без риска переобучения. Технология использует двухэтапное обучение: сначала на реальных фото, затем — на синтетических изображениях. По данным тестов, 72,8% участников выбрали результаты InfiniteYou из-за детализации и отсутствия артефактов вроде «копирования» лиц. Система совместима с ControlNet и LoRA, а для генерации нужно всего 4 шага. Исходный код и веса модели уже доступны на GitHub и Hugging Face, демо-версия доступна тут. analyticsindiamag.com ✔️ NVIDIA представила Project G-Assist: локальный ИИ-агент для геймеров. Компания NVIDIA анонсировала экспериментальный релиз Project G-Assist — ИИ-агента, использующего компактную языковую модель, которая обрабатывает голосовые или текстовые запросы, оптимизируя настройки игр, мониторинг производительности и даже управление подсветкой периферии от Logitech или Corsair. Всё работает оффлайн, без подписок и облачных серверов. Для разработчиков открыт доступ к GitHub-репозиторию: там есть шаблоны для создания плагинов, интеграции со Spotify, Twitch или Google Gemini. Технические требования — RTX 30/40/50 серии, 12 ГБ видеопамяти и свежие драйверы. nvidia.com ✔️ Роботы Figure 02 ходят почти как люди. Figure разработала революционный метод обучения человекоподобных роботов — кастомная end-to-end нейросеть на основе RL за несколько часов «прокачала» движения Figure 02 до уровня естественной человеческой походки. Все благодаря симулятору, где тысячи виртуальных роботов учились ходить по разным поверхностям, падать и реагировать на толчки. Ключевая фишка — перенос навыков из симуляции в реальность без доработок: помогли рандомизация параметров и мгновенная коррекция крутящего момента. Обещают, что уже скоро робот Helix на этой же базе сможет готовить и убираться. figure.ai ✔️ Apple планирует обучать ИИ на фото из Look Around в Apple Maps. Apple обновила раздел сайта, подтвердив использование снимков из Look Around (аналог Street View) для тренировки ИИ-моделей с марта 2025 года. Данные, собранные камерами на автомобилях и с переносных инсталляций (для пешеходных зон), включая 3D-карты, помогут улучшить распознавание изображений, генерацию контента и поиск в приложении «Фото». Для защиты приватности Apple блюрит лица и номера машин на фото, а также готова скрыть частные строения по запросу. Обучение моделей будет проводиться только с обработанными изображениями. Подробности о конкретных алгоритмах компания пока не раскрывает, возможно о них станет известно на WWDC 2025, который пройдет с 9 по 13 июня. 9to5mac.com ✔️ Tesla покажет своего робота Optimus представителям Капитолия. Tesla присоединится к симпозиуму по робототехнике в Капитолии, чтобы продемонстрировать своего человекоподобного робота Optimus конгрессменам и сотрудникам Белого дома. Мероприятие, организованное A3 Automate и Университетом Карнеги-Меллон. пройдёт в 26 марта в здании Cannon House Office. В приглашении Tesla подчеркивает, что робот позволит «заглянуть в будущее», и приглашает всех желающих оценить разработку. axios.com ✔️GROK Илона Маска — теперь официально в Telegram. Бесплатно для премиум юзеров Бот @ai_machinelearning_big_data #AI #ML #Research #NLP

296 271

✔️А что там OPENAI? На стриме показали редактор изображений для ChatGPT. Основные особенности: 🟢ChatGPT поддерживает генерацию видео через Sora(пока очень тормозит). 🟢Улучшенная генерация текста. Разработчики значительно повысили качество генераций текстовых элементов, теперь они получаются читаемыми и почти без ошибок. 🟢Модель показывает высокий уровень реализма, генератор может создавать изображения с точной передачей деталей, которые вы задаете в промпте. 🟢ИИ хорошо следует инструкциям. Вы можете попросить его изменить небольшие части изображения и Chatgpt пришлет картинку с запрошенными вами изменениям 🟢Поддержка прозрачного фона. Пользователи могут создавать изображения с прозрачным фоном, что особенно полезно для создания стикеров, логотипов и других графических элементов. 🟢Хорошо справляется с генерацией мемов, комиксов и других графических материалов. 📌 https://openai.com/index/introducing-4o-image-generation/ @ai_machinelearning_big_data #openai #imagegenerator #chatgpt

296 271

🌟 Вебинар AI-агенты на практике: глубоко и по существу ML инженер из Сбера проведет проведет открытый урок, посвящённый введению в AI-агентов. На выбинаре: ▶️Вам объяснят, что представляют собой агенты и чем они отличаются от LLM и чат-ботов. ▶️Разберут внутреннего устройства агентов. ▶️Расскажут об актуальных тенденций и значимых разработках в этой области. ▶️Проведут анализ возможностей и ограничений применения агентов в бизнесе. 🟡Практическая часть вебинара посвящена разработке собственного агента на LangGraph. Спикеры: 🟢Фёдор Азаров, ML-инженер Sber CIB; 🟢Александр Лыков, к.ф.-м.н. и руководитель ШВМ. Вебинар пройдет 26 марта в 18:15. Регистрируйтесь здесь 🟡А еще много полезного мл-контента и больше информации о вебинаре можно найти в Telegram-канале ШВМ.

296 271

Gemini 2.5 Pro теперь №1 в таблице лидеров Арены - это самый большой скачок в истории (+40 пт против Grok-3/GPT-4.5)! 🏆 Gemini 2.5 Pro #1 почти во ВСЕХ категориях, модель показывает результаты на уровне с Grok-3/GPT-4.5 в категориях «Hard Prompts» и «Coding», опредив всех остальных, заняв лидирующие позиции 🏇🏆 @ai_machinelearning_big_data #google #Gemini #areana

296 271

А вот и Gemini 2.5 Pro Experimental — самая интеллектуальная модель Google Без оптимизаций Gemini 2.5 Pro Experimental лидирует в таких математических и научных бнчмарках GPQA и AIME 2025. Модель опередила на бенчмарках Sonnet 3.5. 🌌 Мультимодальный контекст до 1 миллиона токенов — анализ текста, изображений, видео, аудио и PDF. 🛠️ Поддерживае: вызовы функций, структурированный вывод, поиск Google, запуск кода. Кроме того, модель набрала 18,8 % баллов на последнем экзамене человечества. 2.5 Pro уже появился у пользователей Advanced в GeminiApp. Просто выберите его в выпадающем списке моделей на десктопных и мобильных приложениях. Скоро она также будет доступна на GoogleCloud. 💡 Содержит актуальные знания до января 2025 года. 🚀 Лимиты: 2 RPM, 50 запросов в день (бесплатно). https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025/#gemini-2-5-pro Модель доступна в GoogleAI Studio → http://ai.dev @ai_machinelearning_big_data #google #Gemini

296 271

🖥 Некоторые реддиторы пишут, что уже получили доступ к Gemini 2.5 Pro, а пока мы ждем анонса, Google выкатили набор новых ИИ-моделей: TxGemma для ускорения разработки лекарств и проведения научных исследований в медицине: 🌟 TxGemma – это набор открытых моделей на базе Gemma, способных обрабатывать как обычный текст, так и структурированную медицинскую информацию (молекулы, химические соединения, белки). 🟢Модели доступны в трёх размерах: 2B, 9B и 27B. Каждый размер включает версию «predict», специально адаптированную для узких задач из Therapeutic Data Commons, например, для предсказания токсичности молекулы. Крупнейшая модель TxGemma (версия 27B predict) демонстрирует впечатляющие результаты. Она не только превосходит или примерно равна предыдущей SOTA(Tx-LLM) почти по всем задачам, но и соперничает или обходит многие модели, специально разработанные для узких медицинских областей. ✅ HF: https://huggingface.co/collections/google/txgemma-release-67dd92e931c857d15e4d1e87 #google #Gemma #drugdiscovery

296 271

Яндекс открывает новый сезон Тренировок по ML Смотрите лекции, решайте задачи, поднимайтесь в рейтинге. В третьем сезоне Тренировки по ML сосредоточатся на теме Computer Vision. Вас ждут 4 темы с контестами по 10 задач. Вы изучите не только классические методы компьютерного зрения, но и генеративные модели, локальные дескрипторы изображений, детекцию, сегментацию, контрастное предобучение и многое другое. Лучшие участники получат сертификат о прохождении Тренировок (нужно решить 20 из 40 задач), возможность пройти пробное техническое собеседование в Яндекс, проходку на топовый гик-фест о старте карьеры в IT Young Con и не только. Участники, которые хорошо себя проявят, получат возможность пройти ускоренный отбор на стажировку или сразу в штат компании. Подать заявку на Тренировки можно здесь.

296 271

🌟 Diffusion-4K – это новый инструмент для синтеза изображений в 4K. Модель text-to-image генерирует фотореалистичные изображения с высоким уровнем детализации и точно следует заданным промптам. Алгоритм синтеза изображений в рамках Diffusion-4K работает следующим образом: 🟢Обучение модели: Используется латентная диффузионная модель, такая как SD3-2B или Flux-12B, которая предварительно обучена на изображениях более низкого разрешения. 🟢Wavelet-based дообучение: Модель дообучается на 4K-изображениях с применением вейвлет-преобразования. Wavelet-based Fine-tuning – это метод, который использует вейвлет-преобразование для разложения данных (например, изображений) на составляющие с разными частотными характеристиками, после чего проводится дополнительное обучение модели с акцентом на восстановление высокочастотных деталей. Это позволяет модели фокусироваться на высокочастотных компонентах изображения, улучшая детализацию и качество синтезируемых изображений. 🟢Генерация изображений: После дообучения модель способна генерировать фотореалистичные 4K-изображения на основе текстовых описаний, обеспечивая высокую точность и соответствие заданным текстовым промптам. Алгоритм сочетает в себе предварительное обучение на низких разрешениях и специализированное дообучение на высококачественных 4K-изображениях и позволяет получать качественные генерации на выходе. Также разработчики выложили Aesthetic-4K – датасет на 10.2 GB отобранных вручную изображений с описаниями к ним, сгенерированными GPT-4o. 🟢 Github 🟢 Flux wavelet 🟢 Dataset 🟢 Статья @ai_machinelearning_big_data #ml #ai #4k #imagegenerator

296 271

🌟 NVIDIA выкатили MambaVision на Hugging Face — мощную гибридную модель, объединяющую Mamba и Transformers для задач компьютерного зрения. 🔹 Главные особенности: ▪ SOTA-производительность: превосходит существующие модели по точности (Top-1) и скорости обработки на ImageNet-1K. ▪ Гибридная архитектура: сочетает Mamba (State Space Models, SSMs) и архитектуру трансформеров, улучшая эффективность обработки изображений. ▪ Подходит для задач классификации изображений, извлечения признаков и других задач CV. MambaVision подойдет вам для автоматического анализа изображений, фильтрации данных и интеграции в AI-системы для компьютерного зрения. ✔️ MambaVision-L3-256-21K: https://huggingface.co/nvidia/MambaVision-L3-512-21K #nvidia #mamba #computervision

296 271

Скорее залетай в канал Лидеров цифровой трансформации, где скоро мы анонсируем старт самого масштабного международного хакатона страны. Также ты найдешь самые актуальные новости из мира ИТ, лучшие предложения от партнеров, полезные материалы для прокачки твоих скиллов. Ещё тебя ждёт супер-активное комьюнити, где ты сможешь найти единомышленников, крутые вакансии и многое другое.

296 271

✔️ Ant Group использует китайские чипы для снижения стоимости обучения моделей на 20% Ant Group успешно использовала хардверные решения от Alibaba и Huawei для обучения своих моделей, что позволило сократить затраты примерно на 20%. Результаты тестов показали, что китайские чипы сопоставимы по производительности с Nvidia H800. Хотя Ant Group пока полностью не отказывается от Nvidia для разработки ИИ, ее последние разработки в основном полагаются на альтернативные решения - AMD и чипы китайского производства. Это свидетельствует о том, что китайские компании ускоряют локализацию технологий искусственного интеллекта, чтобы сократить затраты и уменьшить зависимость от американских чипов. bloomberg.com ✔️ В Италии запущена первая в мире газета, созданная ChatGPT. Итальянская газета Il Foglio начала месячный эксперимент, опубликовав первый в мире газетный выпуск, сгенерированный искусственным интеллектом. Цель эксперимента - изучить влияние ИИ на журналистику, используя ChatGPT для создания контента. Редактор газеты Клаудио Сераса заявил, что ИИ использовался на всех этапах создания - от написания текстов и заголовков до цитат и резюме, при этом журналисты редакции участвуют в создании промптов для ИИ и проверке сгенерированных текстов. asianfin.com ✔️ ARC Prize запускает бенчмарк ARC-AGI-2 с призовым фондом в 1 миллион долларов. Команда ARC Prize запустила 2 этап бенчмарка ARC-AGI-2 для оценки «гибкости мышления» ИИ через задачи, которые человек решает за секунды, а алгоритмы — с трудом. Как и в прошлой версии, система проверяет способность к обобщению знаний, но теперь барьер выше: на нем базовые LLM набирают 0%, а продвинутые — меньше 4%. Призовой фонд бенчмарка -1 млн. долларов, главный приз получит разработка, которая сможет превысить 85% выполнения бенчмарка. Решение задач ARC-AGI-2 требует интуиции и адаптивности — того, что в людях заложено природой. «Это не тест на эрудицию, а проверка умения мыслить вне данных», — поясняют разработчики. arcprize.org ✔️ Поисковая система Atlantic позволит проверить, использовалась ли ваша работа для обучения моделей. Компания The Atlantic разработала поисковый инструмент, позволяющий пользователям проверить, не фигурирует ли их работа в LibGen - архиве книг, научных работ и статей, который, как сообщается, использовался для обучения популярных языковых моделей. Согласно судебным документам, набор данных LibGen использовался для обучения моделей Llama. OpenAI уже публично сообщила, что контент LibGen не включен в текущие версии ChatGPT или в API OpenAI. Другие компании, занимающиеся разработкой ИИ, пока не комментировали, использование LibGen в своем обучении. theatlantic.com ✔️ OceanDS: 1,8 млрд. данных об океане стали основой первой океанографической LLM. Китайская модель OceanDS, созданная для морских исследований, опирается на уникальную базу из 1,8 млрд токенов данных. В неё вошли оцифрованные научные работы, книги и отчёты — всё, что касается океана. По тестам OceanDS обходит топовые LLM в точности ответов на профильные запросы — разрыв достигает 25%. Это первый в мире ИИ, заточенный под океанографию. Уже сейчас его тестируют в управлении природными ресурсами Китая, а в будущем — внедрят в другие отрасли. news.cgtn.com @ai_machinelearning_big_data #AI #ML #Research #NLP

296 271

📌 72B слишком много для VLM? А 7B параметров недостаточно! QWEN только что выпустили новую модель на 32B параметров, Qwen2.5-VL-32B-Instruct. Эта модель представляет собой значительный прогресс для своего размера. И что самое лучшее, она лицензирована Apache 2. Модель выдает более подробные и структурированный ответы. 💡 Детальное понимание: превосходные возможности анализа изображений и визуальной логической дедукции. 📊 Превосходит сопоставимые модели, такие как Mistral-Small-3.1-24B и Gemma-3-27B-IT. 🚀 В нескольких тестах даже превосходит более крупный Qwen2-VL-72B-Instruct. Еще один крутой релиз понедельника! 🟢Блог: https://qwenlm.github.io/blog/qwen2.5-vl-32b/ 🟢Попробовать: https://chat.qwen.ai ВЧ: https://huggingface.co/Qwen/Qwen2.5-VL-32B-Instruct 🟢Модель: https://modelscope.cn/models/Qwen/Qwen2.5-VL-32B-Instruct @ai_machinelearning_big_data #AI #ML #LLM #Dataset #HuggingFace

296 271

💊 Свежее видео с роботами, выполняющими настоящие клинические работы. Для этого гуманоидного робота UnitreeRobotics G1 была разработана компексная система двуручного управления, включающая в себя систему отслеживание позы, продвинутые настройки захвата движений и контроллер для безопасного и точного манипулирования медицинскими инструментами. Робот тестируется для семи различных медицинских процедур, включая физические осмотры, экстренные вмешательства, точные задачи, требующие мелкой моторики и др. 🤖 Очень скоро роботизированные врачи заполнят больницы На видео робот управляется оператором дистанционно, автономность это следующий этап развития! В будущем у каждого будет свой личный врач 💉 #robotics #engineering #technology #robots

296 271

⚡️ DeepSeek V3 strikes again! На HF Появилась новая версия DeepSeek v3. Еще Deepseek обновили свое приложение. Страданиям OPENAI не будет конца 😂 ~700GB, Лицензирование: mit, тестим тут. Вы можете запустить его на компьютере M3 Mac Studio с 512 ГБ памяти, ( ~10 000 долларов) если используете квантованную версию на 352 ГБ через MLX. 🟡 HF :https://huggingface.co/deepseek-ai/DeepSeek-V3-0324/tree/main @ai_machinelearning_big_data #deepseek

296 271

🔥 LayerAnimate — метод, позволяющий управлять отдельными слоями видео, меняя элементы переднего и заднего плана. В отличие от существующих методов, которые рассматривают анимацию как единое целое, LayerAnimate предоставляет точечный контроль над каждым слоем, что делает процесс генераций более гибким и управляемым. ❓ Как это работает? LayerAnimate решает проблему ограниченности данных, с помощью конвейера обработки данных, включающего: 🟢Автоматизированную сегментацию элементов для разделения анимации на слои. 🟢Иерархическое слияние состояний движения для упрощения управления кадрами сцены. 🟢Улучшение согласованности движения для создания плавных и реалистичных анимаций. Модель позволяет переключаться между различными статическими изображениями или динамическими видео без влияния на анимацию переднего плана. Особенно интересно выглядит image-video с использованием скетча, вместо текстового описания с данными о движении, можно использовать набросок с траекторией движения сцены и получить готовую сцену. Мастхэв для тех, кто работает с анимацией. Больше примеров можно посмотреть здесь. 🟡Github 🟡Статья 🟡Проект @ai_machinelearning_big_data #videogenerator #video #ai #ml #opensource