Machinelearning

Open in Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Network:Machinelearning Russia1 276 Technologies & Applications332...

📈 Analytical overview of Telegram channel Machinelearning

Channel Machinelearning (@ai_machinelearning_big_data) in the Russian language segment is an active participant. Currently, the community unites 295 804 subscribers, ranking 332 in the Technologies & Applications category and 1 276 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 295 804 subscribers.

According to the latest data from 22 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -6 276 over the last 30 days and by -223 over the last 24 hours, overall reach remains high.

Verification status: Not verified
Engagement rate (ER): The average audience engagement rate is 8.09%. Within the first 24 hours after publication, content typically collects 5.69% reactions from the total number of subscribers.
Post reach: On average, each post receives 23 927 views. Within the first day, a publication typically gains 16 831 views.
Reactions and interaction: The audience actively supports content: the average number of reactions per post is 193.
Thematic interests: Content is focused on key topics such as openai, claude, api, gemini, контекст.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

Thanks to the high frequency of updates (latest data received on 23 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

295 804

Subscribers

-22324 hours

-1 4447 days

-6 27630 days

23 927

Post views

~ 16 83124 hours

~ 18 91548 hours

8.09%

Engagement rate

~ 5

Posts per day

Ads index

beta

Posts Archive

295 723

А ничего тот факт, что Сбер приглашает тебя на One Day Offer для DS/ML/DE специалистов? 😏 Ты будешь работать над рекомендательной платформой: масштабируемой, способной каждый день удивлять пользователей и предлагать им релевантные рекомендации. Добавляй в свой календарь 26 апреля, регистрируйся по ссылке и готовься пройти отбор в команду мечты за один день!

295 723

📌Обучение с подкреплением: как языковые модели учатся рассуждать. Объемная и интересная статья Sebastian Raschka, автора книги "Build a Large Language Model From Scratch" о тенденциях и проблемах современных методов обучения LLM через призму RL. В мире LLM последние месяцы стали переломными. Релизы GPT-4.5 и Llama 4, вопреки ожиданиям, не вызвали ажиотажа — все потому, что эти модели остались «классическими», без продвинутых методов обучения для рассуждений. Их конкуренты - xAI и Anthropic уже добавили кнопки «расширенного мышления», а OpenAI представила o3 — модель, где упор сделан на стратегическое применение вычислений через обучение с подкреплением. Становится ясно: масштабирование данных и параметров почти исчерпало себя, и будущее за RL. Основной инструмент RLHF (обучение с подкреплением на основе человеческой обратной связи) давно используется для настройки LLM под предпочтения людей. Но для задач, требующих логики, этого недостаточно. Здесь на сцену выходит GRPO — модификация алгоритма PPO, которая экономит ресурсы, убирая «критика» (модель оценки вознаграждения). Так создавалась DeepSeek-R1-Zero, ее обучали вообще без этапа SFT, используя только автоматические проверки ответов. Если математическая задача решена верно, модель получает «плюс», если нет — «минус». Такой подход не только дешевле, но и снижает риск «обмана» модели (reward hacking). Но и RL — не панацея. Исследования показывают, что PPO и GRPO неявно поощряют длинные ответы, даже если те ошибочны. Например, при отрицательном вознаграждении штраф распределяется по токенам, и модель учится растягивать текст, чтобы смягчить наказание. Решения уже есть: одни команды вводят штрафы за длину, другие меняют расчет преимуществ. А модель L1 от Kaggle и вовсе позволяет пользователям задавать желаемую длину ответа, балансируя между точностью и затратами. Способность к рассуждениям может возникать и без RL. DeepSeek V3 демонстрирует мыслительные «озарения», хотя ее не обучали специально. Этот факт всерьез ставит под вопрос исключительную роль RL — возможно, все дело в данных, где уже есть цепочки логических шагов. Тем не менее, RL усиливает эти способности: модели начинают самокорректироваться, использовать внешние инструменты (калькуляторы, поиск) и даже переносить навыки между доменами — от математики до медицины. Некоторые заявления о прогрессе оказались преувеличены: улучшения на мелких моделях часто нестабильны, а результаты зависят от случайных факторов вроде выбора сида. Кроме того, RL требует внушительных ресурсов (o3 от OpenAI потратила при обучении в 10 раз больше вычислений, чем предыдущая версия) В итоге, RL остается ключевым направлением, но важно избегать «эйфории». Сочетание RL с автоматической проверкой ответов, контроль длины и гибридные подходы (как в DeepSeek-R1) — вот что приближает нас к моделям, которые не просто генерируют текст, а действительно думают. 🔜 Читать статью в оригинале @ai_machinelearning_big_data #AI #ML #LLM #RL

295 723

Учите машины учиться? Тогда вам на IML 🗓️16–17 мая 📍 Питер + онлайн IML — конференция для всех, кто использует ML в проектах. Здесь собираются ML-инженеры, дата-сайентисты, исследователи, аналитики и разработчики. В этот раз вас ждет двухдневный технологический хардкор об NLP, RecSys, MLOps и Computer Vision. С докладами выступят спикеры из Яндекса, Positive Technologies, Т-Банка, Точки и других известных компаний. А вот что с билетами: → Дают скидку 15% на билет для частных лиц по промокоду MACHINELEARNING → Есть билет для студентов и преподавателей вузов — в два раза дешевле персонального → Можно попросить руководство приобрести корпоративный билет Бонус: в соседних залах пройдет Python-конференция PiterPy. Участники IML смогут послушать доклады PiterPy бесплатно. За подробностями и билетами

295 723

🌟 HunyuanPortrait Новая технология от Hunyuan, превращающая статичные изображения в реалистичную анимацию с беспрецедентной чёткостью и стабильностью! 🆕 Что нового? 1⃣ Статичное изображение превращается → живое видео 2⃣ Высокая реалистичность: Implicit Control + Stable Video Diffusion 3⃣ Плавность и сверхчёткая детализация в анимации лица и головы Легко адаптируется под любые стили изображений. Анимация создается по одному фото, нужен только видео-референс в качестве шаблона для генерации. ✅ Работает в один клик ✅ Синхронные мимика и движения головы ✅ Сохраняется черте даже при смене стиля 🟡 Проект 🟡 ArXiv 🟡Github (Коммент от разработчиков - проходим внутреннюю проверку перед открытым исходным релизом и загрузим код и веса сразу после её завершения.) #Hunyuan

295 723

✔️ o3 и o4-mini могут определять местоположение на фотографиях. Пользователи ChatGPT применяют новые возможности анализа изображений o3 и o4-mini для определения местоположения, изображенного на фотографиях. Модели позволяют проводить детальный визуальный анализ изображений, чтобы определить местоположение на основе визуальных признаков без метаданных. Тенденция, набирающая популярность в соцсетях, заключается в том, что пользователи загружают фотографии в ChatGPT и предлагают ИИ сыграть в игру, похожую на GeoGuessr, где он угадывает местоположение по изображению. Способность ИИ точно определять местоположение вызывает тревогу по поводу возможного злоупотребления и риска домогательства к людям через их фото в социальных сетях. techradar.com ✔️ Google Gemma 3 QAT: мощный ИИ теперь на домашних GPU. Google представила Gemma 3 QAT — новое поколение открытых моделей с квантованием, которое позволяет запускать их на обычных GPU. Благодаря Quantization-Aware Training (QAT) параметры моделей сжимаются в 4 раза (до 4 бит) без серьезной потери качества. Например, 27B-версия занимает всего 14 ГБ памяти вместо 54 ГБ, что делает ее доступной для RTX 3090, 12B работает на ноутбучных GPU RTX 4060, а компактные 4B и 1B версии — даже на смартфонах. Модели совместимы с Ollama, LM Studio, MLX для Apple Silicon и llama.cpp. На Hugging Face и Kaggle доступны квантованные варианты в форматах Q4_0 и int4. developers.googleblog.com ✔️ Netflix тестирует ИИ-поиск, который подбирает контент по настроению. Netflix экспериментирует с новой функцией поиска на базе OpenAI, способной понимать естественный язык. Вместо стандартных запросов по жанрам или актерам пользователи смогут искать контент, описывая свое настроение или конкретные предпочтения простыми словами, например, «фильмы для грустного вечера». Тест запущен в Австралии и Новой Зеландии для iOS-устройств, а в ближайшие месяцы дойдет до США. macrumors.com ✔️ IBM представила серию моделей Granite 3.3 с распознаванием речи. IBM выпустила новое поколение моделей Granite 3.3, в котором нибольший интерес представляет Granite Speech 3.3 8B — компактная система для преобразования речи в текст (ASR) и перевода (AST). Модель, построенная на базе Instruct 8B, показала повышенную точность и меньшее количество ошибок в транскрипции, обгоняя даже закрытые аналоги вроде GPT-4o и Gemini 2.0 Flash. В опенсорс опубликованы версии 8B и 2B, которые можно дорабатывать под конкретные задачи. Granite Speech поддерживает перевод с английского на 7 языков, а для интеграции RAG-функций IBM выпустила LoRA-адаптеры в рамках проекта Granite Experiments на Hugging Face. Пока аудиоэнкодер работает только с английским, но в планах — мультиязычная поддержка, улучшение качества данных и добавление распознавания эмоций в речи. Параллельно компания уже тренирует Granite 4.0 с увеличенной скоростью и длиной контекста. ibm.com ✔️ Together AI выпустила Open Deep Research, инструмент для структурированного анализа данных в вебе. Together AI представила Open Deep Research — фреймворк для многошагового веб-поиска с открытым кодом. В отличие от обычных поисковиков, инструмент генерирует структурированные отчеты с цитатами, а не списки ссылок. Архитектура системы прозрачна: код, датасеты и модели доступны всем, а в основе — решения от Alibaba, Llama и DeepSeek. Работает инструмент в 4 этапа: планирование, сбор данных через API Tavily, проверка и формирование ответа. Готовые отчtты выводятся в HTML с графиками (Mermaid JS) и иллюстрациями, созданными в Flux. Есть даже режим подкаста — текст озвучивается моделями Cartesia’s Sonic. Together AI сделала систему модульной — разработчики могут менять модели, источники данных или добавлять форматы. together.ai @ai_machinelearning_big_data #news #ai #ml

295 723

🔥 Google представила InstructPipe — AI‑редактор ML‑пайплайнов, работающий через текстовые запросы. ❔ Что такое InstructPipe? InstructPipe — это AI-ассистент, который преобразует текстовые команды в визуальные блок-схемы, представляющие собой пайплайны машинного обучения. Система использует два модуля больших языковых моделей (LLM) и интерпретатор кода для генерации псевдокода и его визуализации в редакторе графов. Это low-code подход: вы просто соединяете готовые компоненты (ноды) без написания кодп. 🌟 Как это работает? 1️⃣Пользователь вводит текстовую инструкцию, описывающую желаемый пайплайн. 2️⃣ LLM модули обрабатывают инструкцию и генерируют соответствующий псевдокод. 3️⃣Интерпретатор кода преобразует псевдокод в визуальную блок-схему, которую можно редактировать и настраивать. ✔️ Преимущества InstructPipe 🟡 Доступность: Позволяет новичкам в программировании создавать сложные ML пайплайны без необходимости писать код. 🟡Гибкость: Принимает на выход текстовое описание в любом виде, нет строго формата. 🟡Снижение порога входа: Упрощает процесс обучения и прототипирования мл проектов. 🔜 Подробнее @ai_machinelearning_big_data #Google #InstructPipe

295 723

🔥 Kaggle и Google выпустили мини-курс генеративному ИИ! С 31 марта по 4 апреля 2025 года на Kaggle прошел ряд интенсивов по генеративному ИИ, теперь все материалы с доступны для самостоятельного обучения. ✔️ Что внутри: 🟡День 1: Основы генеративного ИИ и инженерия промптов Изучите эволюцию больших языковых моделей (LLM), от трансформеров до методов ускорения инференса. Описание техник создания эффективных промптов для взаимодействия с ИИ. 🟡День 2: Интеграция с API и практическое применение Вы научитесь использовать API LLM, для создания интерактивных приложений. Реализуйте проекты с использованием Retrieval-Augmented Generation (RAG) и семантического поиска. 🟡День 3: Работа с векторными базами данных Настройте векторные базы данных для эффективного хранения и поиска информации. Примените эмбеддинги для улучшения качества генерации текста. 🟡День 4: Создание персонализированных ИИ-ассистентов Разработайте персонализированных ИИ-ассистентов, способных отвечать на сложные запросы. Используйте передовые методы генерации для создания реалистичных диалогов. 🟡День 5: Проект Примените полученные знания в финальном проекте, продемонстрировав свои навыки в области генеративного ИИ. 🧠 Примеры проектов: - AI Health Assistant: - Персонализированный медицинский помощник, использующий RAG и семантический поиск для предоставления точной информации. Kaggle - NewsGenius AI: Интеллектуальный агрегатор новостей, анализирующий и обобщающий актуальные события. 🔗 Курс

295 723

Большие языковые модели (LLM) — это не будущее, а настоящее бизнеса. Пока одни спорят, заменит ли ИИ людей, другие уже активно внедряют его в процессы. В МТС тоже прошли этот путь и уже внедрили LLM в 30 продуктов экосистемы, а теперь превратили опыт в готовую платформу, которая позволяет тестировать языковые модели. На вебинаре эксперты MWS расскажут, почему разработка платформы для инференса LLM с нуля не всегда лучший выбор и как MWS GPT может упростить и ускорить работу с большими языковыми моделями. А еще обсудим: 🔴Что нужно для построения надёжной промышленной платформы для инференса LLM 🔴Какие специалисты требуются для создания такой платформы 🔴Как развивалась платформа внутри МТС 🔴Какие подводные камни возникают при создании собственной платформы для инференса LLM 🔗 Регистрируйтесь и приходите на эфир! 🎁 Задавайте вопросы в чате трансляции — за лучший вопрос будет подарок от команды!

295 723

⚡️ FAIR опубликовала новые инструменты для восприятия и взаимодействия ИИ с миром. Команда Fundamental AI Research (FAIR) компании Марка Цукерберга представила серию новых разработок: методики и модели, улучшающие компьютерное зрение, 3D-локализацию объектов и совместное обучение языковых агентов. Все модели, техотчеты, датасеты и код этих проектов уже доступны на платформах Hugging Face и GitHub. 🔜 Perception Encoder: «Глаза» для ИИ нового поколения Perception Encoder - новый виток развития в сфере обработки визуальной информации. Модель, обученная с помощью этой методики на масштабных данных, превосходит аналоги в задачах классификации изображений и видео, включая сложные сценарии — распознавание ската, зарывшегося в морское дно, или крошечной птицы на заднем плане снимка. Благодаря интеграции с LLM, Encoder улучшает ответы на визуальные вопросы, описание сцен и понимание пространственных отношений между объектами. 🟡Модель 🖥Github🟡Датасет🟡Техотчет 🔜 Perception Language Model: Расширенное понимание задач визуального восприятия. Для задач, требующих анализа видео и текста, Meta выпустила Perception Language Model (PLM). Ее обучали на 2,5 млн. новых аннотированных видеозаписей — это крупнейший датасет для понимания действий и контекста в динамике. PLM доступна в трёх вариантах (1, 3 и 8 млрд параметров). Дополнительный бонус — PLM-VideoBench, бенчмарк для оценки тонкого понимания сцен, который заполняет пробелы существующих тестов. 🟡Модель 🖥GitHub 🟡Датасет 🟡Техотчет 🔜 Locate 3D: Роботы учатся «слышать» запросы. Как заставить робот найти красную чашку на столе или вазу возле телевизора? Locate 3D решает эту задачу через анализ 3D-точечных облаков и текстовых подсказок. Модель учитывает пространственные связи и контекст, отличая «вазу у TV» от «вазы на столе». В основе — трехэтапный пайплайн: предобработка данных, кодирование 3D-сцены и декодирование запроса. Для обучения использовали 130 тыс. аннотаций из ARKitScenes и ScanNet, что вдвое увеличило объём доступных данных для локализации объектов. 🟡Модель 🟡Демо 🟡Датасет 🟡Техотчет 🔜 Dynamic Byte Latent Transformer: Эффективность без токенизации. Dynamic Byte Latent Transformer - архитектура, которая работает на уровне байтов, а не токенов, что повышает устойчивость к ошибкам, ускоряет обработку и "отменяет" необходимость токенизации для масштабирования. На тесте CUTE модель показывает преимущество в +55 пунктов против традиционных подходов. 🟡Модель 🖥GitHub 🟡Техотчет 🔜 Collaborative Reasoner: ИИ-агенты учатся работать в команде. Совместное решение задач — следующий этап развития ИИ. Collaborative Reasoner — это фреймворк, где два агента ведут диалог, чтобы прийти к общему решению. Они могут спорить, аргументировать и согласовывать ответы на сложные вопросы. Для обучения используют синтетические диалоги, которые генерирует сама модель. Результаты впечатляют: на некоторых задачах совместная работа даёт прирост эффективности до 29% по сравнению с одиночным агентом. 🖥GitHub 🟡Техотчет 🟢Статья @ai_machinelearning_big_data #AI #ML #LLM #CV #NLP #FAIR

295 723

Что лучше: получить 500 000 ₽ или пропуск в одно из крупнейших сообществ web3-энтузиастов и блокчейн-разработчиков? 😏 Победители блокчейн-хакатона DeFi Hack 2025 получат и то и другое. Для этого нужно только решить реальную бизнес-задачу Сбера и предложить лучшее инновационное решение. 🏆 Призовой фонд хакатона в 1 000 000 ₽ разделят между собой 3 участника/команды: 500 000 ₽, 300 000 ₽ и 200 000 ₽. Приём заявок продлится до 12 мая — успейте собрать команду до 5 человек или принять участие соло! 👌

295 723

🌟 InstantCharacter — новый фреймворк от Hunyuan (Tencent) для стилизации любых персонажей. Традиционные методы файн‑тюнинга моделей под конкретный образ персонажа обычно либо: 💬 деградируют качество генерации при сохранении идентичности (UNet‑подходы), 💬 либо требуют отдельного, ресурсоёмкого обучения для каждого персонажа InstantCharacter решает обе проблемы сразу: Высокое качество - Построен на базе DiT-моделей, которые по качеству превосходят классические UNet‑архитектуры. 🔥 Гибкая персонализация. Китайцы настроили адаптер с каскадными энкодерами‑трансформерами, который модулирует признаки персонажа и взаимодействует с латентным пространством DiT. ✔️ Масштабируемость Фреймворк обучен и на огромном датасете - более 10 миллионов примеров, поделённых на парные и непарные (текст+изображение) подмножества. Трёхэтапное обучение: 🟢Предварительное обучение на низком разрешении без пар. 🟢Дообучениена парных примерах для консистентности. 🟢Финальная донастройка для текстового управления генерациями. Результаты: 🟢на демке выдает высокое качество, персонажи плавно меняют стили и позы. 🟢высокая консистентность и сохранение мелких деталей персонажа. 🟢легко управляется промптами без потери качества. В сравнении с предыдущими подходами InstantCharacter задает высокую планку качества в задачах character-driven image generation. 🔜Попробуйте демку 🔜Project 🔜Аrxiv 🔜Github @ai_machinelearning_big_data #Hunyuan #Tencent #InstantCharacter #OpenSource #AI #CharacterCustomization

295 723

🌟 Школа аналитиков данных от Big Data MWS признана лучшим образовательным проектом в области Data Science О победе в премии «Data Fusion Awards 2025» в номинации «Data Fusion в образовании» сообщает МТС. Награда досталась проекту «Школа аналитиков данных», который уже три года успешно готовит специалистов в сфере Data Science. Программа включает углубленное изучение Python, основы классического машинного обучения и методы создания ML-моделей для различных отраслей: геоаналитики, рекламы и финтеха. Обучение проходит через онлайн-вебинары, домашние задания и итоговые проекты под руководством экспертов центра Big Data MWS. Курс бесплатен и открыт для всех — от школьников до опытных IT-специалистов. За 10 месяцев обучения студенты получают практические навыки и теоретические знания уровня Junior, необходимые для успешного старта карьеры. На третий поток поступило почти 5 тысяч заявок, а многие выпускники уже работают в Big Data MWS. @ai_machinelearning_big_data

295 723

15 бесплатных книг по Data Science (часть 1)* 1. *Veridical Data Science* 👩‍🔬 Авторы: Bin Yu & Rebecca L. Barter Описание: Фреймворк PCS для интерпретируемого анализа данных. 🔗 https://vdsbook.com/ 2. *Data Science: Theories, Models, Algorithms, and Analytics* 📘 Автор: Sanjiv Ranjan Das Описание: Учебник по DS с упором на алгоритмы и аналитику. 🔗 https://srdas.github.io/Papers/DSA_Book.pdf 3. *Think Python 3E* 🐍 Автор: Allen B. Downey Описание: Современное введение в Python с нуля. 🔗 https://greenteapress.com/wp/think-python-3rd-edition/ 4. *Python Data Science Handbook* 📊 Автор: Jake VanderPlas Описание: Практика работы с NumPy, pandas, sklearn и визуализациями. 🔗 https://jakevdp.github.io/PythonDataScienceHandbook/ 5. *R for Data Science* 📈 Авторы: Hadley Wickham и др. Описание: Современный подход к анализу данных в R. 🔗 https://r4ds.hadley.nz/ 6. *Think Stats 3E* 📐 Автор: Allen B. Downey Описание: Статистика через Python и практику. 🔗 https://allendowney.github.io/ThinkStats/ 7. *Statistics and Prediction Algorithms Through Case Studies* 📙 Автор: Rafael A. Irizarry Описание: Кейсы по статистике и прогнозированию с кодом на R. 🔗 https://rafalab.github.io/dsbook/ 8. *Bayesian Methods for Hackers* 🧠 Автор: Cameron Davidson-Pilon Описание: Визуальное введение в байесовский анализ с PyMC. 🔗 https://github.com/CamDavidsonPilon/Probabilistic-Programming-and-Bayesian-Methods-for-Hackers 9. *Think Bayes 2E* 🔢 Автор: Allen B. Downey Описание: Пошаговый байесовский подход на Python. 🔗 https://allendowney.github.io/ThinkBayes2/ 10. *Data Science at the Command Line* 💻 Автор: Jeroen Janssens Описание: Unix-инструменты как основа для анализа данных. 🔗 https://datascienceatthecommandline.com/ Математика и теория вероятностей: 11. Теория вероятностей 👩‍🔬 Автор: Чернова Н. И. Описание: Понятное введение в теорию вероятностей, основа для изучения математической статистики. 🔗 http://www.nsu.ru/mmf/tvims/chernova/tv/tv_nsu07.pdf 12. * Математическая статистика* 👩‍🔬 Автор: Чернова Н. И. Описание: Продолжение курса по теории вероятностей (НГУ), покрывающее основы математической статистики: оценки параметров, проверка гипотез, регрессионный анализ. 🔗 http://www.nsu.ru/mmf/tvims/chernova/ms/ms_nsu07.pdf 13. * Курс дифференциального и интегрального исчисления (Том 1)* 👩‍🔬 Автор: Фихтенгольц Г. М. Описание: Фундаментальный и классический учебник по основам математического анализа. 🔗 http://math.ru/lib/book/djvu/fichtengolz/f_1.djvu 14.*Векторные исчисления для инженеров* 👩‍🔬 Автор:Jeffrey R. Chasnov 🔗 http://math.ru/lib/book/djvu/fichtengolz/f_1.djvu 15 .*Theory—Theoretical & Mathematical Foundations ; 👩‍🔬Daniel A. Roberts, Sho Yaida, Boris Hanin 🔗https://arxiv.org/abs/2106.10165 📘 Еще больше книг здесь @ai_machinelearning_big_data #books #opensource #freebooks

295 723

✔️ Tesla показала суперкомпьютер Dojo. Tesla опубликовала изображения своего суперкомпьютера Dojo - системы, созданной на заказ для обучения ИИ-моделей проекта полного автономного вождения (FSD). Фото были опубликованы 17 апреля не случайно - это совпало с недавним заявлением Илона Маска о расширении крупного вычислительного кластера в Giga Texas. Dojo полностью работает на чипах, разработанных Tesla. TeslaAI в Х (ex-Twitter) ✔️ Chatbot Arena трансформируется в отдельную компанию Arena Intelligence Inc. Популярная платформа для оценки ИИ-моделей Chatbot Arena, которую используют ведущие лаборатории ИИ, официально становится компанией Arena Intelligence Inc. Это позволит команде расширить ресурсы для развития сервиса, сохранив нейтралитет тестирования. Проект, запущенный в 2023 году исследователями из UC Berkeley, давно стал ключевым инструментом для сравнения языковых моделей — его рейтинги влияют на маркетинг и развитие ИИ. До сих пор Chatbot Arena работала на грантах и спонсорской поддержке от Kaggle, Google, Andreessen Horowitz и Together AI. bloomberg.com ✔️ Anthropic инвестирует 1 млн. долларов в Goodfire. Anthropic впервые инвестировала в стартап, поддержав Goodfire. Инвестиционный раунд, возглавляемый Menlo Ventures, собрал в общей сложности 50 миллионов долларов, а Anthropic внесла 1 миллион долларов. Goodfire специализируется на механистической интерпретации - методе, который помогает разработчикам понять, как работают системы ИИ, причем методы Goodfire считается более продвинутым, чем существующие инструменты, используемые Anthropic. theinformation.com ✔️ Википедия выпустила датасет для обучения ИИ. Википедия представила структурированный датасет на платформе Kaggle, чтобы облегчить разработчикам ИИ доступ к данным и снизить нагрузку на свою инфраструктуру. Вместо парсинга сырого текста ботамы, теперь доступны JSON-файлы на английском и французском языках с разделами статей, краткими описаниями, инфобоксами и ссылками на изображения. Датасет оптимизирован для ML-задач: файнтюна моделей, анализа и тестирования. Это часть стратегии Викимедии, которая не только экономит ресурсы Википедии, но и упрощает работу с контентом — вместо борьбы с ботами разработчики получают готовый инструмент. enterprise.wikimedia.com ✔️ Количество полностью сгенерированной ИИ-музыки выросло в 2 раза на платформе Deezer. Deezer, французский музыкальный стриминговый сервис, сообщил, что около 18 % песен, загружаемых на его платформу, создаются ИИ. Этот показатель непрерывно растет: ежедневно на платформу загружается около 20 000 композиций, созданных искусственным интеллектом, что почти вдвое больше, чем 4 месяца назад. Deezer внедрил инструмент обнаружения ИИ для выявления музыки, созданной с помощью Suno и Udio в январе 2025 года, когда ежедневное количество загружаемых песен, созданных ИИ, составляло около 10 000. billboard.com @ai_machinelearning_big_data #news #ai #ml

295 723

🔥 Google только что выпустил Gemini 2.5 Flash Ключевые особенности: В 25 раз дешевле, чем Claude Sonnet 3.7 и Grok-3 и в 5–10 раз дешевле, чем Gemini‑2.5‑Pro Новая функция динамического «размышления» над сложными задачами. Настраиваемый «бюджет мышления» (вы сами решаете, сколько токенов выделить на этап «размышлений») Занимает #2, место на Арене, сравнявшись с GPT 4.5 Preview и Grok‑3. 🏆 Разделил первое место в задачах Hard Prompts, Coding и Longer Query 💠 Вошёл в топ‑4 по всем категориям @ai_machinelearning_big_data #Gemini

295 723

🔥 Wan2.1‑FLF2V 14B — это первая в серии модель, которая работает генерации видео по принципу «First‑Last‑Frame»: достаточно задать начальный и конечный кадры, чтобы сгенерировать полноценный плавный плавный ролик. ✔️ Главное 🟢 Открытые код и веса. 🟢Полный контроль над сюжетом и композицией видео. 🟢 Точное следование инструкциям: модель умеет очень чётко. «понимать» промпты и визуальные референсы. 🟢Плавные переходы с учётом физики: кадры переходят друг в друга без рывков, с реалистичной трактовкой законов движения и освещения. 🟢 Качество 720 p: готовый не требует дополнительной пост‑обработки. 🔜GitHub: https://github.com/Wan-Video/Wan2.1 🔜Hugging Face: https://huggingface.co/Wan-AI/Wan2.1-FLF2V-14B-720P 🔜Modelscope: https://modelscope.cn/models/Wan-AI/Wan2.1-FLF2V-14B-720P @ai_machinelearning_big_data #wan #AIGC #alart

295 723

Cloud․ru представил первый в России управляемый сервис для инференса больших языковых моделей в облаке с разделением GPU Главные преимущества:

1️⃣ Shared GPU — вы можете разделять GPU-ресурсы и потреблять то количество vRAM (видеопамяти), которое необходимо для эффективной работы самой модели без задержек. Можно динамически перераспределять ресурсы в зависимости от текущих потребностей. 2️⃣ Простота и гибкость управления сервисом дают возможность, как запускать модели как напрямую из Hugging Face, так и запускать собственные образы со своим окружением. 3️⃣ Высокая степень адаптации и рациональное использование доступных ресурсов: на одной видеокарте можно одновременно запускать несколько моделей. 4️⃣ Режим скайлирования — тарификация за использование модели начинается только в момент обращения к ней.

Evolution ML Inference подойдет для тех, кто разрабатывает AI- и ML-решения и хочет быстро и с минимальными затратами запустить собственную ML-модель. Это полностью управляемый сервис — пользователь только настраивает конфигурацию, модель и тип масштабирования. Cloud․ru предоставляет доступ к мощным графическим процессорам, а также выполняет полное администрирование и обслуживание инфраструктуры.

295 723

🌟 FramePack — этоFramePack — это надстройка над любым «next‑frame prediction» видеодиффузором, которая превращает работу с длинными роликами в задачу постоянной, а не растущей стоимости Модель поэтапно предсказывает следующий кадр или блок кадров, обеспечивая плавную и контролируемую генерацию. FramePack позволяет создавать видео длиной 60 секунд+ Вместо того чтобы хранить полный контекст, он выделяет каждому кадру разное число патч‑токенов и держит их общее количество фиксированным. Благодаря этому вычислительная нагрузка остаётся O(1) по длине ролика, а значит даже 13‑B модель может генерировать тысячи кадров на обычной GPU. Выбор, каким кадрам сколько «места» выделять, задаётся расписанием (FramePack Scheduling): линейное, экспоненциальное, равномерное или кастомное. Меняя его, можно, например, сделать первый кадр самым детальным для задач image‑to‑video или отдавать приоритет последним. Дополнительно двусторонняя sampling‑схема (способ генерации кадров, при котором модель смотрит не только «в прошлое», но и в будущее, чередуя прямой и обратный проходы по временной оси.) уменьшает накопление ошибок, поэтому качество не падает даже на минутных видео. 🔥Особенности: 🟢Заявленный минимальный объём GPU: всего 6 GB для генерации 1‑минутного видео @30 fps (1800 кадров) на 13 B модели, что позволяет запускать её даже на ноутбучных GPU .🟢Скорость генерации (RTX 4090): ~2.5 с/кадр без оптимизаций ~1.5 с/кадр с TeaCache 🟢Контекст фиксированной длины: накладные расходы (память и время) не растут при увеличении числа кадров — сложность остаётся O(1) по длине видео. Эти метрики делают FramePack одним из самых практичных решений для генерации видео даже на слабом железе. 🔜Project Page：https://lllyasviel.github.io/frame_pack_gitpage/ 🔜Paper：https://lllyasviel.github.io/frame_pack_gitpage/pack.pdf 🔜Code：https://github.com/lllyasviel/FramePack @ai_machinelearning_big_data

295 723

🌟 FramePack — генерация видео по кадрам с моментальной визуализацией FramePack — это свежая реализация next-frame prediction, позволяющая создавать длинные видео (до 60 секунд и больше) с мгновенной обратной связью. Модель поэтапно предсказывает следующий кадр или блок кадров, обеспечивая плавную и контролируемую генерацию. 🧠 Особенности: • Видео как картинки — результат видно сразу • Большие модели работают даже на 6 GB GPU • Контекст фиксированной длины, скорость не падает • Поддержка Flash/xFormers/SageAttention 🚀 Поддержка GUI на Gradio. Можно быстро протестировать свои промпты или использовать встроенные пресеты. 🔜Project Page：https://lllyasviel.github.io/frame_pack_gitpage/ 🔜Paper：https://lllyasviel.github.io/frame_pack_gitpage/pack.pdf 🔜Code：https://github.com/lllyasviel/FramePack @ai_machinelearning_big_data