Machinelearning

Open in Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Network:Machinelearning Russia1 262 Technologies & Applications326...

📈 Analytical overview of Telegram channel Machinelearning

Channel Machinelearning (@ai_machinelearning_big_data) in the Russian language segment is an active participant. Currently, the community unites 297 311 subscribers, ranking 326 in the Technologies & Applications category and 1 262 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 297 311 subscribers.

According to the latest data from 15 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -6 639 over the last 30 days and by -229 over the last 24 hours, overall reach remains high.

Verification status: Not verified
Engagement rate (ER): The average audience engagement rate is 8.06%. Within the first 24 hours after publication, content typically collects 5.69% reactions from the total number of subscribers.
Post reach: On average, each post receives 23 972 views. Within the first day, a publication typically gains 16 925 views.
Reactions and interaction: The audience actively supports content: the average number of reactions per post is 186.
Thematic interests: Content is focused on key topics such as openai, claude, api, gemini, контекст.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

Thanks to the high frequency of updates (latest data received on 16 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

297 311

Subscribers

-22924 hours

-1 4417 days

-6 63930 days

23 972

Post views

~ 16 92524 hours

~ 18 98848 hours

8.06%

Engagement rate

~ 6

Posts per day

Ads index

beta

Posts Archive

297 251

🌟 MiniCPM-V 4.5: компактная модель, которая бьет гигантов в мультимодальном ИИ. Проект OpenBMB выпустил MiniCPM-V 4.5, мультимодальную модель на основе Qwen3-8B и SigLIP2-400M для распознавания изображений, серий изображений и видео, которая может работать на мобильных устройствах на более чем 30 языках.

OpenBMB - некоммерческое подразделение китайской технологической компании ModelBest, под патронажем Университета Цинхуа. Среди инвесторов материнской ModelBest - Habo (Huawei), Primavera Capital Group и государственный Shenzhen Guozhong Venture Capital Management.

🟡Киллер-фича модели - эффективная работа с видео. Благодаря унифицированному 3D-Resampler модель сжимает видео в 96 раз: шесть кадров разрешением 448x448 преобразуются всего в 64 токена, тогда как большинству MLLM для этого потребовалось бы 1536 токенов. Это позволяет обрабатывать видео с частотой кадров до 10 FPS и длинные ролики без роста вычислительных затрат, что подтверждается топовыми результатами на наборах Video-MME, LVBench и MLVU. Архитектура LLaVA-UHD позволяет модели работать с изображениями до 1,8 мегапикселей и любым соотношением сторон, используя в 4 раза меньше визуальных токенов. Модель предлагает гибкий режим работы: быстрый ризонинг для повседневных задач и глубокий для сложных сценариев, переключаемый по требованию. При общем объеме в 8 млрд. параметров, MiniCPM-V 4.5 набирает 77.0 баллов по комплексному бенчу OpenCompass. Этот результат не просто улучшает предыдущие версии, модель превосходит GPT-4o-latest и Gemini-2.0 Pro, обходит открытую Qwen2.5-VL с 72 миллиардами параметров и устанавливает новый стандарт для общего MLLM на OmniDocBench. 🟡С инференсом тоже нет проблем. Доступны варианты для CPU через llama.cpp и ollama, есть квантованные версии в форматах int4, GGUF и AWQ, поддержка бэкендов SGLang и vLLM, возможность дообучения через Transformers и LLaMA-Factory, а также WebUI и оптимизированное iOS-приложение. ▶️ Чтобы было проще разобраться во всех вариантах запуска, разработчики заботливо подготовили подробный cookbook. 📌Лицензирование: MiniCPM Model License. 🟡Модель 🟡Demo 🟡Сообщество в Discord 🖥GitHub @ai_machinelearning_big_data #AI #ML #MMLM #MiniCPM #OpenBMB

297 251

⚡️ Anthropic сделала ИИ-агента Claude для браузера Chrome. Anthropic запустила в режиме исследовательского превью ИИ-агента, который интегрируется в Chrome в виде расширения. Агент работает на базе Claude и позволяет общаться с чат-ботом в боковом окне, которое сохраняет контекст всего происходящего в браузере. Агент может выполнять некоторые задачи от имени пользователя, получив на это разрешение. В Anthropic заверяют, что предусмотрели меры безопасности. Пользователи могут ограничить доступ агента к определенным сайтам, а по умолчанию уже заблокированы финансовые сервисы и ресурсы с NSFW контентом. Перед выполнением "рискованных" действий, таких как публикация данных или совершение покупок, агент будет запрашивать разрешение. Доступ к Claude for Chrome открыт для 1000 подписчиков тарифа Max. Для остальных желающих открыт лист ожидания. @ai_machinelearning_big_data #news #ai #ml

297 251

🔥 VK выложил VK-LSDV, датасет коротких видео для рекомендательных систем 📊 Что внутри: - 40 миллиардов уникальных обезличенных взаимодействий - 20 миллионов единиц контента - 10 миллионов пользователей - период: январь-июнь 2025 - данные: лайки, дизлайки, шеры, длительность просмотра, реакции, контекст воспроизведения 🟢 Возможности для инженеров и исследователей: - Настраивать выборку под задачу: задавать нужный объём данных - Выбирать метод отбора - случайный или по популярности - Адаптировать датасет под доступные вычислительные мощности ⚡️ Почему это важно: 🟠 Это большой открытый датасет сервиса коротких видео для систем рекомендаций. 🟠 Позволяет строить и проверять модели на реальных и качественных данных, а не на «игрушечных» выборках. 🟠 VK-LSVD - шаг к созданию полноценной исследовательской среды, где можно тестировать гипотезы и развивать алгоритмы персонализации. Такой ресурс открывает новые возможности для ученых и инженеров по всему миру и поднимает планку в развитии рекомендательных технологий. 🟠 SET: https://huggingface.co/datasets/deepvk/VK-LSVD

297 251

✔️ OpenGV Lab выпустила семейство моделей InternVL 3.5. InternVL 3.5 - набор мультимодальных моделей размером от 1 до 38 млрд. параметров, плюс варианты с архитектурой MoE на 241 млрд. Семейство показывает SOTA-результаты в работе с изображениями и текстом. По сравнению с предыдущей версией, производительность в логических задачах выросла на 16%, а скорость инференса - в 4 раза. Такой прогресс - заслуга фреймворка Cascade Reinforcement Learning, который сочетает офлайн- и онлайн-обучение для улучшения способности модели к рассуждениям. Все модели InternVL3.5 доступны на Hugging Face под лицензией Apache 2.0. huggingface.co ✔️ Apple рассматривает возможность покупки Mistral и Perplexity. Apple провела внутренние обсуждения о возможном приобретении Mistral AI и Perplexity AI. Обсуждения находятся на ранней стадии и сталкиваются с внутренними разногласиями. Глава сервисного подразделения Эдди Кью является главным сторонником сделки, а вот руководитель разработки ПО Крейг Федериги предпочитает развивать ИИ-технологии внутри компании. Покупка любой из этих компаний станет крупнейшей сделкой в истории Apple, значительно превысив приобретение Beats за 3 миллиарда долларов в 2014 году. Оценка Mistral составляет около 10 миллиардов, а Perplexity — от 14 до 18 миллиардов долларов. Ситуацию осложняет неопределенность с многомиллиардным соглашением с Google, которое обеспечивает статус поисковика по умолчанию на iPhone. theinformation.com ✔️ Google Translate получил режим синхронного перевода разговоров и уроки иностранных языков. Google представила 2 крупных обновления для мобильного приложения Translate. Новый режим "Live translate" позволяет вести диалоги на более чем 70 языках, переводя речь и отображая текст на экране почти в реальном времени. Инструмент работает на моделях Gemini, умеет распознавать паузы, акценты и фоновый шум. Он уже доступен на iOS и Android в США, Индии и Мексике. Вторая новинка - пилотная функция для практики языков. Она генерирует персонализированные упражнения на аудирование и говорение, основываясь на уровне и целях пользователя. Бета-версия доступна бесплатно и на старте поддерживает несколько языковых пар. blog.google ✔️ Prefect запустила облачную платформу для быстрого развертывания MCP-серверов. Prefect открыла публичное бета-тестирование платформы FastMCP Cloud. Она позволяет разворачивать серверы, использующие протокол MCP из GitHub-репозитория менее чем за минуту. Сервис предоставляет безопасный и масштабируемый эндпоинт одним кликом, избавляя от необходимости настраивать хостинг и CI/CD-пайплайны. FastMCP Cloud предлагает встроенную OAuth-аутентификацию, бессерверное автомасштабирование и аналитику. Платформа уже интегрирована с Claude, GPT и Cursor. Сервис бесплатен на время беты, а в будущем появится постоянный бесплатный тариф. prefect.io ✔️ Исследование Стэнфорда: генеративный ИИ снизил занятость молодых специалистов на 13%. Лаборатория цифровой экономики Стэнфордского университета представила одни из первых статистических доказательств влияния ИИ на рынок труда. Анализ данных о заработной плате миллионов работников в США с конца 2022 по середину 2025 года показал, что занятость среди специалистов в возрасте от 22 до 25 лет в профессиях, наиболее подверженных влиянию генеративного ИИ, сократилась на 13%. Потери в основном коснулись должностей начального уровня в разработке ПО и обслуживании клиентов, где ИИ способен полностью автоматизировать задачи. При этом занятость их старших коллег на тех же позициях осталась стабильной или даже выросла. Уровень заработной платы существенно не изменился, что говорит о том, что компании скорее сокращают наем, чем урезают зарплаты. В то же время, в профессиях, где ИИ дополняет, а не заменяет человека, сокращения рабочих мест не наблюдается. stanford.edu @ai_machinelearning_big_data #news #ai #ml

297 251

🚀 Wan2.2-S2V — модель с 14 миллиардами параметров для генерации видео кинематографического качества на основе аудио. 🎬 Новая версия Wan способна превращать статичные изображения и аудио в динамичные видео с реалистичными выражениями лиц, естественными движениями тела и профессиональной работой камеры. ✨ Ключевые особенности: - Высокая динамическая согласованность — модель генерирует плавную и устойчивую анимацию на протяжении всего видео - Высокое качество аудио-видео синхронизации — точное соответствие мимики и артикуляции звуку - Контроль движения и среды через текстовые промпты — возможно задавать жесты, эмоции, фон и поведение персонажа (например, человек «идёт по рельсам», «девочка поёт под дождём», «старик играет на пианино у моря») - Поддержка сложных сценариев — включая движение камеры, дождь, ветер, парашют, съёмку в движущемся поезде и другие кинематографические эффекты 🖼️ + 🎵 = 🎥 Wan2.2-S2V принимает на вход одно изображение и аудиофайл, а на выходе создаёт синхронизированное видео, соответствующее заданному промпту. 📊 По результатам тестов модель демонстрирует лучшие или близкие к лучшим показатели среди конкурентов: - FID ↓ 15.66 — высокое качество видео - EFID ↓ 0.283 — естественность выражения лица - CSIM ↑ 0.677 — сохранение идентичности персонажа - Хорошие результаты на SSIM, PSNR и Sync-C подтверждают визуальную чёткость, стабильность и аудиосинхронизацию 🔓 Проект полностью открытый — исходный код, веса модели и демо-версии. 🟢Попробовать онлайн: https://wan.video 🟢GitHub: https://github.com/Wan-Video/Wan2.2 🟢Проект: https://humanaigc.github.io/wan-s2v-webpage 🟢Декма на Hugging Face: https://huggingface.co/spaces/Wan-AI/Wan2.2-S2V 🟢Демо на ModelScope: https://modelscope.cn/studios/Wan-AI/Wan2.2-S2V 🟢Веса: https://huggingface.co/Wan-AI/Wan2.2-S2V-14B @ai_machinelearning_big_data #AI #ML #Wan

297 251

📌DeepConf: фильтрация мусорных СoT c высокой точностью. Deep Think with Confidence (DeepConf) - способ улучшить рассуждения LLM, который в отличие от стандартного голосования по большинству, предлагает фильтровать варианты на лету, используя внутренние сигналы уверенности самой модели. Идея в том, чтобы не ждать генерации полной цепочки рассуждений, а отслеживать её качество в реальном времени. Для этого придумали метрику "групповой уверенности" (group confidence) — усредненную уверенность модели на небольшом скользящем окне токенов. Если эта метрика падает ниже определенного порога, генерация траектории рассуждения просто останавливается. Это позволяет отсекать низкокачественные цепочки на ранней стадии, экономя огромное количество токенов. При этом сам метод не требует дополнительного обучения или тюнинга гиперпараметров. 🟡DeepConf работает в 2 режимах. В офлайн-режиме, когда все варианты уже сгенерированы, он позволяет применять взвешенное голосование или фильтрацию. Вместо простого подсчета голосов, каждый ответ взвешивается по уверенности породившей его цепочки рассуждений. Результаты на бенчмарке AIME 2025: для GPT-OSS-120B стандартное голосование по 512 вариантам (cons@512) даёт точность 97.0%. Взвешивание с фильтрацией по уверенности (DeepConf@512) поднимает эту планку до 99.9%, практически решая бенчмарк. 🟡Но самый большой выигрыш даёт онлайн-режим. Здесь происходит та самая ранняя остановка генерации. Для GPT-OSS-120B на том же AIME 2025 DeepConf в агрессивной конфигурации DeepConf-low сокращает количество сгенерированных токенов на 84.7% по сравнению с полной генерацией 512 вариантов. При этом точность не только не падает, а даже немного растeт — с 97.1% до 97.9%. В более консервативном режиме, DeepConf-high, экономия токенов составляет 56.0%, а точность остается на уровне 97.0%. Схожие результаты наблюдаются и на моделях DeepSeek-8B и Qwen3-32B, где экономия токенов достигает 77.9% и 66.8% соответственно. Для оценки уверенности прогнали несколько метрик, но наиболее эффективными оказались те, что фокусируются на слабых местах в рассуждениях. Например, метрика Bottom 10% Group Confidence (средняя уверенность по 10% наименее уверенных групп токенов) и Tail Confidence (уверенность на последних токенах цепочки) оказались лучше, чем простое усреднение по всему трейсу. Порог для ранней остановки определяется на лету для каждого нового промпта. Сначала генерируется небольшое количество "разогревочных" трасс, на основе которых вычисляется порог уверенности. Затем запускается основная генерация, и любой вариант, чья групповая уверенность падает ниже этого порога, немедленно останавливается. ▶️Попробовать DeepConf на практике можно пока только в vLLM, есть примеры для онлайн и оффлайн режима. Отдельного репозитория проекта пока нет. 🟡Страница проекта 🟡Arxiv @ai_machinelearning_big_data #AI #ML #LLM #CoT #DEEPCONF

297 251

Исследователи из Yandex B2B Tech и ШАДа совместно с Педиатрическим университетом Петербурга представили первую в России нейросеть для анализа МРТ головного мозга младенцев. Модель работает в облаке и за несколько минут определяет соотношение серого и белого вещества с точностью более 90%. Для обучения использовали 1500 обезличенных снимков и открытый датасет MICCAI Grand Challenge. Архитектура включает BIBSNet для автоматической разметки и ResNet с U-Net для сегментации изображений. Разработчики отмечают, что основной вызов был связан с малым количеством доступных данных и сложностью разметки. Система уже проходит пилот в клинике и доступна врачам на специальной странице сервиса на платформе Yandex Cloud. В дальнейшем её планируют выложить в опенсорс, чтобы расширить возможности исследований и внедрения подобных решений в здравоохранении.

297 251

📌 Во Флориде школы начнут тестировать дроны с перцовым газом для борьбы со стрелками. Три округа во Флориде готовятся к испытаниям системы беспилотников, предназначенной для нейтрализации нападающих. Дроны, разработанные компанией Campus Guardian Angel, могут быть активированы в течение 5 секунд после сигнала тревоги и достигнуть стрелка за 15 сек. Они оснащены шариками с перцовым спреем, чтобы ослепить или замедлить преступника, могут разбивать окна для отвлечения внимания и транслировать видео в реальном времени для правоохранителей. По словам CEO компании, если это не поможет, дроны будут «продолжать таранить» нападающего до прибытия полиции. Проект уже вызвал серьезные этические вопросы, касающиеся безопасности, но штат выделил на пилотный проект 557 тыс. долларов. Установка систем в школах запланирована на осень, а полноценный запуск — на январь. @ai_machinelearning_big_data #news #ai #ml

297 251

✔️ Российские учёные предложили новый способ борьбы с галлюцинациями ИИ Одна из главных проблем больших языковых моделей — они могут генерировать правдоподобные, но ложные ответы. Исследователи из Сбера разработали метамодели, которые повышают точность обнаружения ложных ответов обучаемыми локальными моделями почти на 30% при использовании малого количества данных для обучения. На тестах подход сработал лучше, чем многие закрытые коммерческие решения: уже при обучении на 250 примерах удалось добиться результатов, сопоставимых с применением крупнейших LLM в качестве оценщиков. Выгода очевидна — компании могут сильно сэкономить ресурсы на разметку данных, ученые получают новый инструмент для анализа больших языковых моделей, а пользователи — более точные ответы от AI-моделей.

297 251

⚡️ Google готовится к запуску модели Nano Banana. По слухам, которые появились из-за поста инженера DeepMind Патрика Лоебера в сети Х, на этой неделе мы увидим инпейнт-модель для редактирования изображений под названием Nano Banana. Модель наделала шуму на Lmarena, да и тестеры предварительных версий отмечают способность вносить очень точечные изменения в изображение, не затрагивая другие его элементы. При этом качество изображений, генерируемое Nano Banana сопоставимо с результатами более крупных и ресурсоемких систем. Официально Google пока не объявляла дату запуска и не раскрывала информацию о ценах. @ai_machinelearning_big_data #news #ai #ml

297 251

📌Приглашаем вас на три бесплатных вебинара курса «ML для финансового анализа» 💎Вебинар №1: «Инструменты тестирования торговых стратегий» ⏰ 27 августа в 20:00 мск 🔹На вебинаре: - Познакомитесь с инструментами для backtesting’а: от pandas до backtrader и backtesting. -Узнаете про метрики оценки: доходность, просадка, Sharpe ratio - Покажем ошибки при тестировании и как их избежать. - Практика по тестированию простой стратегии и анализу ее метрик. 💎Вебинар №2: «Введение в технический анализ: построение торговой стратегии» ⏰ 4 сентября в 20:00 мск 🔹На вебинаре: -Узнаете архитектурное решение локального торгового робота - Познакомитесь с понятием технического анализа - Практика с актуальными инструментами - Построения индикаторов на практике - Первая стратегия на тех. анализе 💎Вебинар №3: «Работа с торговой площадкой ByBit» ⏰ 17 сентября в 20:00 мск 🔹На вебинаре: - Обзор возможностей платформы ByBit: типы ордеров, торговые пары. - Разбор основных принципов работы с API ByBit: авторизация, получение котировок, выставление ордеров. - Напишем простой торговый скрипт на Python и протестируем его на демо-аккаунте. 🎁Участники вебинаров получат подарки на почту Регистрация на вебинары ➡️ OTUS.RU Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.

297 251

✔️ Microsoft выпустила открытую TTS VibeVoice. VibeVoice - опенсорсная система синтеза речи на английском и китайском языках для создания выразительного аудиоконтента длиной до 90 минут с участием до 4 различных спикеров. В системе используются непрерывные токенизаторы речи на сверхнизкой частоте 7.5 Гц и комбинация из LLM для понимания контекста и диффузионная модель для генерации высококачественного аудио. Код для инференса уже доступен на GitHub, а модель на 1.5 млрд. параметров и токенизатор - на Hugging Face. Обещают более крупную (7B) и компактную (0.5B) версии модели. microsoft.github.io ✔️ NotebookLM научился создавать видеообзоры на 80 языках, включая русский. Теперь возможность превращать загруженные документы и заметки в короткие видеопрезентации доступна на 80 языках, включая русский. Ранее функция работала только на английском. Одновременно компания улучшила и Audio Overviews, позволив создавать более длинные и детализированные аудиосводки на разных языках. Оба обновления уже начали развертываться и, по заявлению Google, станут доступны всем пользователям по всему миру в течение недели. blog.google ✔️ Nvidia анонсировала Jetson AGX Thor. Jetson AGX Thor - наиболее производительный на сегодняшний день компьютер для периферийных ИИ-вычислений и робототехники. Платформа обещает производительность в 2070 терафлопс (FP4), что примерно в 7.5 раз превосходит предыдущее поколение Jetson Orin. В основе системы - GPU на архитектуре Blackwell, 14-ядерный процессор Arm и 128 ГБ памяти LPDDR5X. Это позволяет запускать большие языковые и мультимодальные модели локально, обрабатывая данные с нескольких сенсоров с минимальной задержкой. Платформа совместима с программными стеками Nvidia: Isaac, Metropolis и Holoscan. Набор для разработчиков уже доступен для заказа по цене $3499, а поставки начнутся в следующем месяце. Серийные модули Jetson T5000 для готовых роботов появятся в конце 2025 года по цене $2999 за штуку при заказе от 1000 единиц. cnbc.com ✔️ Илон Маск подал иск на $1 млрд против Apple и OpenAI. xAI и X подали в федеральный суд США антимонопольный иск на сумму 1 млрд. долларов против Apple и OpenAI. В иске утверждается, что компании вступили в незаконный сговор с целью захвата рынков смартфонов и генеративного ИИ, нарушая антимонопольное законодательство США. Согласно 61-страничному документу, эксклюзивная интеграция ChatGPT в iOS и манипуляции с ранжированием в App Store целенаправленно занижают позиции конкурирующих чат-ботов. Это, по мнению Маска, делает "невозможным для любой другой ИИ-компании, кроме OpenAI, достичь первого места в магазине приложений". В Apple отказались от комментариев. В OpenAI назвали иск "продолжением систематических нападок со стороны господина Маска". wsj.com ✔️ Brave обнаружили уязвимость в Comet от Perplexity. Проблема, по словам Brave, заключается в так называемых "непрямых инъекциях промптов". Злоумышленники могут встраивать вредоносные команды в веб-страницы, которые ИИ-ассистент Comet при анализе контента воспринимает как инструкции от пользователя. В ходе тестов Brave продемонстрировала, как можно заставить Comet прочитать и отправить атакующим конфиденциальные данные, email-адреса и одноразовые пароли. Perplexity выпустила обновления, однако, проблема все еще не решена полностью. brave.com @ai_machinelearning_big_data #news #ai #ml

297 251

🦎 Эволюция ИИ моделей, вдохновленная природой В Sakana AI предложили новый подход: развивать ИИ не как один гигантский «мозг», а как экосистему моделей, которые конкурируют, объединяются и обмениваются навыками. Этот метод они назвали M2N2 (Model Merging of Natural Niches). 🔑 Как это работает - Гибкие границы слияния — модели объединяются не фиксированными слоями, а переменными кусками параметров, как будто меняются фрагментами ДНК. - Конкуренция за данные — модели соревнуются за ограниченные ресурсы и становятся «экспертами» в узких областях. - Выбор партнёров — для объединения подбираются те модели, которые дополняют друг друга: одна сильна там, где другая слаба. 📊 Чего удалось добиться - С нуля: только слиянием случайных сетей удалось получить классификатор MNIST, сравнимый с классическими эволюционными методами, но быстрее и дешевле. - Крупные LLM: объединение модели-«математика» и модели-«агента» породило систему, которая уверенно справляется с обоими типами задач. - Мультимодальные модели: при слиянии text-to-image моделей для японского итоговая версия стала лучше понимать японские запросы и при этом сохранила сильный английский — без «забывания» старых навыков. Этот подход показывает, что будущее ИИ может быть не за одним огромным монолитом, а за живой экосистемой специализированных моделей, которые эволюционируют вместе, обмениваются сильными сторонами и становятся более гибкими и креативными. 🟠 Paper: https://arxiv.org/abs/2508.16204 🟠 Code: https://github.com/SakanaAI/natural_niches @ai_machinelearning_big_data

297 251

📌Анатомии GPU и TPU: 12 глава пособия "How to Scale Your Model" Группа инженеров из Google DeepMind опубликовали 12-ю главу своего он-лайн учебника "How to Scale Your Model: A Systems View of LLMs on TPUs"

How to Scale Your Model - практико-ориентированное руководство по масштабированию LLM из 12 разделов для разработчиков и исследователей. Оно объясняет, как анализировать и оптимизировать производительность модели, учитывая системные ресурсы: вычисления, память и пропускную способность. Пособие научит выбирать оптимальные стратегии параллелизма, оценивать стоимость и время обучения и инференса, а также глубже понять взаимодействие между TPU/GPU и алгоритмами масштабирования как на одном, так и на тысячах ускорителей.

12-я глава - глубокое техническое руководство по архитектуре GPU и стратегиям масштабирования больших моделей. В ней детально разбирается устройство современных GPU NVIDIA: Streaming Multiprocessors, Tensor Cores, иерархия памяти (HBM, L2, SMEM), все это с подробными сравнительными таблицами характеристик для разных поколений чипов. Очень подробно выполнено сравнение архитектур GPU и TPU, с объясняем ключевого различия между модульностью GPU и монолитностью TPU. Особое внимание, что редкость для обучающих материалов, уделено сетевой организации кластеров. Авторы доступно объясняют как GPU соединяются внутри узлов через NVLink/NVSwitch и между узлами через InfiniBand в топологии "Fat tree", и как пропускная способность на каждом уровне влияет на реальную производительность коллективных операций (AllReduce, AllGather). Описаны основные стратегии параллелизма: Data Parallelism, Tensor Parallelism, Expert Parallelism и Pipeline Parallelism, с разбором их ограничений и примеров из реальных проектов. В конце главы есть хороший анализ новых возможностей архитектуры Blackwell. @ai_machinelearning_big_data #AI #ML #LLM #Scaling #GPU #TPU

297 251

🐋 DeepSeek-V3.1 теперь можно запускать локально Оригинальная модель весила 715GB, но её удалось уменьшить до 170GB (−80%) с помощью новой техники квантовки Dynamic 1-bit GGUF. ⚡ Огромная экономия памяти 👉 Подробный гайд: https://docs.unsloth.ai/basics/deepseek-v3.1 👉 GGUF-модель: https://huggingface.co/unsloth/DeepSeek-V3.1-GGUF Теперь топовую DeepSeek реально запустить даже на локальной машине, а не только в дата-центре 🚀 @ai_machinelearning_big_data #DeepSeek #GGUF

297 251

✔️ Nvidia остановила производство чипов H20 для Китая. Nvidia приостановила выпуск своих ИИ-чипов H20, разработанных специально для китайского рынка в обход американских санкций. Причиной стало новое распоряжение Пекина, которое вынуждает местные компании отказаться от продукции Nvidia из-за опасений, связанных с безопасностью. В результате около 700 000 уже произведенных и готовых к отправке чипов, которые ранее получили одобрение от правительства США, теперь простаивают на складах партнера по упаковке. Вся цепочка поставок оказалась парализованной, несмотря на то, что Вашингтон и Nvidia уже достигли политического соглашения. theinformation.com ✔️ Cohere представила ризонинг-модель для бизнеса. Cohere выпустила ризонинг-модель Command A Reasoning, оптимизированную для ресурсоемких задач, требующих логических рассуждений: работа в агентных системах и анализ больших документов. По заявлению разработчиков, на бенчмарках BFCL-v3, Tau-bench и DeepResearch Bench модель превосходит gpt-oss-120b и Mistral Magistral Medium. Command A Reasoning может работать на одном GPU H100 или A100 с контекстным окном в 128 тыс. токенов, которое можно расширить до 256 000 токенов на нескольких GPU. Модель уже доступна на платформе Cohere, а на Hugging Face выложена версия для некоммерческого использования под лицензией CC-BY-NC-4.0. cohere.com ✔️ ElevenLabs выпустила альфа-версию TTS-модели v3. ElevenLabs представила обновленную модель для синтеза речи Eleven v3. Она уже доступна в альфа-версии через API. Модель знает более 70 языков (включая русский) и получила расширенные возможности для передачи эмоций и дополнительные элементы управления голосом. Одной из главных особенностей стал режим «диалог», который может обрабатывать неограниченное количество спикеров в одном аудио. Для управления интонациями и эмоциональными оттенками речи добавлены специальные аудиотеги. Доступ к API Eleven v3 (alpha) можно получить с бесплатного аккаунта, однако некоторые функции могут быть платными. elevenlabs.io ✔️ Anthropic разработала классификатор для блокировки запросов, связанных оружием массового поражения. Anthropic создала ИИ-классификатор, который выявляет опасные запросы, касающиеся технологий, связанных с биологическим, химическим и ядерным оружием. Предварительные тесты показали точность системы на уровне 96%. Цель классификатора - фильтровать информацию об оружии массового поражения еще на этапе предварительного обучения моделей. Такой подход должен предотвратить ситуации, когда чат-боты могут предоставить инструкции по созданию оружия, не влияя при этом на их способность выполнять безопасные задачи. В Anthropic в очередной раз напомнили, что безопасность должна быть фундаментальным принципом при разработке ИИ. anthropic.com ✔️ Илон Маск анонсировал создание компании-симулятора Microsoft. Илон Маск объявил о запуске новой софтверной компании Macrohard, созданной в рамках его инициативы xAI. Главная цель проекта - построить полностью управляемую ИИ программную корпорацию, которая будет симулировать деятельность Microsoft и конкурировать с ней . По замыслу Маска, сотни специализированных ИИ-агентов будут совместно работать над созданием программных продуктов, полностью воспроизводя цифровые операции гиганта. Название Macrohard является явной ироничной отсылкой к Microsoft, подчеркивая амбиции проекта стать его прямым конкурентом в сфере ПО. Elon Musk в сети X @ai_machinelearning_big_data #news #ai #ml

297 251

🌟 MAD: алгоритм безопасной работы с огромными датасетами. Большие данные - это топливо для ИИ. Но как их использовать, чтобы не нарушить приватность, например датасета, где есть персональные данные? Один из вариантов - метод дифференциально-приватного отбора. Он выбирает из огромного набора уникальные элементы так, чтобы нельзя было соотнести их с конкретным человеком. А если данных - больше миллиарда? Для этого нужен более надежный подход. Таким алгоритмом стал Max Adaptive Degree (MAD), представленный Google на ICML 2025. Он не только эффективнее других параллельных методов, но и работает с наборами данных на десятки и сотни миллиардов записей. 🟡Стандартный MAD метод состоит из 3 шагов: 🟢Каждому элементу присваивается вес (обычно по частоте использования). 🟢К весу добавляется случайный шум для защиты приватности. 🟢Выбираются только те элементы, чей вес с шумом превышает определенный порог. Но тут появляется новая проблема - популярные элементы получают избыточный вес, который можно было бы использовать для менее частых, но ценных данных. MAD решает ее с помощью адаптивного взвешивания, перераспределяя вес: забирает часть у популярных элементов и отдает тем, чьи значения уже находятся у порога. Это позволяет отобрать больше полезных данных без потери приватности.

Простой пример: представьте 100 пользователей, у каждого по 3 элемента. Один элемент (A) есть у всех, а остальные элементы уникальны. В базовом алгоритме элемент A получит слишком много веса (намного больше необходимого), а уникальные элементы - слишком мало. MAD "забирает" часть веса у A и распределяет его между уникальными элементами, давая им шанс пройти порог.

🟡MAD2R. Метод можно использовать в несколько итераций, публикуя промежуточные результаты с шумом. Так можно еще точнее распределять вес между раундами. В первом раунде запускается MAD как обычно, а во втором удаляются уже найденные элементы и те, которые явно не пройдут порог. Для остальных элементов применяется "смещение" веса на основе данных первого раунда. На практике MAD показал отличные результаты. Всего за 2 этапа он отобрал больше полезных элементов, чем другие методы. Например, в Common Crawl (800 млрд. записей) он выбрал набор слов, который покрыл 99.9% всех записей и 97% уникальных слов с полным соблюдением приватности. 🟡Статья 🟡Arxiv 🖥GitHub @ai_machinelearning_big_data #AI #ML #Selection #MAD #Google

297 251

🦾 Boston Dynamics выкатили впечатляющее видео своего робота. Atlas получает изображение с камеры, данные о положении тела и текстовую команду. На основе этого модель генерирует плавные движения всего корпуса 30 раз в секунду. Это не набор хрупких скриптов, а система, которая сама «думает», как выйти из ситуации.

Вместо того чтобы «прыгать» от точки к точке, система сразу строит короткую последовательность действий — примерно на полторы секунды вперёд. Часть из них выполняется, а потом план обновляется, чтобы движения оставались точными и естественными.

Робот показывает, что может работать в реальном бардаке, где всё падает, двигается и мешает работе. @ai_machinelearning_big_data #ai #robots #BostonDynamics #atlas

297 251

🧠 Управление командой и проектами с помощью AI: от OKR до Performance Review. Технические скиллы — это наш фундамент, но для роста до тимлида или руководителя нужно понимать язык бизнеса. Канал Саши (маркетинг дир в Yandex, Playrix, eBay) «Мальцев: Карьера. Маркетинг. Al» — это плейбук для IT-специалистов, которые хотят эффективно управлять командой, расти в карьере и получать признание за свою работу. ✔️ Какие управленческие фреймворки разбираются на практике: • Постановка целей по OKR: Как самостоятельно сформулировать цели, которые будут высоко оценены вашим бизнесом и повысят шансы на премию. Подход, который помог Google стать Google. • Подготовка к Performance Review: 4 неочевидные ошибки в Self-Review, которые мешают получить высокую оценку. Саша делится опытом участия в калибровках 137 сотрудников и объясняет, как связывать свой вклад с метриками бизнеса (выручка, LTV, EBITDA). • Запуск крупных продуктов: Готовый шаблон для обоснования продуктовых запусков перед топ-менеджментом. Включает оценку ROI, расчет ресурсов и описание рисков. • Работа с нечеткими задачами: Промпт для GPT, который на основе 4-х вводных помогает системно продумать подход к решению задачи от руководителя, выявить скрытые цели и определить метрики успеха. Канал помогает IT-специалистам развить навыки, необходимые для карьерного роста в крупных технологических компаниях. ➡️ Подписаться: Мальцев: Карьера. Маркетинг. AI.

297 251

✔️ Google расширила доступ к ИИ-поиску на 180 стран и добавила функцию бронирования. Google начала масштабное развертывание диалогового поискового режима AI Mode для 180 стран. Ранее функция работала только в США, Великобритании и Индии. Пока доступен только английский язык, а страны Евросоюза в список не вошли из-за строгих правил в области данных и ИИ. Вместе с географическим расширением Google представила первую агентную возможность в AI Mode. Теперь пользователи в США могут находить и бронировать столики в ресторанах через платформы OpenTable и Resy, прямо из поисковой выдачи. В будущем планируется добавить бронирование билетов и запись на услуги. Эта функция пока доступна только подписчикам платного тарифа Google AI Ultra. 9to5google.com ✔️ Runway представила платформу для создания интерактивных ИИ-миров. Компания анонсировала бета-версию платформы Game Worlds, на которой пользователи в реальном времени могут создавать и исследовать полностью сгенерированных персонажей, сюжеты и окружения. Одновременно с этим Runway добавила в свой продукт Act-Two новую функцию «Voices». Она дает возможность подбирать и настраивать голоса для ИИ-персонажей. Эти нововведения - часть стратегии компании по демократизации создания иммерсивного контента, делая его доступным для авторов без специальных навыков в программировании или анимации. RunwayML в сети X ✔️ Появились тестовые образцы нового ИИ-чипа Intel Jaguar Shores В сети появились фото тестовых образцов следующего поколения ИИ-архитектуры Jaguar Shores. Размер корпуса 92,5 мм на 92,5 мм, он включает 4 отдельных кристалла и 8 площадок памяти HBM, что явно указывает на платформу для высокопроизводительных вычислений. Jaguar Shores станет первым стоечным решением Intel, планируется использование памяти HBM4 от SK Hynix и совместная работа с будущими процессорами Xeon Diamond Rapids. wccftech.com ✔️ Streaming Sortformer: модель для распознавания говорящих в реальном времени. NVIDIA выпустила Streaming Sortformer - модель для диаризации речи, которая мгновенно определяет и маркирует участников разговора в реальном времени с низкой задержкой. Модель оптимизирована для английского и китайского языков, способна отслеживать до 4 говорящих одновременно и предназначена для работы на GPU. По результатам тестов, Streaming Sortformer показывает более низкий уровень ошибок (DER) по сравнению с конкурирующими решениями. Streaming Sortformer подойдет для применения в колл-центрах, при создании протоколов встреч и в интерактивных голосовых приложениях, где важно точно знать, кто, что и когда сказал. Модель доступна на Hugging Face. developer.nvidia.com ✔️ AMD официально представила технологию FSR 4. AMD выпустила новейшую технологию масштабирования изображения FidelityFX Super Resolution 4 (FSR 4). Это часть обновления FidelityFX SDK 2.0, где AMD впервые внедряет алгоритм апскейлинга на основе машинного обучения для улучшения качества графики и производительности в играх. По сравнению с предыдущей версией 3.1, FSR 4 показывает улучшения в детализации изображения и временной стабильности, а также снижает артефакты гостинга движущихся объектов. FSR 4 поддерживается только видеокартами AMD Radeon RX 9000 серии и выше на архитектуре RDNA 4 и требует DirectX 12. AMD также предоставила плагины FSR 4 для Unreal Engine версий 5.1–5.6. gpuopen.com @ai_machinelearning_big_data #news #ai #ml