ru
Feedback
Machinelearning

Machinelearning

Открыть в Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Больше

📈 Аналитический обзор Telegram-канала Machinelearning

Канал Machinelearning (@ai_machinelearning_big_data) языкового сегмента Русский является активным участником. Сейчас сообщество объединяет 296 342 подписчиков, занимая 329 место в категории Технологии и приложения и 1 272 место в регионе Россия.

📊 Показатели аудитории и динамика

С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 296 342 подписчиков.

Согласно последним данным от 20 июня, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило -6 181, а за последние 24 часа — -161, при этом общий охват остаётся высоким.

  • Статус верификации: Не верифицирован
  • Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 8.10%. В первые 24 часа после публикации контент обычно набирает 5.73% реакций от общего числа подписчиков.
  • Охват публикаций: В среднем каждый пост получает 24 014 просмотров. В течение первых суток публикация набирает 16 967 просмотров.
  • Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 187.
  • Тематические интересы: Контент сосредоточен на ключевых темах, таких как openai, claude, api, gemini, контекст.

📝 Описание и контентная политика

Автор описывает ресурс как площадку для выражения субъективного мнения:
Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Благодаря высокой частоте обновлений (последние данные получены 21 июня, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.

296 342
Подписчики
-16124 часа
-1 4287 дней
-6 18130 день
Архив постов
+5
✔️ Релиз весов HiDream-I1: 17B параметров и превосходство над GPT-4o по качеству генерации изображений. HiDream-I1 - генеративная модель text-to-imаge, разработанная китайской компанией HiDream, которая работает под брендом vivagoAI. Модель получила 17 млрд. параметров и показывает высочайшее качество генерации изображений в фотореализме, анимационном и художественном стилях. Представлено 3 версии модели: Dev, Full и Fast. Модель выпущена под лицензией MIT и уже заняла 1 место в GenAI-бенчмарках, обогнав предыдущего лидера, GPT-4o. Попробовать Github HidreamAi в X (ex-Twitter) @ai_machinelearning_big_data #news #ai #ml #HiDream #AImodel

🧠 Как студенты используют Claude: новый отчёт от Anthropic Anthropic только что опубликовала исследование об использовании и
+5
🧠 Как студенты используют Claude: новый отчёт от Anthropic Anthropic только что опубликовала исследование об использовании их ИИ-ассистента Claude студентами университетов. 📊 Основные инсайты: ▪ Доминируют студенты STEM-направлений (естественные и точные науки) Студенты технических и естественнонаучных специальностей — самые активные пользователи Claude. Особенно — компьютерные науки: они составляют 36,8% пользователей, при том что таких студентов всего 5,4%. ▪ Выделено 4 стиля взаимодействия с ИИ: ▪ Прямое решение задач ▪ Прямое создание контента ▪ Совместное решение задач ▪ Совместное создание контента ▪ Фокус на задачах высокого уровня мышления Студенты используют Claude не просто как справочник, а для глубокого анализа и генерации — от написания кода до разбора сложных понятий. Это вызывает вопросы: не перекладывают ли они развитие критического мышления на ИИ? 💻 Где Claude помогает чаще всего: ▪ Создание и улучшение учебных материалов (39,3%) (эссе, резюме лекций, тесты, шпаргалки) ▪ Решение и объяснение технических заданий (33,5%) (код, алгоритмы, математика) ▪ Анализ и визуализация данных (11%) ▪ Исследовательский дизайн и разработка инструментов (6,5%) ▪ Создание технических диаграмм (3,2%) ▪ Перевод и вычитка текстов (2,4%) 📌 Читать полностью #Claude #Anthropic

📌 SPCT: масштабируемость моделей вознаграждения в реальном времени. DeepSeek-AI и Университет Цинхуа опубликовали исследован
+1
📌 SPCT: масштабируемость моделей вознаграждения в реальном времени. DeepSeek-AI и Университет Цинхуа опубликовали исследование о методе Self-Principled Critique Tuning (SPCT), который значительно повышает эффективность генеративных моделей вознаграждения (GRM) для больших языковых моделей. SPCT решает ключевую проблему RL-обучения — получение точных сигналов вознаграждения в условиях разных и неоднозначных задач, где нет четких правил или эталонов. SPCT — это комбинация rejective fine-tuning и обучения с подкреплением на основе правил. Rejective fine-tuning учит модель генерировать принципы и критические оценки, адаптируясь к разным типам входных данных, а rule-based RL — оптимизирует процесс через систему поощрений, которая штрафует за ошибки в ранжировании ответов. Это позволяет GRM самостоятельно создавать критерии оценки и точнее определять лучшие ответы в сложных сценариях, например, при работе с математическими задачами или этическими дилеммами. Главное преимущество SPCT — масштабируемость инференса. Вместо увеличения размера модели авторы предлагают параллельно генерировать множество вариантов принципов и оценок, а затем агрегировать их через голосование. Чтобы фильтровать «шумные» варианты используется мета-модель вознаграждения, которая отбирает только качественные сэмплы. По результатам тестов, DeepSeek-GRM с 27 млрд. параметров при 32 параллельных сэмплах превзошла 671B модель, демонстрируя, что вычислительные ресурсы можно эффективно распределять во время инференса, а не обучения. Эксперименты на бенчмарках Reward Bench, PPE и RMB показали, что SPCT снижает предвзятость моделей. Например, в задачах на рассуждение точность выросла на 12%, а в оценке безопасности — на 9%. При этом метод сохраняет гибкость: одна и та же модель может оценивать одиночные ответы, пары или целые наборы, что критично для реальных приложений вроде чат-ботов или автономных систем. К сожалению, идеальных решений не бывает и у метода есть существенное ограничение - GRM требуют больше вычислительных ресурсов, чем классические скалярные модели, а в узкоспециализированных областях (например, верификация кода) их точность пока уступает конкурентам. 🟡Arxiv @ai_machinelearning_big_data #AI #ML #LLM #GRM #DeepSeekAI

✔️ Google добавила мультимодальный поиск в AI Mode. Свежее обновление AI Mode в Google Поиске добавило мультимодальные функци
✔️ Google добавила мультимодальный поиск в AI Mode. Свежее обновление AI Mode в Google Поиске добавило мультимодальные функции — система анализирует изображения, понимая контекст и связи между объектами. Загрузите фото или сделайте снимок через Lens, задайте вопрос — нейросеть на основе Gemini выдаст развёрнутый ответ с рекомендациями и ссылками. Раньше эта функция была доступна подписчикам Google One AI Premium, но теперь она доступна через Google Labs. blog.google ✔️ Samsung представила обновление Gemini Live для Galaxy S25 с визуальным ИИ в реальном времени. С 7 апреля владельцы Galaxy S25 получат бесплатное обновление Gemini Live. Теперь можно обсуждать увиденное через камеру или экран, удерживая боковую кнопку. Например, ИИ подскажет, как организовать шкаф или выбрать одежду, анализируя изображение в реальном времени. Функция доступна бесплатно, но требует подключения к интернету и активации в поддерживаемых странах. news.samsung.com ✔️ Cloudflare упрощает создание AI-агентов с MCP и бесплатным доступом к Durable Objects. Cloudflare представила серию обновлений, ускоряющих разработку AI-агентов. Теперь в Agents SDK добавлена поддержка MCP, позволяющая агентам подключаться к внешним сервисам с автоматической аутентификацией и управлением соединениями. Для безопасного доступа интегрированы провайдеры Stytch, Auth0 и WorkOS — это упрощает настройку прав доступа через OAuth 2.1 и гибкие сценарии разрешений. Новинка в SDK — гибернация для MСРAgent: серверы автоматически «засыпают» при простое, экономя ресурсы, и мгновенно активируются при новых запросах. Для хранения состояния агентов теперь доступны Durable Objects даже на бесплатном тарифе — с поддержкой SQLite и 5 ГБ памяти. Обновления дополнены примерами готовых MCP-серверов — от управления задачами до анализа кода. Разработчики могут развернуть их через кнопку Deploy и настроить под свои нужды. blog.cloudflare.com ✔️ Google Sec-Gemini v1: ИИ для кибербезопасности. Google анонсировал экспериментальную модель Sec-Gemini v1, которая создана для помощи специалистам по кибербезопасности через интеграцию ИИ и актуальных данных об угрозах. Система объединяет OSV, Mandiant Threat Intelligence и Google Threat Intelligence, обеспечивая анализ в реальном времени. По внутренним тестам Google, модель на 11% эффективнее аналогов в CTI-MCQ (оценка знаний об угрозах) и на 10,5% — в CTI-RCM (поиск первопричин инцидентов). Она ускоряет обнаружение атак, оценку уязвимостей и даже идентификацию хакерских групп. Sec-Gemini v1 уже доступна бесплатно для НКО, исследователей и компаний — это часть стратегии Google по совместной борьбе с угрозами. Модель не только предупреждает о рисках, но и объясняет контекст уязвимостей, помогая командам быстрее реагировать. cybermagazine.com ✔️ LLM в биомедицине: GPT-4 лидирует, но тонкая настройка все еще важна. Исследование, опубликованное в Nature, показало, что LLM дают неоднозначные результаты в биомедицинских задачах. Закрытые модели (GPT-4) превзошли конкурентов в задачх, требующих логики — например, отвечая на медицинские тесты с точностью до 75%. Однако в извлечении данных (распознавание болезней, связей между белками) лидируют традиционные подходы с файнтюном BERT-моделей, опережая LLM на 30–40%. Открытые решения без дообучения справляются хуже: в 22% случаев генерируют недостоверную информацию. Эксперты отмечают, что даже добавление одного примера в промпт снижает число ошибок. Все данные и выводы исследования доступны в репозитории для независимой проверки. nature.com @ai_machinelearning_big_data #news #ai #ml

🔥 Вайб-кодинг — хайп или инструмент будущего? Программирование с помощью ИИ-агентов — главный тех-тренд последних месяцев. О
🔥 Вайб-кодинг — хайп или инструмент будущего? Программирование с помощью ИИ-агентов — главный тех-тренд последних месяцев. Одни говорят: «Это лучший опыт в моей жизни». Другие: «Я только и делаю, что дебажу то, чего сам не писал». Хочешь по-настоящему разобраться, как использовать ИИ ? 14 апреля в 17:00 — онлайн-лекция от Школы Высшей Математики. 📌 Спикеры: 👨‍🏫 Александр Лыков, к.ф.-м.н., руководитель ШВМ 🟡 Богдан Печёнкин, фаундер Vibe AI Расскажут и покажут: ➖ Как внедрять Copilot, ChatGPT, Cursor и других агентов в работу уже сейчас ➖ Что агенты реально умеют (и где они сыпятся) ➖ Как ускорить разработку в 10 раз, не потеряв контроль над кодом Не пропусти. Это будет 🔥 🗓 14 апреля, 17:00 📍 Онлайн 🟡 Регистрация Реклама: ООО «Школа высшей математики» ИНН: 9728100991 Erid: 2VtzqvcUpMX

🌟 Sakana AI представили AI Scientist v2 — систему, которая автоматизирует научное исследование: от гипотезы до опубликованно
+3
🌟 Sakana AI представили AI Scientist v2 — систему, которая автоматизирует научное исследование: от гипотезы до опубликованной статьи. Sakana AI впервые провела реальный эксперимент: три научные статьи, полностью сгенерированные ИИ (The AI Scientist-v2), были отправлены на слепое рецензирование на ICLR Workshop 2025. Одна из них получила баллы выше среднего уровня принятия — лучше многих статей, написанных людьми. Это исторический момент в научной публикационной практике. Статьи были на 100% созданы AI — от идеи до финального форматирования и списка литературы. Человек не правил ни одного слова: только выбрал тему и три лучшие статьи из набора, сгенерированного AI. В ICLR Workshop было отправлено 3 статьи из 43 (≈7%) — рецензенты знали, что среди них есть AI-работы, но не знали, какие именно. - 2 статьи были отклонены. - 1 статья прошла, получив баллы: Средняя оценка статьи: 6.33 — это выше, чем у многих человеческих работ, принятых на воркшоп. 🟡 Что умеет ​AI Scientist-v2: — Придумывает научные идеи — Пишет и запускает код для экспериментов — Анализирует результаты, строит графики — Сама пишет статью в научном формате — И… сама себя рецензирует 🟡 Подробнее 🟡 Github 🟡Эксперимент @ai_machinelearning_big_data #ai #ml #Sakana

🔥 Microsoft запускает бесплатные курсы по ИИ для всех. Microsoft представила масштабную образовательную инициативу — AI Skil
🔥 Microsoft запускает бесплатные курсы по ИИ для всех. Microsoft представила масштабную образовательную инициативу — AI Skills Fest, где каждый может бесплатно освоить навыки работы с ИИ. Программа подходит как новичкам, так и опытным специалистам — от основ ML до работы с Azure и Copilot. Обучение доступно на 40+ языках, включая русский, а материалы разбиты на модули: введение в ИИ, CV, NLP и создание приложений. Участники, прошедшие курс, получат бейдж для LinkedIn и шанс выиграть один из 50 тысяч сертификационных ваучеров. GitHub также предлагает скидку 50% на экзамен по Copilot для тех, кто завершит их модуль. Чтобы присоединиться, достаточно зарегистрироваться на сайте Microsoft и выбрать подходящий уровень сложности. Помимо основного блока, доступны хакатоны, форумы и самообучение в удобном темпе. 🟡 microsoft.com @ai_machinelearning_big_data #course #ai #ml #freeeducation

📕 Андрей Карпаты опубликовал новый пост- необычный путь распространения LLM, их влияние на людей и организации, причины разр
+1
📕 Андрей Карпаты опубликовал новый пост- необычный путь распространения LLM, их влияние на людей и организации, причины разрыва и взгляд в будущее. В нем он анализирует необычное распространение больших языковых моделей (LLM). Вот его содержание: В отличие от традиционных технологий, которые обычно проходят путь от государственных и военных структур через корпорации к индивидуальным пользователям, LLM сразу стали широко доступны обычным людям. Это позволило моделям значительно расширить свои возможности в таких областях, как программирование, анализ данных и создание контента, без необходимости привлекать узких специалистов. ChatGPT — самое быстрорастущее приложение в истории, у него 400 миллионов активных пользователей в неделю. Люди используют его для написания текстов, программирования, перевода, обучения, анализа, исследований и генерации идей Это не просто улучшение жизни— это мощный бустер возможностей человека. И барьер для входа использования LLM невероятно низкий: модели бесплатны или дешевы, быстры, доступны всем через API или локально, и говорят на любом языке, включая сленг и эмодзи. Никогда еще человек не получал такого технологического скачка так быстро. Почему же эффект для корпораций и государственных институтов не такой весомый? Во-первых, LLM дают "квази-экспертные" знания: широкие, но неглубокие и ненадежные. Для организаций, где уже есть эксперты (инженеры, юристы, аналитики), это лишь слегка повышает эффективность. А вот для человека, который обычно эксперт лишь в одном, LLM открывают новые горизонты: программировать, разбираться в юриспруденции, анализировать данные или создавать контент — все это теперь возможно без посторонней помощи. Во-вторых, организации решают более сложные задачи: интеграции, устаревшие системы, безопасность, регуляции, координация. Ошибки LLM тут куда опаснее — "вайб кодить" не выйдет. В-третьих, есть инерция: бюрократия, культура компаний, переобучение — все это тормозит внедрение. Пока LLM радикально меняют жизнь людей, а не организаций. Мэри, Джим и Джо получают больше, чем Google или правительство США. Но что дальше? Если топовые модели станут сильно дороже и лучше, крупные игроки смогут "купить интеллект", и элита снова уйдет в отрыв. Сегодня Билл Гейтс использует тот же GPT-4o, что и вы, но завтра его ребенок может учиться у GPT-8-pro-max, а ваш — у GPT-6-mini. Сейчас мы находимся в уникальном моменте: будущее уже здесь, и технологии удивительно равномерно распределены. Будущее тут, и оно доступно для всех. Власть людям! 🔗 Оригинал @ai_machinelearning_big_data #AndrejKarpathy #influencer

🔥OpenCodeReasoning: кодинга датасет от Nvidia - 735 тыс. решений на Python для 28 тыс. уникальных задач программирования - К
🔥OpenCodeReasoning: кодинга датасет от Nvidia - 735 тыс. решений на Python для 28 тыс. уникальных задач программирования - Крупнейший синтетический набор данных для генерации кода на основе рассуждений - Сгенерирован моделью R1 от NVIDIA с полным набором шагов рассуждений - Собран с 10 топовых платформ для кодинга. https://huggingface.co/datasets/nvidia/OpenCodeReasoning @ai_machinelearning_big_data #dataset #nvidia

С выходом нейросети A-Vibe российский ИИ-рынок получил новый импульс для развития. Разработанная Авито модель обошла аналоги
+1
С выходом нейросети A-Vibe российский ИИ-рынок получил новый импульс для развития. Разработанная Авито модель обошла аналоги в независимом российском бенчмарке MERA, став лучшей среди легких ИИ-моделей на русском языке. Ключевые достижения: 🟡на 25% преимущество в генерации кода перед Gemini 1.5 🟡на 32% более точные диалоги, чем у Llama 3.1 🟡на 23% выше способность анализировать смысл текста 🟡поддержка 32 тысяч токенов контекста для эффективной работы с объемными текстами «A-Vibe создавалось оптимальной по соотношению между качеством, скоростью работы и затратой ресурсов. Такой баланс позволяет обеспечивать быструю обработку запросов даже в периоды пиковой нагрузки и масштабировать технологию на всю аудиторию платформы», — отметил Андрей Рыбинцев, старший директор по данным и аналитике Авито. Уже сейчас модель работает в сервисах Авито, а до конца года получит 20 новых сценариев. В будущем нейросеть может стать открытой для всех. Чтобы увидеть актуальный рейтинг, в фильтре «Размер модели» нужно выбрать «≥5B — 10B». Это значит, что в рейтинг попадут модели размером от 5 до 10 миллиардов параметров. Цифры Human Benchmark — это реальные результаты людей. Языковые модели приближаются к этим значениям, но окончательно превзойти человека ещё не смогли. @ai_machinelearning_big_data

💼 Ежегодный отчёт AI Index 2025, опубликованный Стэнфордом HAI (Human-Centered Artificial Intelligence), представляет собой
+9
💼 Ежегодный отчёт AI Index 2025, опубликованный Стэнфордом HAI (Human-Centered Artificial Intelligence), представляет собой ежегодное исследование, которое систематизирует и анализирует ключевые тенденции в области искусственного интеллекта (ИИ). Главное: ▪Резкий рост производительности ИИ: Ai модели показывают значительное улучшение на сложных бенчмарках (например, +48.9% на GPQA, +67.3% на SWE-bench за год). ▪ Глубокая интеграция в жизнь: ИИ активно используется в медицине (FDA одобрило 223 ИИ-устройства в 2023, против 6 в 2015) и транспорте (Waymo: 150,000+ поездок/неделю). ▪ Бум инвестиций и использования в бизнесе: 78% организаций используют ИИ (рост с 55% за год). Частные инвестиции в США достигли $109.1 млрд (против $9.3 млрд в Китае). Глобальные инвестиции в генеративный ИИ - $33.9 млрд. ▪ Геополитика ИИ: США лидируют, Китай догоняет: США создали 40 передовых моделей, Китай – 15, но быстро сокращает разрыв в качестве. ▪ Ответственный ИИ (RAI) и регулирование ИИ: Развитие RAI неравномерно, но правительства активизируются. В США число федеральных ИИ-регуляторов удвоилось (59 в 2024). Глобальные упоминания ИИ в законодательстве выросли в 9 раз с 2016 года. ▪ Доступность ИИ растет: Стоимость вычислений (inference) для модели уровня GPT-3.5 упала более чем в 280 раз за ~2 года. Стоимость оборудования снижается на 30% ежегодно. Открытые модели почти догнали закрытые по производительности на некоторых задачах (разрыв сократился с 8% до 1.7% за год). ▪ Индустрия ИИ доминирует, конкуренция усиливается: Почти 90% передовых моделей созданы тех гигантами. Разрыв между топ-1 и топ-10 моделями сократился с 11.9% до 5.4% за год. 🟡Основные инсайты 🟡Полный отчет #ai #AIIndexReport #stanford

🍏🖥 Джони Айв сотрудничает с OpenAI: новое ИИ-устройство «Her-device» в процессе создания В последние недели OpenAI вела пер
🍏🖥 Джони Айв сотрудничает с OpenAI: новое ИИ-устройство «Her-device» в процессе создания В последние недели OpenAI вела переговоры о приобретении стартапа по производству оборудования io Products — совместного проекта Джони Айва (бывший главный директор по дизайну компании Apple)и Сэма Альтмана по разработке персонального устройства с поддержкой ИИ. Обсуждалась цена покупки более 500 миллионов долларов. Предполагается, что устройство не будет иметь экрана и будет управляться голосом — как в научно-фантастических фильмах. В качестве альтернативы также обсуждается партнерство. Цель проекта — более тесная интеграция ИИ в повседневную жизнь. Проект может поставить OpenAI в прямую конкуренцию с Apple. 🔗 Новость @ai_machinelearning_big_data #openai #apple

+3
🤖 RoboVerse — это универсальная платформа для исследований в области робототехники. Содержит среду для симуляции, синтетический датасет и бенчмарки. RoboVerse позволяет работать с разными симуляторами и различными типами роботов и роботизированными платформами через единый API. Позволяет легко переключаться между симуляторами, подгружать необходимые объекты, управлять физикой и т.д. Платформа ориентирована на задачи обучения с подкреплением (RL) и имитационное обучение (IL). Предусматриваются разные уровни обобщения и усложнения задач, что помогает объективно сравнивать алгоритмы и подходы. Высокая реалистичность: точная физика и фотореалистичный рендеринг улучшают перенос (sim-to-real transfer). Единая инфраструктура: снижает порог вхождения для исследователей, которые хотят тестировать алгоритмы в разных симуляторах и на разных роботах. RoboVerse упрощает проведение экспериментов и помогает получить надёжные результаты — от имитационного обучения до обучения с подкреплением и моделирования окружения. 🔥 Лицензирование: Apache License 2.0. 🟡Код 🟡Wiki 🟡Project #rl #ai #robots #IL

🖥 NVIDIA выложили в опенсорс - PhysX, включая ядро симуляции, а также связанных с ним движки Flow и Blast. Это инструменты д
+2
🖥 NVIDIA выложили в опенсорс - PhysX, включая ядро симуляции, а также связанных с ним движки Flow и Blast. Это инструменты для моделирования физики в реальном времени, позволяющий разработчикам в интерактивных приложениях и играх обеспечивать реалистичные взаимодействия объектов: от столкновений и разрушений до симуляции жидкостей и газа. PhysX является одним из самых популярных физических движков, который задействован для обработки физических взаимодействий в почти тысяче игр и входит в состав многих игровых движков, включая Unreal Engine, Unity3D, AnvilNext, Stingray, Dunia 2 и REDengine. В состав SDK входят: ✔️ PhysX — основные модули для симуляции твёрдых тел, столкновений, расчётов динамики и взаимодействий в игре; ✔️ Flow — инструментарий для симуляции жидкостей и газов, используемый в реальном времени; ✔️ Blast — библиотека для моделирования разрушений объектов. Доступно более 500 готовых ядер для CUDA Все эти компоненты применяются в пакетах NVIDIA Omniverse (платформа для совместной работы над 3D-проектами) и могут быть полезны при разработке игр или других интерактивных проектов, где нужна надёжная и гибкая система физического моделирования. С технической точки зрения движок PhysX отлично оптимизирован под параллельные вычисления на графических процессорах (особенно GPU от NVIDIA), что делает его популярным решением для высоконагруженных симуляций. С открытым исходным кодом (BSD-лицензия) PhysX можно свободно использовать, модифицировать и встраивать в собственные проекты при соблюдении условий, перечисленных в лицензии. 🔥 Лицензирование BSD 🟡Github 🟡Документация #NVIDIA #PhysX #opensource

🌟 MegaScale-Infer: rак разделение модулей внимания и FFN ускоряет работу больших языковых моделей. Обслуживание LLMс архитек
+3
🌟 MegaScale-Infer: rак разделение модулей внимания и FFN ускоряет работу больших языковых моделей. Обслуживание LLMс архитектурой MoE всегда было сложной задачей: несмотря на снижение вычислительной нагрузки за счёт «разреженной» активации экспертов, GPU часто простаивают из-за неэффективного распределения ресурсов. Новая методика MegaScale-Infer от ByteDance|Seed предлагает разделение модулей внимания и feed-forward networks (FFN) на независимые узлы с индивидуальной оптимизацией. Это не только делает загрузку GPU эффективной, но и сокращает стоимость обслуживания моделей в 1,9 раза по сравнению с аналогами. Суть MegaScale-Infer — в «дизагрегации»: модули внимания, отвечающие за работу с ключевыми значениями (KV-кэш), и FFN-эксперты распределяются по разным GPU. Например, узлы внимания можно развернуть на GPU с высокой пропускной способностью памяти, а эксперты — на устройствах с мощными вычислительными ядрами. Такой подход позволяет масштабировать каждый компонент отдельно и избежать дисбаланса, когда один модуль ждет завершения работы другого. Чтобы скрыть задержки связи между узлами, система использует конвейерный параллелизм. Запросы разбиваются на микропакеты, которые перекидываются между модулями внимания и FFN, как мячик в пинг-понге. Это минимизирует простои: пока один микропакет обрабатывается экспертами, механизмы внимания на GPU уже начинают работать со следующим. Для стабильной коммуникации между сотнями устройств разработана библиотека M2N — она ускоряет передачу данных в 4,2 раза по сравнению с NCCL, устраняя лишние копии данных и синхронизацию. Эксперименты на моделях Mixtral 8x22B (141 млрд. параметров) и DBRX (132 млрд.) показали, что MegaScale-Infer обрабатывает до 2,56Х больше токенов в секунду на один GPU, чем vLLM и TensorRT-LLM. На гетерогенных кластерах с GPU H20 (для внимания) и L40S (для экспертов) система демонстрирует еще больший эффект: стоимость генерации токена снижается в 1,86 раза за счет оптимального распределения ресурсов: H20, обладая огромной памятью, идеально подходят для работы с KV-кэшем, а L40S эффективно считают матричные операции в FFN. Для разработчиков, которые работают с LLM, MegaScale-Infer — не просто еще один фреймворк. Это инструмент, который превращает MoE-модели из ресурсоемких «монстров» в управляемые системы, где каждый GPU работает на пределе возможностей. 🟡Arxiv 🖥GitHub @ai_machinelearning_big_data #AI #ML #LLM #MLOPS #MegaScaleInfer #ByteDance

Новые возможности для инвестиций и своя "дача" у моря — это Таиланд Что, не ожидали? Регион активно развивается, рынок не пер
Новые возможности для инвестиций и своя "дача" у моря — это Таиланд Что, не ожидали? Регион активно развивается, рынок не перегрет. Стоимость недвижимости растет, потому что территория для застройки ограничена. Иностранцам доступны рассрочки, а доходность в валюте составит 5-7% при сдаче в аренду на долгий срок или до 10% посуточно. А еще здесь стабильная к $ валюта и почти 0% инфляции. Разобраться в недвижимости Таиланда помогает на своем канале аналитик Андрей Негинский. Он каждый день публикует квартиры и виллы для жизни и инвестиций, рассказывает об особенностях рынка недвижки и местного быта. Подписывайтесь на канал и забирайте подборку объектов в Таиланде в закрепленном сообщении.

🔥Llama 4 Maverick занимает 2-е место став 4-й моделью, преодолевшей отметку 1400+ на Арене , уступая лишь Gemini 2.5 Pro! -
+2
🔥Llama 4 Maverick занимает 2-е место став 4-й моделью, преодолевшей отметку 1400+ на Арене , уступая лишь Gemini 2.5 Pro! - №1 в категориях Hard Prompts, Coding, Math, Creative Writing - Огромный скачок по сравнению с Llama 3 405B: 1268 → 1417. Maverick входит в пятерку лучших во всех категориях. http://lmarena.ai/leaderboard @ai_machinelearning_big_data #llama #arena #leaderboard #llm #opensource

🦙 Встречайте, дамы и господа, LLaMA 4! Контекстное окно размером 10 М! Скачать можно здесь. https://www.llama.com/llama4/ @a
🦙 Встречайте, дамы и господа, LLaMA 4! Контекстное окно размером 10 М! Скачать можно здесь. https://www.llama.com/llama4/ @ai_machinelearning_big_data

🥹 Pokemon Gym — среда для обучения агентов игре Pokémon Red/Blue. Это интерфейс, похожий на стандартные среды RL (например, OpenAI Gym/Gymnasium), но адаптированный для игры Pokémon Red/Blue. Если хотите позалипать на выходных и попробовать различные RL-алгоритмы для обучения Ai игре в покемонов. В основе лежит эмулятор Game Boy, реализованный на Python — библиотека pyboy. Основная цель — создать и обучить ИИ-агентов, способных самостоятельно играть в Pokémon: исследовать мир, ловить покемонов, тренировать их, сражаться с другими тренерами и проходить игру. Игроку любителю потребуется ~400 шагов, чтобы поймать первого покемона, Клоду 3.7 понадобилось ~450 🤗 🔗 Github @ai_machinelearning_big_data #AIagents #ml #ai #opengym

✔️ Microsoft расширила возможности Copilot. Microsoft анонсировала масштабное обновление Copilot, добавив функции, которые де
✔️ Microsoft расширила возможности Copilot. Microsoft анонсировала масштабное обновление Copilot, добавив функции, которые делают его по-настоящему персональным. Теперь Copilot запоминает детали из жизни пользователя: от предпочтений в еде до рабочих проектов — благодаря системе «Память». Другая новинка - «Copilot Vision»: ИИ теперь «видит» через камеру смартфона или экран Windows 11, анализируя окружение в реальном времени. На ПК Copilot интегрируется с приложениями, помогая искать файлы, настраивать параметры и работать в многозадачном режиме через голосовые команды. Добавлены веб-действия: бронирование столиков, покупка билетов или подарков через партнерские сервисы Booking.com и OpenTable. А с функцией Deep Research Copilot за минуты проведет сложный анализ данных, экономя часы рутинной работы. Обновления уже доступны для iOS, Android и Windows. blogs.microsoft.com ✔️ Llama 4 может быть выпущена в конце апреля, но это не точно. Команда разработки Llama рассматривает возможность очередной отсрочки выпуска своей новой модели, который уже неоднократно переносился из-за проблем с производительностью. Компания планирует выпустить Llama 4 в конце этого месяца, но источники сообщают, что она может снова перенести дату, поскольку модель не оправдала ожиданий в задачах на рассуждение и математику. theinformation.com ✔️ OpenAI: o3 и o4-mini выйдут через пару недель, GPT-5 отложили. Сэм Альтман сообщил, что o3 и его «упрощённый» наследник o4-mini появятся уже через пару недель. Причина — задержка GPT-5, которую решили улучшить «сильнее, чем планировали». OpenAI признали: интеграция голосовых функций, поиска и глубокого ризонинга оказалась сложнее, чем предполагалось, а серверам компании нужно выдержать беспрецедентную нагрузку от недавнего релиза генератора изображений. GPT-5, которую теперь ждут через несколько месяцев, предложит три уровня доступа: базовый — с ограничениями, Plus — повышенный интеллект, а Pro — максимальные возможности. Модель объединит все инструменты ChatGPT, включая Canvas и Deep Research. Sam Altman в X (ex-Twitter) ✔️Rolmocr - новая SOTA OCR с лицензией Apache 2.0. Собрана на базе Qwen 2.5 VL В модели не используются метаданные, извлеченные из PDF-файлов. Это значительно сокращает длину запроса, что, в свою очередь, снижает время обработки и потребление VRAM - без ущерба для точности. HF ✔️ GitHub вводит премиум-тариф за Copilot. GitHub объявил о введении новых лимитов и ценовой модели для сервиса Copilot, который теперь включает плату за "премиальные" ИИ-модели. Это изменение введет ограничения на тарифы для пользователей, которые переходят с базовой модели GPT-4o на другие модели ИИ. Ожидается, что новая структура ценообразования повлияет на пользовательский опыт, особенно для тех, кто ранее полагался на бесплатный доступ к расширенным возможностям. github.blog @ai_machinelearning_big_data #news #ai #ml