Machinelearning

Відкрити в Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Сітка:Machinelearning Росія1 270 Технології та додатки328...

📈 Аналітичний огляд Telegram-каналу Machinelearning

Канал Machinelearning (@ai_machinelearning_big_data) у мовному сегменті Російська є активним учасником. На даний момент спільнота об'єднує 296 497 підписників, посідаючи 328 місце в категорії Технології та додатки та 1 270 місце у регіоні Росія.

📊 Показники аудиторії та динаміка

З моменту свого створення невідомо, проект продемонстрував стрімке зростання, зібравши аудиторію у 296 497 підписників.

За останніми даними від 19 червня, 2026, канал демонструє стабільну активність. Хоча за останні 30 днів спостерігається зміна кількості учасників на -6 252, а за останні 24 години на -213, загальне охоплення залишається високим.

Статус верифікації: Не верифікований
Рівень залученості (ER): Середній показник залученості аудиторії становить 8.08%. Протягом перших 24 годин після публікації контент зазвичай збирає 5.74% реакцій від загальної кількості підписників.
Охоплення публікацій: В середньому кожен допис отримує 23 972 переглядів. Протягом першої доби публікація в середньому набирає 17 005 переглядів.
Реакції та взаємодія: Аудиторія активно підтримує контент: середня кількість реакцій на один пост – 185.
Тематичні інтереси: Контент зосереджений навколо ключових тем, таких як openai, claude, api, gemini, контекст.

📝 Опис та контентна політика

Автор описує ресурс як майданчик для висловлення суб'єктивної думки:
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

Завдяки високій частоті оновлень (останні дані отримано 20 червня, 2026), канал підтримує актуальність та високий рівень охоплення публікацій. Аналітика показує, що аудиторія активно взаємодіє з контентом, що робить його важливою точкою впливу в категорії Технології та додатки.

296 497

Підписники

-21324 години

-1 4247 днів

-6 25230 день

23 972

Перегляди допису

~ 17 00524 години

~ 19 20848 годин

8.08%

Коефіцієнт залучення

~ 5

Дописів на день

Ads index

beta

Архів дописів

296 503

✔️ Jan-nano от Menlo Research — модель на базе Qwen3 всего на 4B параметров, созданная для Deep Research. Модель заточена и оптимизирована для интеграции с Model Context Protocol (MCP). 📊 На SimpleQA (agentic / MCP) — Jan-nano набирает 80.7 Это серьёзный результат для модели такого размера! Модель работает через Jan — open-source альтернативу ChatGPT, которая запускается локально. 🔍 Jan-nano — ещё один пример того, как компактные модели могут конкурировать с большими моделями благодаря обучению и агентной архитектуре. ▪ HF: https://huggingface.co/Menlo/Jan-nano @ai_machinelearning_big_data #LLM #JanNano #MCP #OpenSourceAI

296 503

🤖 Китайцы впустили RoboBrain 2.0 — открытую универсальную модель ИИ RoboBrain 2.0 — это open-source модель общего назначения окружения, способная к широкому спектру задач: от восприятия до управления роботами. Её уже называют фундаментом для следующего поколения гуманоидов. 🔹 Поддерживает планирование, восприятие и действия в реальном мире 🔹 Заточен на легкую интеграцию в реальные проекты и роботиизированные системы 🔹 Полностью открытый код Архитектура: • Обрабатывает изображения, длинные видео и визуальные данные высокого разрешения • Понимает сложные текстовые инструкции и графы сцены • Входные данные: — Визуальные — проходят через Vision Encoder + MLP Projector — Текстовые — превращаются в унифицированный токен-поток • Всё подаётся в LLM Decoder, который выполняет рассуждение, строит планы, определяет координаты и пространственные связи С такими темпами более чем реально, что уже к 2027 году мы увидим массовое производство продвинутых гуманоидных роботов. ИИ выходит в физический мир — и делает это уверено. Запуск:

git clone https://github.com/FlagOpen/RoboBrain2.0.git
cd RoboBrain

# build conda env.
conda create -n robobrain2 python=3.10
conda activate robobrain2
pip install -r requirements.txt

▪Github: https://github.com/FlagOpen/RoboBrain2.0 ▪Hugging face: https://huggingface.co/collections/BAAI/robobrain20-6841eeb1df55c207a4ea0036/ @ai_machinelearning_big_data #ai #ml #robots #ComputerVision #BAAI

296 503

Доброе утро, поклонники AI! Сегодня — тот день, когда всё внимание приковано к событию в ТехноХабе Сбера в Петербурге! Именно здесь открывает новый день международная сессия AI Journey — с актуальными темами, живыми спикерами и технологиями, которые меняют отрасли. Сегодня в программе суперэксперты из Индии, Китая и Сербии, а российскую сторону представляют Сбер, Сколтех, Институт AIRI и другие технологические лидеры AI-индустрии. 🔗 Подключайтесь к трансляции — всё самое интересное начинается сейчас.

296 503

🌟 SEAL: Еще одна попытка создать пайплайн самообучающихся LLM. SEAL - это методика от MiT, позволяющая LLM самостоятельно генерировать обучающие данные и настраивать параметры обучения, чтобы адаптироваться к новым задачам. Вместо традиционного файнтюна на внешних данных модель учится рефлексировать: анализировать контекст, создавать из него синтетические данные и применять их для корректировки собственных весов через механизм усиленного обучения. SEAL, по сути, это два разделенных цикла: 🟢Внешний цикл использует RL, чтобы научить модель генерировать «самоизменения» (инструкции на естественном языке, описывающие, какие данные использовать и как настраивать параметры). 🟢Внутренний цикл реализует эти изменения: модель дообучается на сгенерированных данных, а затем тестирует результат на конкретной задаче. За коррекцию отвечает RL-алгоритм ReSTEM, который оценивает эффективность изменений и обновляет стратегию генерации инструкций. Для экономии ресурсов используются легковесные адаптеры LoRA, которые модифицируют только часть параметров модели. Этот процесс повторяется, постепенно формируя у модели навык преобразования исходных данных в полезные обучающие сигналы. SEAL протестили на 2 задачах: интеграции новых знаний и few-shot обучении. В первом случае модель генерирует логические следствия из текста, дообучается на них и улучшает точность ответов на вопросы без доступа к исходному тексту. Во втором случае SEAL выбирает оптимальные аугментации данных и гиперпараметры для обучения на примерах задач ARC-AGI. В обоих сценариях SEAL превзошел подходы с фиксированными шаблонами (ICL, TTT+Self Edit без RL и) и даже синтетическими данными от GPT-4.1. Метод скорее академический и по большей части экспериментальный, у него есть ограничения: 🟠При последовательном применении изменений модель склонна к «катастрофическому забыванию» — потере знаний, усвоенных ранее; 🟠Сопутствующие вычислительные затраты, так как каждая итерация требует дообучения и тестирования модели. ▶️В репозитории проекта разработчики выложили код, данные и инструкции для двух направлений: 🟢Включение новых фактических знаний; 🟢Адаптация к новым задачам на основе примеров. 📌Лицензирование: MIT License. 🟡Страница проекта 🟡Arxiv 🖥GitHub @ai_machinelearning_big_data #AI #ML #LLM #SEAL #RL #MiT

296 503

📄 Dolphin — новая OCR модель ByteDance для понимания сложных документов в виде изображений Dolphin — это мультимодальная модель, которая умеет разбирать сканы и фотографии документов, включая текст, таблицы, формулы и графики. Подойдет для автоматизации чтения и структурирования PDF-файлов, отсканированных отчётов и научных статей. Как работает модель: 1️⃣ Анализ страницы — модель определяет порядок элементов доцентов так, как читает человек 2️⃣ Разбор содержимого — параллельно обрабатываются абзацы, таблицы, формулы и другие элементы, используя специальные встроенные промпты Архитектура: • Визуальный энкодер — Swin Transformer • Текстовый декодер — MBart • Управление через промпты 📌 Возможности: • Постраничная обработка документа • Точечный парсинг отдельных элементов (например, таблиц) • Высокая точность и скорость работы модели • Открытая MIT-лицензия Установка:

git clone https://github.com/ByteDance/Dolphin.git
cd Dolphin

• Github • HF • Demo @ai_machinelearning_big_data #ocr #ByteDance

296 503

🔥 Успех в IT = скорость + знания + окружение Здесь ты найдёшь всё это — коротко, по делу и без воды. Пока другие ищут, где “подглядеть решение”, ты уже используешь самые свежие инструменты! Python: t.me/pythonl Linux: t.me/linuxacademiya Собеседования DS: t.me/machinelearning_interview МЛ: t.me/machinelearning_ru C++ t.me/cpluspluc Docker: t.me/DevopsDocker Хакинг: t.me/linuxkalii Devops: t.me/DevOPSitsec Data Science: t.me/data_analysis_ml Javascript: t.me/javascriptv C#: t.me/csharp_ci Java: t.me/java_library Базы данных: t.me/sqlhub Python собеседования: t.me/python_job_interview Мобильная разработка: t.me/mobdevelop Golang: t.me/Golang_google React: t.me/react_tg Rust: t.me/rust_code ИИ: t.me/vistehno PHP: t.me/phpshka Android: t.me/android_its Frontend: t.me/front Big Data: t.me/bigdatai МАТЕМАТИКА: t.me/data_math Kubernets: t.me/kubernetc Разработка игр: https://t.me/gamedev Haskell: t.me/haskell_tg Физика: t.me/fizmat 💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy Папка ML: https://t.me/addlist/2Ls-snqEeytkMDgy Папка FRONTEND: https://t.me/addlist/mzMMG3RPZhY2M2Iy 😆ИТ-Мемы: t.me/memes_prog 🇬🇧Английский: t.me/english_forprogrammers 🧠ИИ: t.me/vistehno 🎓954ГБ ОПЕНСОРС КУРСОВ: @courses 📕Ит-книги бесплатно: https://t.me/addlist/BkskQciUW_FhNjEy Подпишись, если хочешь быть в числе тех, кого зовут в топовые проекты!

296 503

✔️ Google DeepMind запустила Weather Lab с ИИ для прогнозирования циклонов. Weather Lab - это сервис, где Google DeepMind тестирует экспериментальные модели ИИ для прогноза тропических циклонов. Инструмент генерирует 50 сценариев развития стихии за 15 дней, используя стохастические нейросети. Традиционные физические модели часто жертвуют точностью интенсивности ради прогноза траектории, но ИИ-система DeepMind совмещает оба параметра. В тестах ее предсказания на 5 дней в среднем ближе к реальным координатам циклона на 140 км по сравнению с ведущими глобальными решениями. Также модель превосходит региональные физические аналоги в оценке силы урагана и радиуса ветров. deepmind.google ✔️ Новый метод ICM позволяет ИИ обучаться без человеческого контроля. Исследователи из Anthropic, Университетов Нью-Йорка и Джорджа Вашингтона разработали метод Internal Coherence Maximization (ICM), который учит языковые модели работать с задачами, опираясь на собственную логику. Модель сама проверяет, насколько ответы согласуются между собой (взаимная предсказуемость) и нет ли противоречий (логическая непротиворечивость). На тестах (TruthfulQA, GSM8K, Alpaca) ICM показал результаты, сравнимые с обучением на человеческих оценках, а в задачах на «субъективные» критерии даже превзошел их. Например, модель без специальной тренировки определила пол автора текста с точностью 80% — выше, чем у людей. Даже при обучении чат-бота Claude 3.5 Haiku через ICM система выигрывала в 60% случаев против версии с человеческим контролем. Однако метод не всесилен: он работает только с теми понятиями, которые модель уже «знает», и терпит неудачу с длинными текстами или задачами, требующими новых знаний. alignment-science-blog.pages.dev ✔️ NVIDIA и Stability AI оптимизировали Stable Diffusion 3.5 с помощью TensorRT. Совместная работа NVIDIA и Stability AI позволила ускорить генерацию в Stable Diffusion 3.5 и сократить использование видеопамяти. Модель Large, ранее требовавшая 18 ГБ VRAM, теперь работает с 11 ГБ благодаря FP8-квантованию, что делает ее доступной для большего числа GPU. На RTX 40-й серии и Blackwell-чипах FP8 и FP4 показали двукратный прирост производительности по сравнению с PyTorch. TensorRT оптимизировал граф модели и веса под Tensor Cores, ускорив SD3.5 Large на 2,3x и Medium — на 1,7x. Разработчики также получили облегченный SDK (в 8 раз меньше) с JIT-компиляцией, позволяющий строить движки «на лету» через Windows ML. Оптимизированные версии уже доступны на Hugging Face, а в июле появится NIM-микросервис для упрощения интеграции в приложения. blogs.nvidia.com ✔️ Google добавила новые функции Gemini AI для Workspace. Google расширила возможности Gemini AI в Workspace, добавив функции для анализа PDF и Google-форм. Система автоматически создает краткие сводки при открытии PDF, предлагая действия «составить предложение» или «сгенерировать вопросы ». Эти подсказки появляются в боковой панели и работают на 20+ языках с 12 июня. Для Google-форм ИИ теперь подводит итоги ответов на открытые вопросы, выделяя ключевые темы. Эта опция активируется при трех и более ответах и станет доступна с 26 июня, но пока только на английском. Еще одна новинка, которую видят пользователи с 7 июля — «помоги создать форму», позволяющая генерировать шаблоны на основе описаний и прикреплённых файлов (Docs, Sheets и т.д.). workspaceupdates.googleblog.com ✔️ Китайские инженеры учат ИИ за границей, обходя санкции США. Четверо китайских инженеров прилетели в Малайзию с чемоданами, набитыми жесткими дисками: 80 терабайт данных для обучения ИИ. В местном дата-центре их компания арендовала 300 серверов с чипами Nvidia, запрещенными к экспорту в Китай. Подобные схемы — ответ на давление США, ограничивающее поставки технологий. Физическая доставка данных вместо медленной передачи через интернет, создание подставных компаний в Малайзии и переадресация оборудования через третьи страны — так китайские фирмы обходят контроль. Но санкции сжимаются: Nvidia усиливает проверки, а страны ЮВА ужесточают правила. wsj.com @ai_machinelearning_big_data #news #ai #ml

296 503

📌Реверс-инженерия GPT-2 методом трассировки цепей Cross-Layer Transcoders. Goodfire AI, вдохновившись примером Anthropic в интерпретации внутренних процессов Claude, воспроизвели методы трассировки цепей межслойных транскодеров (Cross-Layer Transcoders, CLT) на GPT-2 Small, чтобы проверить их способность раскрывать известные механизмы трансформеров. Выбор на GPT-2 Small пал не случайно, эта модель небольшая и уже была ранее подвергнута ручному реверс-инжинирингу.

Cross-Layer Transcoders выжимают из модели разреженные признаки, которые объясняют работу MLP-слоев. Визуализируют это через графы атрибуции — это карты влияния признака на выход модели.

Натренировали на 100M токенов из FineWeb, получили ~590K признаков. Точность CLT-реплики модели составила 59%, что близко к оригинальным статьям. Тестировали на задаче сравнения чисел («больше, чем»), идеальном полигоне, где уже известны ключевые механизмы.

Задача "Больше, чем" (ориг. "greater-than") взята из статьи Michael Hanna, она заставляет предсказывать большие числа для второго года в диапазоне дат.

▶️ Главный эксперимент: Промпт «The war lasted from the year 1711 to 17». CLT построил граф, где признаки с токена «11» (последняя цифра года) активнее всего влияли на предсказание. Дальше, выделили топ-160 признаков, для каждого построили логит-атрибуции — теплокарты, показывающие, как признак влияет на выходные годы (ZZ) при разных входных (YY). ▶️ Что нашли: 🟢Признаки «больше, чем»: Feature 425104 (слой 8) активируется на больших числах в хронологии (даты, войны). Но его теплокарта продвигает выходы >60, независимо от входа, а вот Feature 461858 работает только для YY=6–14 и продвигает ZZ=10–30. Похоже, CLT подсветил кучу узкоспециализированных «сравнивателей», а не универсальные нейроны, как в ручных исследованиях. 🟢Сюрпризы: Feature 399423 — вообще не про числа. Он кодирует четность и контраст: активируется на «and» в «pros and cons», а в задаче продвигает четные ZZ при нечетных YY. Абстракция уровня «противоположность» — такого в прошлых работах не видели. 🟢Странности: Feature 402486 вообще саботирует задачу: продвигает малые числа. Или Feature 349410 — работает только для YY=11, хотя ее max-активации показывают числа до 30. ▶️ Выводы: CLT автоматически находит интерпретируемые признаки, даже такие неочевидные, как абстрактная четность. Но их «разреженный» мир выглядит иначе, чем ручная трассировка цепей: тут больше узких признаков-«спецов» (Feature 461858 для диапазона 10–30) и меньше универсальных механизмов. Возможно, дело в методе: CLT смотрит изолированные вклады фич, а в полной модели они взаимодействуют. В общем, эксперименты с CLT показал, что под капотом языковых моделей не только четкие «сравниватели чисел», но и куча скрытых паттернов вроде детекторов контраста или любителей чисел, кратных 5. И да, полуавтономный анализ иногда видит то, что люди упускают. 🔜 Читать полную статью @ai_machinelearning_big_data #AI #ML #LLM #Research #CLT

296 503

🚀 Релиз Hunyuan 3D 2.1! Первая полностью open-source, готовая к продакшену PBR 3D генеративная модель! PBR (Physically Based Rendering) - это технология, при которой внешний вид 3D-объектов рассчитывается с учётом реальных физических законов взаимодействия света и поверхности. ✅ Модель выдает кинематографичное качество: синтез PBR-материалов — кожа, бронза и другие поверхности выглядят фотореалистично с красивыми эффектами освещения. ✅ Open source: доступны веса модели, код для обучения и инференса, пайплайны — всё можно доработать под себя. ✅ Запускается даже на потребительских GPU (Модель тестировалась на GPU A100 с Python 3.10 и PyTorch 2.5.1+cu124.) — с моделью создавать 3D-контент могут не только студии, но и любые разработчики и малые команды. ▪ Модель: https://huggingface.co/tencent/Hunyuan3D-2.1 ▪ Github: https://github.com/Tencent-Hunyuan/Hunyuan3D-2.1 ▪ Hunyuan 3D Creation Engine: https://3d.hunyuan.tencent.com @ai_machinelearning_big_data #Hunyuan3D #OpenSource #3DCreation #tencent

296 503

🚨 NVIDIA показала будущее ИИ на GTC Paris Вот 7 самых интересных анонсов 👇 1️⃣ NVL72 — система из 72 Blackwell GPU Пропускная способность — 130 ТБ/с. Идеально для сверхмасштабных AI-систем. • Лидерство в скорости инференса • Поддержка популярных моделей: DeepSeek-R1, Llama 3.1 405B, Llama 3.3 70B и другие • Второе поколение Transformer Engine с поддержкой FP4 • TensorRT Model Optimizer для квантования моделей в FP4 2️⃣ Фабрики ИИ Дженсен назвал их *"фабриками интеллекта"*. Огромные центры на Blackwell, NVLink и жидкостном охлаждении, работающие без остановки. «Мы строим сеть AI-фабрик в Европе, чтобы локальные идеи становились глобальными инновациями»*, — Дженсен Хуанг 3️⃣ Цифровые двойники Всё, что создаётся в физическом мире, будет сперва оцифровано в виртуальный мир 4️⃣ Agentic AI — следующий важный этап ИИ, которые наблюдают, размышляют, действуют и учатся. Постоянно обучающиеся агенты, способные переосмысливать свои решения. 5️⃣ CUDA-Q на Grace Blackwell CUDA-Q — это open-source платформа для разработки гибридных квантовых приложений, объединяющая GPU, CPU и QPU в единую систему. Она “qubit-agnostic” — поддерживает любые типы кубитов и QPU-архитектуры. 🔹 Гибридный код: квантовые и классические вычисления в одном потоке 🔹 До 2500× ускорение симуляций на GPU 🔹 Лучшие компиляторы и рантайм-инструменты 🔹 Интеграция с AI и HPC-воркфлоу 🔹 Поддержка всех типов QPU и кубитных технологий 🔹 Работает с реальными и симулируемыми квантовыми процессорами 6️⃣ Суверенный AI в Европе Франция, Германия, UK, Финляндия, Италия и Испания создают свои AI-инфраструктуры в партнёрстве с NVIDIA. 7️⃣ DGX Cloud Lepton от NVIDIA + Hugging Face Глобальный доступ к GPU в один клик. Hugging Face запускает Training Cluster as a Service — теперь обучение LLM напрямую интегрировано с Lepton. @ai_machinelearning_big_data #NVIDIA #GTC

296 503

✔️ В Пекине запустят первый в мире 4S-центр для роботов с воплощенным ИИ. По аналогии с автосалонами, робототехнический 4S будет предлагать полный цикл: продажи (Sales), сервис (Service), запчасти (Spare parts) и консультации/анализ (Surveys). Планируется зона с демонстрацией роботов в реалистичных сценариях – можно будет всё пощупать руками и увидеть их возможности в деле. Плюс создадут быструю сеть поставки комплектующих по стране и соберут профильную команду для сборки, ремонта и обслуживания машин. Первыми партнерами станут несколько лидеров сферы: UBTECH и Galaxea. Откроется центр в августе на базе промпарка в районе Ичжуан на юге столицы. english.news.cn ✔️ Браузер Dia выходит в бета-версию. The Browser Company открыл доступ к бета-версии браузера Dia (по инвайтам). Dia позиционируется как решение, где ИИ глубоко интегрирован в самую суть взаимодействия, он встроен прямо в рабочий процесс пользователя, избавляя от необходимости постоянно ходить на сайты ChatGPT или Claude. Dia построен на Chromium, так что интерфейс многим знаком. Главная фича — умная адресная строка: она работает и как поиск, и как чат-бот с ИИ. Помощник умеет искать в сети, суммировать загруженные файлы, автоматически переключаться между режимами. Можно даже спросить его о содержимом всех открытых вкладок или попросить составить черновик на их основе. Настройки производятся через диалог с ботом: можно задать тон, стиль письма, параметры для кода. Опция History (по желанию) позволяет браузеру использовать недельную историю просмотров как контекст для ответов. А функция Skills помогает создавать мини-скрипты — ярлыки для сложных настроек или действий. techcrunch.com ✔️ Mistral запускает вычислительную альтернативу облачным гигантам. Mistral AI анонсировала Mistral Compute - инфраструктурную платформу для разработки и запуска ИИ. Это полноценный приватный стек: от GPU и систем оркестрации до API и сервисов. На выбор любой формат, от bare-metal до полностью управляемой PaaS. Mistral Compute нацелен дать государствам, компаниям и научным центрам, ищущих альтернативу решениям из США или Китая, возможность самим строить ИИ-среду под свои нужды и полностью ею владеть. Платформа использует новейшие архитектуры NVIDIA, с доступом к десяткам тысяч GPU. Она создана командой с огромным опытом в HPC и обучении топовых ИИ-моделей. Ключевые акценты: устойчивость и суверенитет данных, инфраструктура соответствует строгим европейским нормам и работает на декарбонизированной энергии. mistral.ai ✔️ ByteDance анонсировала text-to-video модель Seedance 1.0. Seedance 1.0 - новая генеративная модель для создания видео, которая, по утверждениям ByteDance, превосходит конкурентов в точности выполнения запросов, качестве движений и резкости изображения. В тестах на Artificial Analysis она лидирует в задачах text-to-video и image-to-video, обходя Google Veo 3, Kuaishou Kling 2.0 и OpenAI Sora. Модель справляется с длинными сценами, сохраняя стабильность персонажей и переходов между ракурсами, но пока не поддерживает добавление звука. Seedance 1.0 генерирует 5-секундный Full HD-ролик за 41 секунду — это быстрее аналогов, хотя новый Google Veo 3 Fast может нивелировать это преимущество. Инструмент планируют внедрить в платформы Doubao и Jimeng. Целевая аудитория — от профессиональных видеомейкеров до обычных пользователей. seed.bytedance.com ✔️ Midjourney открыла публичное тестирование своей видеомодели. Midjourney объявила о начале открытого тестирования модели генерации видео по текстовым запросам. Задача тестирования собрать обратную связь для улучшения алгоритма. Создатели пригласили сообщество принять участие в онлайн-рейтинге сгенерированных роликов, присоединиться можно по ссылке. Пока некоторые образцы выглядят достойно и сохраняют фирменный стиль Midjourney, но в целом результаты пока нестабильны. Компания подчеркивает: это не финальная версия модели, а лишь первый шаг. Дополнительные сессии тестирования уже запланированы, но дату релиза и цену пока не раскрывают. midjourney.com @ai_machinelearning_big_data #news #ai #ml

296 503

🚀 Cosmos-Predict2 — новая открытая версия видео-модели для Physical AI от NVIDIA! Cosmos-Predict2 — ключевая часть экосистемы World Foundation Models (WFMs), созданная для Physical AI. Модель умеет предсказывать будущее состояние визуального мира, используя текст и видео. Cosmos разработан для ускорения обучения моделей, которые понимают физику, среду и действия — от автономных автомобилей до роботов. Выглядит очень интересно. Это самое мощное поколение моделей в экосистеме Cosmos. Модель заметно улучшена по сравнению с Predict1: 🎯 лучшее качество видео 🧠 точнее соответствует текстовому описанию 🎥 более реалистичная динамика движения 📊 Cosmos-Predict2 превосходит другие open-source видео foundation-модели. ▪ Веса ▪ Полный код для инференса и обучения (с туториалами) @ai_machinelearning_big_data #Cosmos #NVIDIA

296 503

🌟 NVIDIA cuOpt: GPU-решатель для оптимизации решений. NVIDIA опубликовала в открытом доступе свой проект cuOpt. Это набор инструментов оптимизации, который использует ресурсы и возможности GPU для решения сложных задач линейного программирования, маршрутизации и логистики. cuOpt помогает находить эффективные решения для проблем с миллионами переменных, где традиционные методы терпят крах., превращая «нерешаемые» задачи в реальные решения, без жертвования масштабом или скоростью. Это, своего рода, «турбокомпрессоре» для задач, где время и точность критически важны, от доставки товаров до расписаний производства. cuOpt состоит из C++-движка и API (Python, C и другие), которые работают как обертки, которые дают возможность гибко интегрировать библиотеку в разные проекты. Для задач маршрутизаций (TSP, VRP, PDP) cuOpt генерирует начальные решения, а затем улучшает их итеративно, используя эвристические алгоритмы. Это не «лобовое» вычисление всех вариантов, а умный поиск, который экономит ресурсы и время. Методы работы с линейным программированием (LP) и смешанными целочисленными задачами (MILP) тоже уникальны. Для LP применяется PDLP — алгоритм первого порядка, который использует градиентный спуск и работает на GPU, альтернативно запускаясь на CPU с симплекс-методом.

Смешанное целочисленное программирование - это метод математической оптимизации, позволяющий решать задачи с использованием смеси непрерывных переменных (которые могут иметь любое значение, включая десятичные и дробные), дискретных переменных и двоичных переменных.

В MILP немного сложнее: на GPU выполняются эвристики для поиска допустимых решений (локальный поиск, «feasibility pump»), а CPU занимается ветвлениями и границами, улучшая оценку. Решения между GPU и CPU обмениваются в реальном времени, создавая гибридную систему. ▶️ NVIDIA cuOpt предлагает несколько вариантов развертывания, адаптированных под разные задачи: pip, conda или готовый контейнер Docker / NSG. Еще поддерживаются (с минимальным рефакторингом) инструменты AMPL и PuLP, с помощью которых сценарии использования cuOpt значительно расширяются. В репозитории проекта разработчики собрали примеры и Jupyter-ноутбуки, которые можно запустить локально или в облачных сервисах: Google Colab (с выбором GPU-среды) или NVIDIA Launchable. 📌 Лицензирование: Apache 2.0 License. 🟡Страница проекта 🟡Документация 🖥GitHub @ai_machinelearning_big_data #AI #ML #DS #NVIDIA #CuOPT

296 503

✔️ NVIDIA меняет планы разработки новых архитектур: чипы Rubin и процессоры Vera могут появиться уже в сентябре. Новые графические процессоры серии Rubin R100 и процессоры Vera, вероятно, дебютируют в сентябре. Это стало возможным благодаря ускорению графика разработки — теперь обновления выходят каждые 6 месяцев вместо традиционных 12. Rubin R100 будет использовать память HBM4, литографию TSMC 3 нм и упаковку CoWoS-L, а также впервые внедрит чиплет-дизайн с 4-кратным увеличением площади кристалла. . Вместе с этим линейка Vera сменит ARM-процессоры Grace и будет основан на новом поколении ядер ARM, обещая значительный прирост производительности. Смена графика разработки несет в себе риски: рынок может не успеть адаптироваться, а первые партии часто сталкиваются с проблемами, как это было с Blackwell. ctee.com.tw ✔️ Google Cloud представил новые виртуальные машины G4 с GPU NVIDIA Blackwell. Google Cloud анонсировал превью новых виртуальных машин G4 на базе GPU NVIDIA RTX PRO 6000 Blackwell, став первым публичным облаком, внедрившим эту технологию. Каждый экземпляр объединяет 8 GPU, два процессора AMD Turin с 384 виртуальными ядрами и 1,5 ТБ памяти DDR5, а также сетевые ускорители Titanium с пропускной способностью до 400 Гб/с. Все это дает в 4 раза большую вычислительную мощность и увеличенную в 6 раз пропускную способность памяти по сравнению с предыдущим поколением. G4 подходит для задач от ИИ-инференса до рендеринга и симуляций с физически точными расчетами. RT-ядра ускоряют трассировку лучей для реалистичной графики, а фреймворк NVIDIA Dynamo оптимизирует обработку генеративных моделей. Экземпляры будут доступны в составе системы AI Hypercomputer и получат интеграцию с сервисами Google Cloud. Доступность новых VM - ближе к концу года. cloud.google.com ✔️ Сроки релиза модели с открытыми весами от Open Ai перенесены. OpenAI откладывает релиз открытой языковой модели до конца этого лета, сообщил генеральный директор Сэм Альтман в X. Первоначально модель планировалось выпустить до конца июня и она, по обещаниям, должна быть с ризонингом. Альтман сказал, что исследовательская группа достигла неожиданного прогресса, который теперь требует больше времени, назвав результат "стоящим ожидания". Sam Altman в сети X ✔️ Disney и Universal подали в суд на Midjourney. Компании подали совместный иск против разработчика ИИ-генератора Midjourney, обвиняя его в нелегальном создании изображений персонажей Дарта Вейдера и Миньонов. Судебный иск был зарегистрирован в федеральном суде Калифорнии, где стороны заявили, что Midjourney продолжал использовать защищенные авторским правом материалы даже после предыдущих требований остановить это. Студии требуют компенсации убытков, запрета на дальнейшее использование образов и проведения судебного разбирательства с присяжными. Midjourney пока не ответила на запрос публично. wsj.com ✔️ ChatGPT проиграл в шахматы программе 1977 года. ChatGPT 4o потерпел неожиданное поражение от шахматной игры 1979 года для консоли Atari 2600 — даже на уровне «начинающий». Инженер Robert Caruso протестировал систему через эмулятор, удивившись, как ChatGPT повторял грубые ошибки: забывал где находятся фигуры и путал их, обвинял слишком абстрактные иконки Atari и пропускал элементарные угрозы. Программа Atari, работавшая на процессоре 1.19 МГц и анализировавшая лишь 1-2 хода вперед, обыграла нейросеть без шансов на победу. Хотя Роберт менял оформление фигур, пытаясь облегчить задачу, ChatGPT продолжал «тупить», давал обещания выиграть в следующей партии, но в итоге сдался. tomshardware.com @ai_machinelearning_big_data #news #ai #ml

296 503

🔥 Manus Chat Mode — чат с ИИ бесплатно и без ограничений для всех! 💬 Работает супер быстро. 🚀 Так же доступен Agent Mode с расширенными возможностями. От простых вопросов до сложных задач — всё в одном окне : https://manus.im/ @ai_machinelearning_big_data #news #ai #ml #manus

296 503

AI-инфраструктура Авито: практические решения для LLM и VLM На Data Fest 2025 команда Авито показала, как устроена их внутренняя ML разработка. В основе большинства продуктовых ИИ-решений — собственная языковая модель A-Vibe (до 7 млрд параметров, обучена на 700 млрд токенов). Для нее специально сделали токенизатор под русский язык — он обрабатывает тексты на 29% эффективнее стандартных. Это позволило в два раза ускорить работу модели. A-Vibe уже работает в продакшене и заняла первое место среди моделей до 7 миллиардов параметров в бенчмарке МЕРА. Для техподдержки сделали инструмент на базе LLM: он переписывает ответы агентов, чтобы они звучали более эмпатично и по-человечески, и саммаризует обращения при передаче между сотрудниками. Агенты довольны: 97% отметили, что стало удобнее. Под все это в Авито построили свою ML-платформу. В ней есть хранилище признаков для моделей, система разметки с проверкой качества и решение Aqueduct — оно встраивается прямо в модель и экономит до 30% ресурсов на инференсе. Платформа уже позволяет запускать продакшен-модели без программирования, через no-code интерфейс. Стажеры тоже работают с реальными задачами — например, обучают модели с нуля и оптимизируют пайплайны. Один такой проект помог в 10 раз сократить расходы на проверку звонков. Отдельный блок на фестивале занял ML Cup от Авито. Участники решали задачи по рекомендациям и поиску дублей — те же, что крутятся в продакшене и обрабатывают 4 миллиарда событий в день. За два месяца подали 6500 решений, в конкурсе участвовало почти 900 человек.

296 503

🔥 Опубликован 65-й выпуск рейтинга TOP500 — списка самых мощных суперкомпьютеров мира 💡 Тройка лидеров осталась неизменной: • El Capitan (США, Ливерморская нац. лаборатория): 11 млн CPU ядер (AMD EPYC + GPU AMD MI300X), 1.742 экзафлопса, ОС HPE Cray OS (SUSE Linux). • Frontier (США, Ок-Ридж): 9 млн CPU (AMD EPYC + MI250X), 1.353 экзафлопса, ОС HPE Cray OS. • Aurora (США, Аргонн): 9.2 млн CPU (Intel Xeon Max + GPU Max), 1.012 экзафлопса, ОС SUSE Linux Enterprise Server 15 SP4. 🔹 На 4-е место вышел JUPITER Booster (Германия): 4.8 млн ядер (NVIDIA GH200), 793 петафлопса, ОС RHEL. 🔟 **Кластеры 5–10 мест:** - Eagle (Microsoft Azure, США): 561 петафлопс - HPC6 (ЭНИ, Италия): 477 петафлопс - Fugaku (Япония): 442 петафлопса - Alps (Швейцария): 434 петафлопса - LUMI (Финляндия): 379 петафлопс - Leonardo (CINECA, Италия): 241 петафлопс 🇷🇺 Российские суперкомпьютеры: - Червоненкис (Яндекс): 75 место, 21.5 петафлопса - Галушкин (Яндекс): 102 место, 16 петафлопс - Ляпунов (Яндекс): 120 место, 12.8 петафлопса - Christofari Neo (Сбер): 125 место, 11.95 петафлопса - Christofari (Сбер): 201 место - Lomonosov 2: 495 место (в 2015 году был на 31 месте) 🌍 Страны по количеству систем: - США: 175 кластеров (48.4% производительности) - Китай: 47 кластеров (2%) - Германия: 41 (8.6%) - Япония: 39 (8.9%) - Франция: 25 (2.4%) - Италия: 17 (6.3%) - Россия: 6 (0.1%) 🧠 Тренды: - Все 500 систем используют Linux. - Дистрибутивы: неизвестно (38.2%), RHEL (20%), Ubuntu (11.8%), Cray Linux (9.8%), CentOS (8.2%), Rocky (5.8%), SUSE (4.2%), Alma (1.6%) - Минимальный порог входа в рейтинг: 2.44 петафлопса. - Общее число процессорных ядер: 137.6 млн. - С ускорителями работают 234 кластера (в основном NVIDIA A100). 🔧 Лидеры среди производителей: - Lenovo (27.2%) - HPE (26.4%) - EVIDEN (11%) - Dell EMC (8.2%) - NVIDIA (5.4%) 🌐 Сети: - InfiniBand — 54.2% (40.3% производительности) - Ethernet — 32.8% (52.2%) - Omni-Path — 6.6% 📊 Также обновлён рейтинг Graph500 (оценка задач с графами) и интегрированы рейтинги Green500, HPCG и HPL-AI. 🔥 За 10 лет производительность Top500 выросла с 0.31 до 13.8 экзафлопсов. Для входа в Top100 теперь нужно минимум 16.59 петафлопса. 📌 Подробнее @ai_machinelearning_big_data #news #ai #ml

296 503

🎥 ByteDance только что выпустили код для SeedVR2 — улучшенной версии модели для восстановления видео 🛠️ Что это? SeedVR2 — одношаговая диффузионная модель для восстановления видео, которая проходит пост-тренировку в противоборстве с реальными данными. Она показывает отличные результаты даже на высоком разрешении. 🔍 Зачем нужна SeedVR2? Обычные модели плохо справляются с AIGC и реальными видео — особенно в мелких деталях вроде текста и лиц. Даже продвинутые диффузионные методы, использующие ControlNet или адаптеры, работают только на фиксированном разрешении (512, 1024) и требуют нарезки видео на перекрывающиеся патчи. Это: • сильно замедляет работу • усложняет обработку длинных и больших видео 🚀 Что нового в SeedVR2: • Восстановление на любом разрешении без заранее обученного диффузионного приоритета • Архитектура с крупным диффузионным трансформером, обученным с нуля ▪Github: https://github.com/ByteDance-Seed/SeedVR x ▪ Веса: https://huggingface.co/ByteDance-Seed/SeedVR-Models @ai_machinelearning_big_data #news #ai #ml #ByteDance #video

296 503

✔️ OpenAI переходит к Google Cloud для расширения вычислительных мощностей. OpenAI договорилась с Google Cloud о поставках вычислительных ресурсов для тренировки и запуска своих моделей - неожиданный шаг для конкурентов в сфере ИИ. Ранее OpenAI зависела от Microsoft Azure, но теперь диверсифицирует поставщиков, заключив сделки с Oracle и SoftBank на $500 млрд для проекта Stargate. Google предоставит доступ к собственным чипам TPU, которые ранее использовались только внутри компании. Это усиливает позиции Google Cloud, конкурирующего с Amazon и Microsoft за клиентов среди ИИ-стартапов. Внутренние проблемы с мощностями у Google и одновременная конкуренция через DeepMind создают сложные задачи для управления ресурсами в новом партнерстве. reuters.com ✔️ IBM планирует создать первый в мире устойчивый к ошибкам квантовый компьютер к 2029 году. IBM заявила о планах построить первый в истории крупномасштабный квантовый компьютер Quantum Starling до конца десятилетия. Он будет в 20 тысяч раз мощнее современных квантовых систем, используя новые методы исправления ошибок — коды qLDPC и реальное время коррекции с помощью классических вычислений. Аналитики осторожны: коммерческая выгода пока неочевидна, а детали запуска систем туманны. Тем не менее, IBM подчеркивает, что ее дорожная карта самая прозрачная в индустрии, призывая разработчиков готовить алгоритмы для будущих машин. wsj.com ✔️ Компания Марка Цукерберга создает лабораторию для разработки суперинтеллекта. Компания-создатель WhatsApp анонсировала создание новой лаборатории по исследованию «суперинтеллекта» — гипотетической ИИ-системы, превосходящей возможности человеческого мозга. В рамках проекта, она договорилась о сотрудничестве с Алексом Ваном, основателем Scale AI, и планирует инвестировать в его компанию, одновременно переманивая ключевых специалистов. Источники сообщают, что компания Марка Цукерберга предлагает исследователям из OpenAI, Google и других крупных компаний зарплаты от сотен тысяч до миллионов долларов. Это часть масштабной перестройки ИИ-направления, которое столкнулось с внутренними конфликтами, текучкой кадров и неудачными запусками продуктов. nytimes.com ✔️ Qualcomm представила чип для AR-очков с локальной обработкой ИИ. Qualcomm анонсировала процессор Snapdragon AR1+ Gen 1 для умных очков, способный запускать ИИ без подключения к облаку или смартфону. Это позволяет пользователям использовать функции голосового ассистента или отображения текста прямо на стеклах без дополнительных устройств. Чип на 28% компактнее предыдущей версии, что позволяет уменьшить размеры оправы на 20%. Новинка поддерживает бинокулярное изображение, стабилизацию и обработку нескольких кадров одновременно. Главная фишка - NPU третьего поколения, способный запускать небольшие модели локально. engadget.com ✔️ Исследование: токсичные данные из 4chan помогают тренировать «устойчивые» ИИ. Традиционный подход к очистке данных перед обучением LLM оказался не самым эффективным. Ученые выяснили, что добавление небольшого количества провокационного контента из 4chan (до 10%) улучшает «детоксикацию» моделей на поздних этапах. Модель Olmo-1B, обученная на смеси токсичных постов и чистого датасета C4, показала, что ядовитые идеи в модели становятся четче, а значит — их проще подавлять. Методы вроде коррекции при генерации текста работают точнее, если модель «видела» токсичность заранее. Однако переизбыток 4chan-данных сводит эффект к нулю: модель становится агрессивной и сложной для контроля. Исследователи предполагают, что аналогичный подход применим к другим «чувствительным» темам — от стереотипов до политики. arxiv.org @ai_machinelearning_big_data #news #ai #ml