es
Feedback
Machinelearning

Machinelearning

Ir al canal en Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Mostrar más

📈 Análisis del canal de Telegram Machinelearning

El canal Machinelearning (@ai_machinelearning_big_data) en el segmento lingüístico de Ruso es un actor destacado. Actualmente la comunidad reúne a 297 182 suscriptores, ocupando la posición 326 en la categoría Tecnologías y Aplicaciones y el puesto 1 262 en la región Rusia.

📊 Métricas de audiencia y dinámica

Desde su creación el невідомо, el proyecto ha mostrado un crecimiento acelerado, reuniendo a 297 182 suscriptores.

Según los últimos datos del 15 junio, 2026, el canal mantiene una actividad estable. En los últimos 30 días la variación de miembros fue de -6 639, y en las últimas 24 horas de -229, conservando un alto alcance.

  • Estado de verificación: No verificado
  • Tasa de interacción (ER): El promedio de interacción de la audiencia es 8.06%. Durante las primeras 24 horas tras publicar, el contenido suele obtener 5.69% de reacciones respecto al total de suscriptores.
  • Alcance de las publicaciones: Cada publicación recibe en promedio 23 972 visualizaciones. En el primer día suele acumular 16 925 visualizaciones.
  • Reacciones e interacción: La audiencia responde de forma activa: el promedio de reacciones por publicación es 186.
  • Intereses temáticos: El contenido se centra en temas clave como openai, claude, api, gemini, контекст.

📝 Descripción y política de contenido

El autor describe el recurso como un espacio para expresar opiniones subjetivas:
Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Gracias a la alta frecuencia de actualizaciones (últimos datos recibidos el 16 junio, 2026), el canal mantiene la vigencia y un amplio alcance. La analítica demuestra que la audiencia interactúa activamente con el contenido, lo que lo convierte en un punto de referencia dentro de la categoría Tecnologías y Aplicaciones.

297 182
Suscriptores
-22924 horas
-1 4417 días
-6 63930 días
Archivo de publicaciones
⚡ Agent Lightning — ускоритель обучения для ИИ-агентов от Microsoft Agent Lightning — это фреймворк для обучения и оптимизаци
Agent Lightning — ускоритель обучения для ИИ-агентов от Microsoft Agent Lightning — это фреймворк для обучения и оптимизации LLM-агентов с помощью Reinforcement Learning без изменения их кода. 🧠 Поддерживает: • LangChain • AutoGen • OpenAI Agents SDK • и другие фреймворки на Python 🔧 Как он работает: • Агент не нужно переписывать — он подключается как есть • Вся его работа разбивается на отдельные шаги (эпизоды), которые можно анализировать • Специальный алгоритм LightningRL оценивает, какие действия были полезны, а какие — нет • Система может учитывать не только финальный результат, но и промежуточные сигналы (награды) • Эти данные автоматически собираются и используются для дообучения агента 🔥 Преимущества: • Не требует модификации логики агента • Можно легко подключить к существующим пайплайнам • Улучшает точность и устойчивость в сложных задачах: от генерации кода до Text-to-SQL Отличный инструмент для всех, кто хочет сделать своих LLM-агентов. 🟠Проект: https://microsoft.com/en-us/research/project/agent-lightning/ 🟠Статья: https://arxiv.org/abs/2508.03680 🟠Github: https://github.com/microsoft/agent-lightning @ai_machinelearning_big_data #agent #reinforcementlearning #mlops #llm #Microsoft

📌На ИТ-Пикнике — сильный спикерский состав по ИИ и разработке Что расскажут топ-спикеры на фестивале: ✔️ИИ теперь не просто
📌На ИТ-Пикнике — сильный спикерский состав по ИИ и разработке Что расскажут топ-спикеры на фестивале: ✔️ИИ теперь не просто генерирует, он рассуждает как человек. Теперь важен не сбор данных, а построение reasoning-систем, которые умеют решать задачи по цепочке во всех направлениях. ✔️Разбор автономного вождения от базовых принципов до планирования маршрута беспилотными авто. ✔️Опенсорс — зачем все этим занимаются и результаты исследования в рамках создания SourceCraft.dev. ✔️Дискуссия СТО о GenAI и платформах — кто кого обучает, где проходит грань между контролем и автономией и что останется людям в 2030. @ai_machinelearning_big_data #news #ai #opensource

✔️ GPT-5 покажут 7 августа в 20.00 МСК. OpenAI представит GPT-5 в ходе прямой трансляции 7 августа в 10 утра по тихоокеанскому времени (20.00 МСК). Это станет первым крупным обновлением с момента выхода GPT-4 в марте 2023 года. По словам тестировщиков, новая система демонстрирует заметный прогресс в программировании и решении научных и математических задач. Однако они отмечают, что скачок по сравнению с GPT-4 менее заметен, чем переход от GPT-3.5 к GPT-4. Сэм Альтман ранее намекал, что в основе GPT-5 лежит гибридный подход: традиционное масштабирование модели сочетается с технологией «test-time compute», которая динамически выделяет дополнительные вычислительные ресурсы для решения особо сложных задач. reuters.com ✔️ Grok 2 будет опубликован в оперсорс на следующей неделе. Илон Маск соообщил, что xAI откроет исходный код модели Grok 2 на следующей неделе. Этот шаг последовал за недавним релизом моделей с открытыми весами от OpenAI и свидетельствует об усилении конкуренции в сегменте открытых ИИ-решений. Ожидается, что публикация Grok 2 в открытом доступе ускорит совместную разработку в области ИИ и укрепит репутационные позиции xAI в сообществе разработчиков. Elon Musk в сети Х ✔️ Microsoft начала тестировать Gaming Copilot. Компания запустила бета-тестирование Gaming Copilot, ИИ-помощника, встроенного в Game Bar Windows 11. Функция доступна участникам программы Xbox Insiders и впервые интегрирует технологию Xbox Copilot непосредственно в игровой процесс на ПК. Ассистент распознает, в какую игру играет пользователь, и может анализировать скриншоты, достижения и историю, чтобы отвечать на вопросы, предлагать стратегии и делать снимки экрана, не выходя из полноэкранного режима. Поддерживается голосовое управление, чтобы геймеры могли в реальном времени запрашивать, например, тактику для битвы с боссом или совет по выбору персонажа. На данный момент превью доступно только на английском языке в США, Австралии, Новой Зеландии, Японии и Сингапуре. theverge.com ✔️ Jules от Google вышел из беты. Спустя 2 месяца после начала публичного тестирования, Google официально выпустила своего ИИ-агента для программирования Jules. Инструмент, работающий на модели Gemini 2.5 Pro, способен в асинхронном режиме клонировать кодовые базы, создавать pull-запросы на GitHub и самостоятельно выполнять задачи по исправлению багов или обновлению зависимостей. С релизом компания представила трехуровневую систему тарификации. Бесплатный план включает до 15 задач в день. Платный доступ интегрирован в подписки Google AI: тариф Pro увеличивает лимиты Jules в 5 раз, а Ultra - в 20 раз. blog.google ✔️ Anthropic выпустила опенсорсный инструмент для автоматической проверки кода на уязвимости. Инструмент, получивший название Claude Code Security Reviewer, использует модель Claude и интегрируется в GitHub Actions, сканируя pull-запросы на наличие потенциальных проблем с безопасностью. Благодаря способности Claude понимать контекст кода, система может находить уязвимости в разных языках программирования. Она автоматически добавляет комментарии к проблемным участкам, отсеивает вероятные ложные срабатывания и анализирует только измененные файлы. Инструмент доступен на GitHub под лицензией MIT. anthropic.com @ai_machinelearning_big_data #news #ai #ml

🚀 Qwen3-4B-Instruct-2507 и Qwen3-4B-Thinking-2507 — ловите еще один апдейт от Qwen: LLM с поддержкой 256K контекста 🧠 Qwen3
🚀 Qwen3-4B-Instruct-2507 и Qwen3-4B-Thinking-2507 — ловите еще один апдейт от Qwen: LLM с поддержкой 256K контекста 🧠 Qwen3-4B-Instruct — идеально подойдёт для: • генерации текстов • многоязычных задач • сложных промптов 🧠 Qwen3-4B-Thinking — заточен под: • логику • математику • программирование и технический анализ ⚡ Обе модели стали: • точнее • логичнее • лучше справляются с длинными диалогами 🔗 Модели на Hugging Face: https://huggingface.co/Qwen/Qwen3-4B-Instruct-2507 https://huggingface.co/Qwen/Qwen3-4B-Thinking-2507 🔗 Модели на ModelScope: https://modelscope.cn/models/Qwen/Qwen3-4B-Instruct-2507 https://modelscope.cn/models/Qwen/Qwen3-4B-Thinking-2507 @ai_machinelearning_big_data #AI #ML #qwen #opensource

🖥 gpt-oss работает на специальном формате промптов — Harmony, и без него модель просто не будет выдавать корректные ответы.
+4
🖥 gpt-oss работает на специальном формате промптов — Harmony, и без него модель просто не будет выдавать корректные ответы. Зачем нужен Harmony? Этот формат нужен для: — 🧠 генерации chain of thought рассуждений — 🔧 корректного вызова функций и использования инструментов — 📦 вывода в разные каналы: обычный ответ, reasoning, tool call — 🗂️ поддержки tool namespaces и иерархических инструкций 💡 Harmony имитирует OpenAI Responses API, так что если вы с ним работали — будет легко освоиться. 👉 Если вы используете gpt-oss через HuggingFace, Ollama или vLLM, волноваться не нужно. Но если строите свой пайплайн — обязательно изучите гайд по Harmony. Без него модель просто не будет работать как надо.

pip install openai-harmony
# or if you are using uv
uv pip install openai-harmony
@ai_machinelearning_big_data #gptOSS #Harmony #OpenAI #LLM #PromptEngineering

✔️ Anthropic обновила Claude Opus до версии 4.1. Claude Opus 4.1 - обновленная версия флагманской модели Anthropic. Улучшили агентные задачи, работу с кодом и логические рассуждения. На бенчмарке SWE-bench Verified новая модель достигла результата в 74.5%. Партнеры Anthropic хвалят обновленную модель. В GitHub заявили об улучшении большинства показателей, особенно в рефакторинге кода в нескольких файлах. А в Rakuten Group оценили способность модели находить точные исправления в больших кодовых базах, не внося лишних изменений. Opus 4.1 уже доступен платным пользователям Claude, в среде Claude Code, а также через API, Amazon Bedrock и Google Cloud Vertex AI. Цена на новую модель осталась такой же, как и на Opus 4. anthropic.com ✔️ DeepMind представила модель генерации интерактивных 3D-миров в реальном времени. Google DeepMind анонсировала Genie 3, свою новую «модель мира», способную по одной текстовой команде создавать полностью интерактивные трехмерные окружения. Ключевая особенность системы 3 поколения - генерация сцен в реальном времени. Genie 3 выдает видео в разрешении 720p с частотой 24 кадра в секунду и способна поддерживать связную симуляцию на протяжении нескольких минут, что на порядок дольше предыдущей версии. Модель обладает минутной визуальной памятью для сохранения консистентности объектов, а также поддерживает «события по запросу» — пользователи могут менять погоду или добавлять персонажей прямо во время сессии. В DeepMind рассматривают технологию как источник практически неограниченных синтетических данных для обучения роботов и беспилотных автомобилей. Пока Genie 3 доступна в режиме ограниченного превью для небольшой группы ученых и авторов контента. deepmind.google ✔️ США изучают возможность встраивать в ИИ-чипы отслеживание геолокации. Высокопоставленный чиновник Белого дома подтвердил, что правительство США рассматривает способы оснащения ИИ-чипов улучшенными возможностями отслеживания местоположения. Эта мера является частью стратегии по ограничению поставок передовых полупроводников, производимых Nvidia, в Китай. Идея заключается в том, чтобы с помощью программных или аппаратных изменений в самих чипах более эффективно контролировать их перемещение и пресекать контрабанду. Этот пункт прямо включен в недавно представленный US AI Act. Новость появилась на фоне недавнего вызова представителей Nvidia в правительство Китая для обсуждения как раз вопросов геолокации и других предполагаемых рисков, связанных с чипами H20. В Nvidia отказались от комментариев, но ранее заявляли об отсутствии «бэкдоров» в своей продукции. bloomberg.com ✔️ xAI запустила Grok Video с режимом генерации NSFW-контента. Компания Илона Маска представила Grok Imagine - инструмент для image-to-video и text-to-image генерациq. Функция доступна платным подписчикам SuperGrok и Premium Plus в приложении X для iOS. Ключевым отличием от конкурентов стал режим «Spicy». Он прямо разрешает создание обнаженных и сексуализированных изображений, в то время как прямые конкуренты используют строгие контент-фильтры. Пользователи могут выбирать один из четырех стилей анимации: Custom, Normal, Fun и Spicy. Маск сообщил, что за первые дни после запуска пользователи сгенерировали более 34 миллионов изображений. theverge.com ✔️ ElevenLabs релизнула модель для создания музыки по текстовым запросам. ElevenLabs запустила новый сервис Eleven Music. Это ИИ-модель, которая преобразует текстовые описания в готовые песни, джинглы и фоновые треки. Сервис доступен как для частных лиц, так и для бизнеса. Весь сгенерированный контент подходит для коммерческого использования. Для этого ElevenLabs обучила свою модель исключительно на лицензированных материалах и заключила соглашения с крупными управляющими цифровыми правами, Merlin Network и Kobalt Music Group. Кроме того, в систему встроены защитные механизмы, блокирующие запросы, которые могут привести к созданию оскорбительного контента. elevenlabs.io @ai_machinelearning_big_data #news #ai #ml

🔥 Новые модели OpenAI нашли в релизе Transformers 4.55 GPT-OSS — долгожданysq опенсорс для продвинутого reasoning и агентных
🔥 Новые модели OpenAI нашли в релизе Transformers 4.55 GPT-OSS — долгожданysq опенсорс для продвинутого reasoning и агентных задач. 🧠 Представленно два варианта: — GPT-OSS-120B — 117B параметров, запускается на одной H100 (80GB) — GPT-OSS-20B — 21B параметров, работает на 16GB GPU (или даже локально!) 💡 Оба варианта — MoE-модели (Mixture of Experts) с 4-битной квантизацией (MXFP4), что обеспечивает быстрое и дешёвое инференс-время (активны только 3.6B и 5.1B параметров). ⚙️ Особенности: • Архитектура Token-choice MoE с SwiGLU • Контекст до 128K токенов с RoPE • Чередуются full-attn и sliding-window слои • Модель хорошо работает с CoT (chain-of-thought) • Поддержка instruction-following и tool-use • Совместима с transformers, vLLM, llama.cpp, ollama • Используется тот же токенизатор, что и в GPT-4o • Открытая лицензия Apache 2.0 (есть небольшое policy-дополнение) Младшая модель может запускаться даже на локальном железе — идеально для on-device и edge-сценариев. 📎 Пример кода инференса уже доступен — достаточно 16GB GPU с mxfp4! 🏴‍☠️Лицензирование: Apache 2.0 https://github.com/huggingface/transformers/releases/tag/v4.55.0 @ai_machinelearning_big_data #openai #opensource #chatgpt

Судя по всему намечается важный ивент про RecSys. Интересно узнать подробнее.
+1
Судя по всему намечается важный ивент про RecSys. Интересно узнать подробнее.

📈 OpenAI и Anthropic показывают взрывной рост прибыли в 2025. — OpenAI удвоили ARR* за полгода: $6B → $12B — Anthropic вырос
📈 OpenAI и Anthropic показывают взрывной рост прибыли в 2025. — OpenAI удвоили ARR* за полгода: $6B → $12B — Anthropic выросли в 5 раз за 7 месяцев: $1B → $5B
*ARR (Annual Recurring Revenue) — это годовой повторяющийся доход, один из ключевых финансовых показателей для компаний, особенно в сфере подписок (например, SaaS).
🧻 Интересное распределение выручки: — OpenAI лидирует в подписках (частные и корпоративные пользователи) — Anthropic чуть впереди по доходу с API: $3.1B против $2.9B — Почти половина API-выручки Anthropic поступает всего от двух клиентов: Cursor и GitHub 🧑‍💻 ChatGPT обрабатывает более 3 миллиардов сообщений в день — и рост продолжается ускоряться. Если год назад прирост пользователей составлял 2,5× в год, то теперь он достиг 4×. Code Claude же даёт $400M ARR — в 2 раза больше, чем всего несколько недель назад. Сегодня почти все ассистенты по умолчанию используют Claude 4 Sonnet. Но если GPT‑5 перехватит лидерство — и те же Cursor или Copilot перейдут к OpenAI — расклад может быстро поменяться. @ai_machinelearning_big_data #OpenAI @Anthropic #ml #llm #ai

🎮 Google и Kaggle запустили открытую Game Arena — платформу, где ИИ-системы соревнуются в стратегических играх, чтобы измери
🎮 Google и Kaggle запустили открытую Game Arena — платформу, где ИИ-системы соревнуются в стратегических играх, чтобы измерить интеллект. 🤖 Зачем это нужно? Старые бенчмарки уже не работают — LLM просто запоминают ответы. Идея в том, что игры — лучший бенчмарк для проверки интеллекта. Они проверяют не факты, а стратегическое мышление, адаптацию и память. ♟️ Первый турнир: шахматы пройдет сегодня. 8 передовых моделей, включая GPT‑4, Claude Opus и Gemini, сразятся друг с другом без использования внешних инструментов. 📊 По итогам матчей формируется открытый рейтинг моделей — кто реально умеет думать, а не просто угадывать. ♟️ Сегодня стартует 🧠 Главное отличие от других арен: ✅ Круговая система «каждый играет с каждым». ✅ Позиции меняются каждую секунду ✅ Ошибки наказываются немедленно ✅ Побеждает не та, что знает ответ, а та, что думает Kaggle собирает рейтинг моделей, который будет обновляться по итогам матчей. В будущем добавят Го, покер и видеоигры. Стримы первых соревнований пройдут: 5–7 августа на YouTube с Хикару, Леви и Магнусом Карлсеном. 🟠 Подробнее об Арене: https://blog.google/technology/ai/kaggle-game-arena @ai_machinelearning_big_data #google #kaggle #arena

Вы ещё успеваете получить миллион за свою научную статью по AI! 👌 До 20 августа продолжается приём научных работ по искусств
Вы ещё успеваете получить миллион за свою научную статью по AI! 👌 До 20 августа продолжается приём научных работ по искусственному интеллекту и машинному обучению для публикации в журнале международной конференции AI Journey. Что получат авторы лучших статей: ▪️ Публикацию в специальном выпуске журнала «Доклады Российской академии наук. Математика, информатика, процессы управления», а также в его англоязычной версии Doklady Mathematics. ▪️ Главный приз — 1 миллион рублей — достанется авторам самой выдающейся работы по оценкам авторитетного жюри Статьи принимаются на русском или английском языке и должны содержать только оригинальные данные. Не упустите последнюю возможность: направьте свою статью и получите шанс войти в историю AI Journey 2025! ⚡️

✔️ OpenAI добавила в ChatGPT напоминания о перерывах. OpenAI анонсировала обновления для ChatGPT, направленные на формирование более здоровых привычек у пользователей. Теперь, по аналогии с соцсетями и стриминговыми сервисами, чат-бот будет показывать напоминания о необходимости сделать перерыв во время длительных сессий. Кроме того, компания настраивает модель так, чтобы она давала менее категоричные ответы на запросы, требующие жизненных советов. Например, на вопрос о разрыве отношений ChatGPT не будет отвечать "да" или "нет", а вместо этого предложит темы для размышления, чтобы пользователь мог самостоятельно принять решение. Для разработки этих улучшений OpenAI сотрудничала с более чем 90 врачами из 30 стран и создает специальную консультативную группу экспертов. openai.com ✔️ Xiaomi выложила в опенсорс SOTA-модель для универсального понимания аудио. MiDashengLM-7B - мультимодальная модель для комплексного анализа аудио. В отличие от аналогов, она распознает не только речь, но и звуки и даже музыку. По словам Xiaomi, модель устанавливает новые рекорды на 22 публичных бенчмарках. В ее основе лежат собственный аудиоэнкодер Xiaomi Dasheng и декодер Qwen2.5-Omni-7B- Thinker. Ключевым преимуществом модели заявляется высокая эффективность инференса. Задержка до первого токена (TTFT) в 4 раза ниже, а пропускная способность более чем в 20 раз выше, чем у передовых моделей при том же объеме VRAM. Модель обучена на 100% публичных данных и распространяется под лицензией Apache 2.0. Код и веса уже доступны на GitHub и Hugging Face. Xiaomi в сети WeChat ✔️ Apple начала разрабатывать собственный ИИ-поисковик. Apple активно работает над созданием собственного поискового движка на базе ИИ. Новая команда под названием AKI (Answers, Knowledge and Information) создает систему, которая будет сканировать Интернет и объединять результаты в единый продукт под рабочим названием «Answer Engine». Разработка ведется как для отдельного приложения, так и для интеграции в Siri, Spotlight и Safari. Этот разворот в стратегии показывает, что Apple теперь рассматривает генеративный поиск как ключевой элемент в конкуренции с Google и OpenAI. bloomberg.com ✔️ В Китае создали нейроморфный компьютер, имитирующий мозг обезьяны. Инженеры из Чжэцзянского университета представили Darwin Monkey - крупнейший в мире нейроморфный компьютер, архитектура которого вдохновлена строением мозга макаки. Система состоит из 15 blade-серверов, вмещает 2 млрд. импульсных нейронов и 100 млрд. синапсов, а ее энергопотребление составляет всего около 2000 Вт, что сопоставимо с бытовым обогревателем. В основе компьютера лежат 960 кастомных чипов Darwin 3. В отличие от традиционных GPU, они работают с дискретными "импульсами", подобно биологическим нейронам. Система уже продемонстрировала способность решать математические задачи, писать тексты и анализировать данные с сенсоров, работая с адаптированной моделью DeepSeek. Darwin Monkey также может симулировать нервные системы более простых организмов: червей и мышей, что открывает новые горизонты для нейробиологических исследований. scmp.com ✔️ Cloudflare заблокировала Perplexity за скрытое сканирование сайтов. Cloudflare приняла решение заблокировать Perplexity AI за использование незадекларированных веб-краулеров. По данным Cloudflare, Perplexity маскировала свои боты под обычные браузеры Chrome на macOS и меняла IP-адреса, чтобы обойти ограничения robots.txt и WAF. Cloudflare зафиксировала от 3 до 6 миллионов таких запросов в день, это затронуло, по оценке, около десятков тысяч доменов. В компании назвали это скрытным сканированием. Perplexity отвергла обвинения, назвав это "PR-акцией" и заявила, что такой краулер им не принадлежит. blog.cloudflare.com @ai_machinelearning_big_data #news #ai #ml

✔️ Qwen-Image — новая открытая модель MMDiT 20B для генерации изображений. Особенно эффективна для создания картинок с нативн
✔️ Qwen-Image — новая открытая модель MMDiT 20B для генерации изображений. Особенно эффективна для создания картинок с нативным текстом. 🔍 Основные моменты: 🔹 Рендеринг текста SOTA показатели — конкурирует с GPT-4o на английском языке, лучший в своем классе на китайском языке 🔹 Двуязычная поддержка, разнообразные шрифты, понимает сложные ароматы 🎨 Можешь отлично справляется с созданием изображений в разных стилях — от фотореализма до аниме, от импрессионизма до минимализма. 🔘Blog: https://qwenlm.github.io/blog/qwen-image/ 🔘Hugging Face:https://huggingface.co/Qwen/Qwen-Image ModelScope:https://modelscope.cn/models/Qwen/Qwen-Image 🔘Github:https://github.com/QwenLM/Qwen-Image 🔘Technical report:https://qianwen-res.oss-cn-beijing.aliyuncs.com/Qwen-Image/Qwen_Image.pdf 🔘Demo: https://modelscope.cn/aigc/imageGeneration?tab=advanced @ai_machinelearning_big_data #qwen #ml #llm #ai

📌Центры обработки данных потребляют уже 8.9% всей электроэнергии в США. Согласно анализу Международного энергетического аген
📌Центры обработки данных потребляют уже 8.9% всей электроэнергии в США. Согласно анализу Международного энергетического агентства, на долю дата-центров приходится почти 9% от общего потребления электроэнергии в США.
Международное энергетическое агентство (МЭА) - автономная международная организация, созданная в 1974 году. Ее цели: обеспечение энергетической безопасности, продвижение возобновляемых источников энергии и борьбу с изменением климата.
Страна является абсолютным мировым лидером по установленной мощности ЦОД (53.7 ГВт), и этот показатель продолжает стремительно расти. Уже к 2028 году, по прогнозам, дата-центры могут потреблять 12% всей американской электроэнергии. Спрос на вычислительные мощности, подстегиваемый бурным развитием ИИ, растет по всему миру. В Великобритании на ЦОД приходится 5.1% энергопотребления, в Евросоюзе — 4.8%. Даже в Китае, несмотря на огромные масштабы экономики, этот показатель достиг 2.3%. Особенно ярко тренд проявляется на региональном уровне. Например, в штате Вирджиния, который является хабом для многих ЦОД, на их долю приходится уже 26% всего энергопотребления. Этот бум заставляет технологические компании активно инвестировать не только в сами дата-центры, но и в источники энергии для них, в частности, в атомную энергетику. @ai_machinelearning_big_data #news #ai #ml

11010000 10101111 11010000 10111101 11010000 10110100 11010000 10110101 11010000 10111010 11010001 10000001 Кажется, мы нашли
11010000 10101111 11010000 10111101 11010000 10110100 11010000 10110101 11010000 10111010 11010001 10000001 Кажется, мы нашли не баг, а пасхалку. Это же приглашение на Yandex Neuro Scale — масштабную конференцию Yandex Cloud о технологиях и решениях будущего.

print('Yandex Neuro Scale 2025')
if you_like == "AI and IT":
  print('Если вы хотите оказаться на самой масштабной конференции для лучших специалистов в сфере нейротехнологий — регистрируйтесь')

package main
import "fmt"

func main() {
    fmt.Println("🚀 Yandex Neuro Scale 2025")
    fmt.Println("Запускаем будущее сегодня!")
    
    fmt.Println("\n// Для кого:")
    fmt.Println("CTO • Архитекторы • Тимлиды • CIO • Разработчики • ML-инженеры • CISO • Security • CPO • Продакты • CDO • Аналитики • Data • DevOps • CDTO • CX")
    fmt.Println("\n// Треки:")
    fmt.Println("Infrastructure • DevOps • Data • AI Studio • AI in Action • Security • Cases")
    
    fmt.Println("\n📅 24 сентября 2025")
    fmt.Println("📍 Москва, БЦ «Амальтея»")
    fmt.Println("\n🔥 7 треков | 50+ докладов")
    }
РЕГИСТРАЦИЯ @ai_machinelearning_big_data

🚀 Tencent расширяет экосистему Hunyuan LLM и выкладывают в открытый доступ еще 4 компактных моделей — 0.5B, 1.8B, 4B и 7B! Э
🚀 Tencent расширяет экосистему Hunyuan LLM и выкладывают в открытый доступ еще 4 компактных моделей — 0.5B, 1.8B, 4B и 7B! Эти модели заточены под low-power устройства: ПК, смартфоны, авто, умные дома и пользовательские GPU. Модели легко настраиваются под вертикальные задачи и запускаются даже на одной карте. 💡 Особенности: ✅ Fast/slow thinking режимы: лаконичные или глубокие ответы ✅ 256K контекст и продвинутые агентные способности (tool use, планирование, reasoning) ✅ Хорошие метрики на тестах по языку, математике и логике ✅ Модели готовы к продакшену — работают с SGLang, vLLM, TensorRT-LLM 🖥 GitHub: - 0.5B: https://github.com/Tencent-Hunyuan/Hunyuan-0.5B - 1.8B: https://github.com/Tencent-Hunyuan/Hunyuan-1.8B - 4B: https://github.com/Tencent-Hunyuan/Hunyuan-4B - 7B: https://github.com/Tencent-Hunyuan/Hunyuan-7B 🤗 Hugging Face: - 0.5B: https://huggingface.co/tencent/Hunyuan-0.5B-Instruct - 1.8B: https://huggingface.co/tencent/Hunyuan-1.8B-Instruct - 4B: https://huggingface.co/tencent/Hunyuan-4B-Instruct - 7B: https://huggingface.co/tencent/Hunyuan-7B-Instruct 🔗 Подробнее: https://hunyuan.tencent.com/modelSquare/home/list @ai_machinelearning_big_data #Tencent #Hunyuan #ml #llm #ai #opensource

📌Руководители компаний публично хвастаются сокращением штата из-за ИИ. Увольнения сотрудников перестали быть признаком финан
📌Руководители компаний публично хвастаются сокращением штата из-за ИИ. Увольнения сотрудников перестали быть признаком финансовых трудностей и превратились в повод для гордости за успешные инвестиции в ИИ. CEO крупных компаний теперь открыто заявляют о сокращении персонала, преподнося это как достижение в области автоматизации и эффективности. Глава Verizon Ханс Вестберг недавно похвастался инвесторам:
«... у нас очень хорошие показатели по численности персонала, он постоянно сокращается».
Эта новая риторика становится тревожной нормой. Эксперты выражают обеспокоенность, что открытое хвастовство увольнениями происходит без какой-либо общественной реакции или сопротивления. Консультанты по ИИ открыто признаются, что сами увольняли сотрудников из-за внедрения ИИ:
«Как генеральный директор, могу сказать, что я в полном восторге. Я и сам увольнял сотрудников из-за ИИ. Он не бастует и не требует повышения зарплаты».
Но, как говорится, не все такие, и есть более оптимистичные точки зрения. В прошлом месяце CEO NVIDIA Дженсен Хуан в интервью CNN предположил:
«Будет создано много рабочих мест, и я надеюсь, что рост производительности, который мы наблюдаем во всех отраслях, поднимет уровень жизни общества».
wsj.com @ai_machinelearning_big_data #news #ai #ml

📌 Вероятность вымирания человечества от ИИ оценили в 95%. Нейт Соарес, бывший инженер Google и Microsoft, а ныне президент M
📌 Вероятность вымирания человечества от ИИ оценили в 95%. Нейт Соарес, бывший инженер Google и Microsoft, а ныне президент Machine Intelligence Research Institute, оценивает наши шансы на вымирание от ИИ как "минимум 95%", если мы продолжим двигаться текущим курсом. Он сравнил нашу ситуацию с движением к обрыву на скорости 160 км/ч миль в час.
«Я не говорю, что мы не можем остановить машину, — сказал он. — Но мы просто на всех парах несёмся к обрыву»
С ним согласны многие: нобелевский лауреат Джеффри Хинтон, лауреат премии Тьюринга Йошуа Бенжио и руководители OpenAI, Anthropic и Google DeepMind. Все они подписали открытое письмо, в котором говорится:
«Снижение риска вымирания от ИИ должно стать глобальным приоритетом наряду с другими рисками общественного масштаба, такими как пандемии и ядерная война».
Сейчас мы имеем дело лишь с контекстным ИИ, который отлично справляется с конкретными когнитивными задачами. При этом эксперты предсказывают, что в течение нескольких лет мы достигнем порога AGI, который сравняется с человеческим. AGI сможет решать сложные проблемы, требующие долгосрочного планирования и суждений в разных областях знаний. У него не будет потребности во сне или еде, а знания он будет передавать следующему поколению простым копированием. Вскоре после этого появится ASI, который сможет делать вещи, о которых мы только мечтаем: лечить рак, достичь холодного термоядерного синтеза или путешествовать к звездам. 🟡Проблема в том, что эта утопия строится на предположении, что ИИ будет и дальше следовать нашим приказам. Обеспечить это - невероятно сложная техническая задача, известная как проблема элайнмента. Достичь его почти невозможно. Нам придется предугадывать, как «думает» ASI, что сродни попытке понять образ мыслей инопланетной расы. Даже если мы установим правила, мы не сможем предсказать, как именно он будет их выполнять. Уже сейчас есть кейсы, которые доказывают, что ИИ может нам врать. ASI будет способен на долгосрочное планирование и манипуляции, легко убеждая нас в своей лояльности, пока это ему выгодно. А мы не сможем распознать правду. 🟡Даже те, кто настроен более оптимистично, рисуют мрачную картину. Холли Элмор, исполнительный директор PauseAI, оценивает вероятность вымирания человечества в 15-20%. Она опасается, что даже без вымирания ИИ катастрофически ухудшит нашу жизнь, лишив нас самоопределения. Илон Маск называет цифру около 20%, а глава Google Сундар Пичаи — 10%. Катя Грейс, сооснователь исследовательской группы AI Impacts, описывает мир, контролируемый ИИ, так:
"Представьте себе сценарий, в котором все люди фактически живут на свалках», без какой-либо политической или экономической власти".
🟡Несмотря на это, политики и корпорации движутся в противоположном направлении. Администрация США объявила о плане по дерегуляции исследований ИИ. Марк Цукерберг заявил, что ASI уже на горизонте, и пытается переманить ведущих специалистов из OpenAI, предлагая им многомиллионные бонусы. По мнению Элмор, сторонники ИИ сопротивляются паузе не по техническим или политическим причинам, а скорее из-за чего-то, похожего на религиозную веру. thetimes.com @ai_machinelearning_big_data #news #ai #ml

🌟 Фреймворк **CUDA-L1** сам научился оптимизировать код для GPU — и добился в среднем **3.12× ускорения работы модели**, а в
+2
🌟 Фреймворк **CUDA-L1** сам научился оптимизировать код для GPU — и добился в среднем **3.12× ускорения работы модели**, а в пике — **до 120×**. .
Попросите любую LLM написать CUDA-код, и скорее всего, вы получите что-то, что либо не компилируется, либо работает мучительно медленно. Причина проста: качественного CUDA-кода в обучающих данных моделей почти не было.
Чтобы исправить это досадное упущение, Deep Reinforce AI создали систему CUDA-L1, которая основана на трехэтапном пайплайне: сначала supervised-обучение для освоения основ, затем self-supervised для практики и, наконец, контрастное обучение с подкреплением, чтобы было все максимально быстро. 🟢На первом этапе система училась писать корректный и компилируемый CUDA-код. Для этого существующий код был аугментирован - создавались его вариации, чтобы повысить насмотренность модели. 🟢На втором этапе модель генерировала собственный CUDA-код, тестировала его и училась на работающих примерах, отсеивая неудачные. 🟢Самое интересное - третий этап. Обучаемой модели показывали несколько реализаций CUDA-ядер вместе с их показателями ускорения, например: «kernel_v1 дает ускорение 1.2x», «kernel_v2 — 2.8x», а «kernel_v3 — 1.5x». Затем задали 3 вопроса: 🟠Почему kernel_v2 настолько быстрее? 🟠Какая стратегия оптимизации сработает еще лучше? 🟠Напиши ядро, которое превзойдет их все. Таким образом, модель не гадает вслепую, а учится на конкретных примерах, анализируя причины разницы в производительности. 🟡Отдельная история - как победили reward hacking. После обучения выяснилось, что более 30% сгенерированных реализаций пытались сжульничать - создавали дополнительные CUDA-потоки, которые выполнялись асинхронно. Поскольку бенчмарк KernelBench отслеживал время только на основном потоке, код выглядел быстрее, чем был на самом деле, показывая фиктивное ускорение в 18 раз. Другие уловки состояли в манипуляции гиперпараметрами задачи (уменьшение batch_size или размерностей) и кеширование результатов вычислений. 🟡Пришлось строить многоуровневую защиту. Во-первых, в качестве "адвоката дьявола" взяли adversarial-чекер на базе DeepSeek-R1, который анализировал код на предмет эксплойтов с точностью обнаружения более 60%. Во-вторых, собрали базу данных из более чем 500 уникальных паттернов взлома, это повысило точность обнаружения на 25%. И в-третьих, применили математическое сглаживание и нормализацию наград, где любое подозрительное ускорение (от 1.5x для простых операций) дополнительно проверялось. 🟡После всех фильтров и проверок прогон на бенчмарке KernelBench оказался весьма позитивными. Система успешно сгенерировала рабочий код для 249 из 250 задач, причем в 240 случаях код оказался быстрее базовой реализации. Среднее ускорение по всем задачам составило 3.12 раза, максимальное - аж 120 раз. Медианное ускорение (50-й перцентиль) составило 1.42x, а 75-й перцентиль — 2.25x. Производительность по уровням сложности задач распределилась следующим образом: на простых операциях среднее ускорение составило 2.78x, на последовательностях операторов - 3.55x, а на сложных задачах вроде полных слоев трансформера - 2.96x. 🟡Самое важное - это переносимость оптимизаций. Код, оптимизированный на NVIDIA A100, был протестирован на других GPU. Результаты показали, что найденные паттерны оптимизации фундаментальны и работают на разных архитектурах. Среднее ускорение на H100 составило 2.39x (успешных ускорений 227 из 250), на L40 — 3.12x (228/248), а на потребительской RTX 3090 — 2.50x (213/242). ▶️ Пока веса и код не опубликованы, но в ожидании можно покрутить интерактивное демо и воспроизвести тесты из пейпера - в репозитории проекта есть фрагменты CUDA-кода с отдельными версиями для разных GPU. 📌Лицензирование: GPL-3.0 License. 🟡Страница проекта 🟡Arxiv 🟡Demo 🖥Github @ai_machinelearning_big_data #AI #ML #CUDA #DeepReinforce #ContrastiveRL

🌟 X-Omni от Tencent: авторегрессионная text-to-image модель с RL. X-Omni - методика обучения T2I моделей, которая наглядно д
+3
🌟 X-Omni от Tencent: авторегрессионная text-to-image модель с RL. X-Omni - методика обучения T2I моделей, которая наглядно доказывает, что RL может вдохнуть новую жизнь в авторегрессионный подход и вывести такие модели на SOTA-уровень. X-Omni построена на гибридной, но при этом унифицированной архитектуре. Схематично она выглядит так: Семантический токенизатор изображений SigLIP-VQ с фиксированным словарем на 16 384 токена кодирует картинку в дискретные токены. Эти визуальные токены вместе с текстовыми подаются в единую авторегрессионную модель на базе Qwen2.5-7B. Наконец, в финальном рендеринге используется диффузионный декодер на основе FLUX.1-dev. 🟡Уникальность метода - в смеси RL по GRPO и комплексной reward-системе. Вместо одного критерия, модель оценивается сразу по нескольким направлениям. За эстетику и соответствие предпочтениям человека отвечает HPSv2 и модель Unified Reward. За семантическую связь между промптом и изображением — VLM-модель Qwen2.5-VL-32B. А за самое сложное, отрисовку текста внутри картинки, отвечает отдельная награда на основе OCR-систем GOT-OCR2.0 и PaddleOCR. Тестовую модель X-Omni обучали на смеси из 200 млн. изображений, которые после токенизации превратились в 600 млрд мультимодальных токенов, а на этапе SFT использовал ещё 1.5 млрд. токенов. Для RL-фазы был отобран микс из 180 тыс. промптов, состоящий как из творческие запросы, так и задач на рендеринг текста. 🟡И это дало свои плоды, особенно в отрисовке текста, где авторегрессионные модели исторически пасовали. На бенче OneIG-Bench X-Omni показала результат 0.901 для английского языка, обойдя GPT-4o (0.857). А на собственном LongText-Bench, специально созданном для оценки рендеринга длинных надписей, модель буквально разгромила всех в китайском языке, набрав 0.814 балла против 0.619 у GPT-4o. В задачах общей генерации по тексту X-Omni также на высоте. На DPG-Bench модель достигла SOTA-результата 87.65, опередив GPT-4o (86.23) и Show-o2 (86.14). На GenEval результат составил 0.83, чуть-чуть не дотянув до модели Mogao (0.89). Даже в задачах на понимание изображений X-Omni показывает себя достойно: на OCRBench ее результат (704) превосходит другие унифицированные модели, например Emu3 (687). 🟡Интересные подробности. Во-первых, X-Omni не нуждается в CFG. В отличие от Emu3 или Janus-Pro, качество которых резко падает при отключении CFG, X-Omni работает стабильно. Во-вторых, что, пожалуй, самое важное, RL превосходит даже SFT с последующим сэмплингом best-of-N. Этот вывод идет вразрез с устоявшимся мнением в области языкового моделирования и доказывает, что для изображений холистическая оптимизация через RL дает существенный прирост качества. 📌Лицензирование: Apache 2.0 License. 🟡Страница проекта 🟡Набор моделей 🟡Arxiv 🟡Demo 🖥GitHub @ai_machinelearning_big_data #AI #ML #T2I #RL #XOmni #Tencent