Машинное обучение RU
Все о машинном обучении админ - @workakkk @data_analysis_ml - анализ даннных @ai_machinelearning_big_data - Machine learning @itchannels_telegram -лучшие ит-каналы @pythonl - Python @pythonlbooks- python 📚 @datascienceiot - 📚 РКН: clck.ru/3FmrUw
Больше📈 Аналитический обзор Telegram-канала Машинное обучение RU
Канал Машинное обучение RU (@machinelearning_ru) языкового сегмента Русский является активным участником. Сейчас сообщество объединяет 18 055 подписчиков, занимая 7 336 место в категории Технологии и приложения и 37 154 место в регионе Россия.
📊 Показатели аудитории и динамика
С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 18 055 подписчиков.
Согласно последним данным от 26 июня, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило -7, а за последние 24 часа — -5, при этом общий охват остаётся высоким.
- Статус верификации: Не верифицирован
- Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 10.46%. В первые 24 часа после публикации контент обычно набирает 4.91% реакций от общего числа подписчиков.
- Охват публикаций: В среднем каждый пост получает 1 889 просмотров. В течение первых суток публикация набирает 887 просмотров.
- Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 9.
- Тематические интересы: Контент сосредоточен на ключевых темах, таких как github, llm, openai, параметр, архитектура.
📝 Описание и контентная политика
Автор описывает ресурс как площадку для выражения субъективного мнения:
“Все о машинном обучении
админ - @workakkk
@data_analysis_ml - анализ даннных
@ai_machinelearning_big_data - Machine learning
@itchannels_telegram -лучшие ит-каналы
@pythonl - Python
@pythonlbooks- python 📚
@datascienceiot - 📚
РКН: clck.ru/...”
Благодаря высокой частоте обновлений (последние данные получены 27 июня, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.
Загрузка данных...
| Дата | Привлечение подписчиков | Упоминания | Каналы | |
| 27 июня | +2 | |||
| 26 июня | +5 | |||
| 25 июня | +3 | |||
| 24 июня | +1 | |||
| 23 июня | +5 | |||
| 22 июня | +2 | |||
| 21 июня | +3 | |||
| 20 июня | +4 | |||
| 19 июня | +5 | |||
| 18 июня | +5 | |||
| 17 июня | +6 | |||
| 16 июня | +10 | |||
| 15 июня | +10 | |||
| 14 июня | +3 | |||
| 13 июня | +3 | |||
| 12 июня | +3 | |||
| 11 июня | +1 | |||
| 10 июня | +3 | |||
| 09 июня | +7 | |||
| 08 июня | +1 | |||
| 07 июня | +1 | |||
| 06 июня | +2 | |||
| 05 июня | +1 | |||
| 04 июня | +1 | |||
| 03 июня | +1 | |||
| 02 июня | 0 | |||
| 01 июня | +2 |
import numpy as np → import cupy as cp
И тот же код может работать до 100 раз быстрее на CUDA.
→ работает с существующим NumPy/SciPy-кодом
→ без переписывания логики
→ без нового синтаксиса
→ также поддерживает AMD ROCm
100% open source.
https://github.com/Hannibal046/Awesome-LLM| 2 | ✔️ На OpenRouter появилась Fugu Ultra
OpenRouter добавил возможность запуска мультиагентной системы Fugu Ultra, которая по словам Sakana Ai обошла Fable 5 в кодинге на бенчмарках.
Это специализированная LLM для маршрутизации и координации задач между GPT-5.5, Gemini 3.1 Pro и Claude Opus 4.8.
Fugu Ultra поддерживает окно контекста в 1 млн токенов, вызов внешних инструментов и мультимодальность. Максимальная длина генерации - 128 тысяч токенов.
Биллинг формируется из базового тарифа маршрутизатора ($5 за 1 млн токенов ввода и $30 за вывод) и суммарной стоимости задействованных моделей.
Для контроля расходов можно самостоятельно ограничивать глубину рассуждений и лимиты токенов через настройки API.
@ai_machinelearning_big_data
#news #ai #ml | 605 |
| 3 | Хочется разобраться в машинном обучении, но страшно сразу покупать большой курс? Это нормально.
У Яндекс Практикума есть бесплатная вводная часть курса «ML-инженер» — можно спокойно познакомиться с профессией, решить первые задачи по ML и понять, насколько вам вообще подходит это направление.
Если решите идти дальше, на основном курсе вас ждёт:
● обучение от основ до внедрения ML-моделей;
● 18+ проектов для портфолио;
● карьерная поддержка при выходе на рынок;
● дополнительный модуль по современным AI-инструментам.
🎁 А если продолжите обучение, для подписчиков канала действует скидка 10% по промокоду до 30 июня [TGPRACTICUM10].
Попробовать бесплатно →
Erid: 2SDnjcVRJFU
Название: ООО "ЯНДЕКС"
ИНН: 7736207543 | 928 |
| 4 | 🗓 13 июля в 18:00 МСК приглашаем вас на открытый урок в преддверии старта курса «Большие языковые модели. Экспертный уровень / LLM».
На занятии разберём: 👇
• как RAG помогает модели работать с фактами и внешними источниками;
• в чём суть LoRA и почему этот метод позволяет эффективно дообучать большие языковые модели;
• отдельно обсудим, когда использовать RAG, когда выбирать LoRA, а когда эти подходы стоит комбинировать.
Урок подойдёт DS-специалистам, ML-инженерам и ИТ-специалистам, которые работают с текстовыми данными и хотят внедрять LLM-решения осознанно.
Зарегистрируйтесь и разберитесь, как выбирать архитектуру LLM-решения под реальные задачи: https://otus.pw/HPgxU/?erid=2W5zFHz7JPb
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963. | 615 |
| 5 | Как запустить своего Джарвиса за 5 минут: локальный AI-ассистент OpenJarvis
Идея простая: вместо очередного облачного чат-бота вы собираете персонального AI-помощника, который работает ближе к вашему устройству, файлам и задачам.
https://github.com/open-jarvis/OpenJarvis
Д | 1 175 |
| 6 | LLM уже находят реальные memory safety баги в Rust-коде.
И, что неожиданно, это работает очень хорошо.
Сергей Давыдов, руководитель Rust Secure Code Working Group, использовал GPT-5.5 и Claude Opus для аудита unsafe-блоков в популярных Rust-крейтах.
В итоге нашлись десятки реальных багов:
• use-after-free
• чтение за пределами буфера
• data races
• неправильные реализации Send / Sync
Все находки проверялись через miri, чтобы убрать ложные срабатывания.
Почему в Rust это работает лучше, чем в C?
• unsafe явно помечен и изолирован, поэтому LLM сразу понимает, где искать
• miri может точно подтвердить, настоящий баг или нет
• не нужно отслеживать data flow по всей кодовой базе, как часто бывает в C
Получается, дизайн Rust случайно сделал его почти идеальным языком для LLM-аудита безопасности.
Стоит прочитать всем, кто думает про AI в security tooling.
https://gist.github.com/Shnatsel/eb0a4be79a0657e4eb67c4f085f991bc
https://shnatsel.medium.com/the-unreasonable-effectiveness-of-llms-for-auditing-rust-code-d4df8bf0afd3
#Rust #RustLang #MemorySafety #Security #LLM | 1 536 |
| 7 | Codex начал отправлять SSD пользователей на пенсию раньше времени 😬
Пользователи заметили баг: агент может записывать до 640 ТБ данных в год на накопитель.
Причина банальная, но болезненная: логгер слишком подробно сохраняет действия агента и постепенно превращает диск в расходник.
Для сравнения: обычный SSD на 1 ТБ часто рассчитан примерно на 600 ТБ записи за весь срок службы.
А один пользователь уже поймал 37 ТБ записи всего за 21 день работы Codex.
Фикса пока нет.
https://www.notebookcheck.net/OpenAI-Codex-has-a-bug-that-could-kill-your-SSD-in-under-a-year.1326191.0.html | 1 749 |
| 8 | NVIDIA выкатили кое-что большое для AI-агентов.
Компания открыла каталог из 110+ проверенных agent skills. Это переносимые наборы инструкций, которые учат AI-агентов правильно использовать библиотеки CUDA-X и платформенные инструменты.
Что внутри:
• cuOpt
• NeMo
• Dynamo
• RAG
• DeepStream
• medical AI
• physical AI
• и другие направления
Каждый skill подписан OMS-подписью. Её можно проверить через trust anchor NVIDIA.
Работает из коробки с Claude Code, Codex, Cursor и Kiro.
Установка одной командой:
npx skills add nvidia/skills
Это уже не просто набор инструментов, а governance возможностей для AI-агентов.
Проверенные, подписанные и аудируемые инструкции, которым агент может доверять.
https://github.com/nvidia/skills | 1 779 |
| 9 | ✔️ DeepSeek раскатал Vision Mode в чат-боте
DeepSeek запустил Vision Mode в веб-версии и мобильном приложении. Режим поддерживает визуальный CoT для сложных задач (геометрические выводы, анализ графиков и прямую конвертацию UI-скринов в HTML).
В основе функции лежит работа Thinking with Visual Primitives, в которой авторы решили проблему восприятия MMLM при точной локализации и пространственных рассуждениях.
Координаты и граничные рамки используются как минимальные единицы мышления и встраиваются непосредственно в визуальную цепочку CoT.
Это дает модели точную пространственную ориентацию в инференсе без опоры на описания естественным языком.
Vision Mode обрабатывает только статические изображения. Поддержки аудио, видео и генерации картинок нет.
@ai_machinelearning_big_data
#news #ai #ml | 724 |
| 10 | ✔️ DeepSeek раскатал Vision Mode в чат-боте
DeepSeek запустил Vision Mode в веб-версии и мобильном приложении. Режим поддерживает визуальный CoT для сложных задач (геометрические выводы, анализ графиков и прямую конвертацию UI-скринов в HTML).
В основе функции лежит работа Thinking with Visual Primitives, в которой авторы решили проблему восприятия MMLM при точной локализации и пространственных рассуждениях.
Координаты и граничные рамки используются как минимальные единицы мышления и встраиваются непосредственно в визуальную цепочку CoT.
Это дает модели точную пространственную ориентацию в инференсе без опоры на описания естественным языком.
Vision Mode обрабатывает только статические изображения. Поддержки аудио, видео и генерации картинок нет.
@ai_machinelearning_big_data
#news #ai #ml | 749 |
| 11 | Займи слот ИТ-Пикником от Т-Банка
8 августа — время отложить ноутбуки и встретиться офлайн на ИТ-Пикнике от Т-Банка в музее-заповеднике «Коломенское». Вот сколько всего запланировано:
— научпоп-лекции;
— мастер-классы;
— дискуссии об ИИ и больших языковых моделях;
— доклады о кибербезопасности;
— примеры, как данные из логов становятся решениями;
— много музыки.
Бери с собой друзей, супругов и детей — каждый найдет себе что-то по душе.
Зарегистрироваться и узнать больше можно здесь | 1 396 |
| 12 | Video Pre-Training (VPT) использует неразмеченные видео геймплея Minecraft, чтобы обучать AI-агентов играть через имитацию человеческих действий.
Что внутри:
* предобученные модели в конфигурациях 1x, 2x и 3x width
* модели behavioral cloning, обученные на видео с демонстрациями игроков
* RL-модели, дообученные на задачу получения алмазной кирки
* отдельные fine-tuned варианты для foundation, постройки дома и early game сценариев
Идея простая: агент сначала смотрит, как играют люди, учится повторять поведение, а потом дообучается под конкретные цели в Minecraft.
https://github.com/openai/Video-Pre-Training | 1 312 |
| 13 | AI VK проведет митап по рекомендательным системам
1 июля в Москве пройдет RecSys Meetup от AI VK - встреча для ML-инженеров, исследователей и специалистов, которые работают с рекомендательными системами.
Команда AI VK расскажет, как развиваются Discovery-технологии в продуктах VK с многомиллионной аудиторией: от трансформерных моделей до LLM-агентов, графового RAG и генеративных рекомендаций.
С докладами выступят Андрей Зимовнов, Александр Дьяконов, Евгений Астафуров и Михаил Трапезников. После основной программы будет возможность пообщаться со спикерами в неформальной обстановке.
Место: ДК «Кристалл», Москва
Дата: 1 июля
Регистрация доступна по ссылке | 1 417 |
| 14 | The Economist: ИИ перевёл интернет-машину контента в новую фазу
Теперь книги, иски, научные статьи, приложения и песни производятся в таких объёмах, на которые старые системы проверки просто не были рассчитаны.
На Amazon число новых e-book релизов выросло примерно со 100 тысяч в месяц до ChatGPT-3.5 до примерно 300 тысяч к концу 2025 года. Инструменты детекции указывают, что значительную часть этого роста дал AI-generated текст.
В США количество гражданских исков, поданных самостоятельно без юристов, удвоилось с 2023 по 2025 год и достигло 41 тысячи. При этом 18% выборки жалоб за 2026 год были помечены как написанные ИИ, но их успешность не снизилась.
Наука испытывает похожее давление. Количество сабмитов на arXiv продолжает расти, доля отклонённых работ с 2023 года выросла более чем вдвое, а одно исследование показало, что 57% статей 2025 года содержали язык, на который повлиял ИИ. В 2023 году таких было 12%.
Кодинг-агенты тоже изменили объёмы производства софта. Новые релизы в iOS App Store теперь превышают 100 тысяч в месяц, хотя ещё в мае прошлого года показатель держался ниже 50 тысяч.
В музыке ситуация такая же: ежедневно появляется около 75 тысяч AI-песен против прежних 10 тысяч. Уже 44% новых загрузок сделаны ИИ, а 97% слушателей в одном опросе не смогли надёжно отличить их от человеческих треков.
economist.com/graphic-detail/2026/06/16/did-ai-write-this-article | 1 |
| 15 | GLM-5.2 теперь можно запускать локально.
2-битная версия сохраняет около 82% точности после сжатия модели с 1,51 ТБ до 238 ГБ, то есть размер уменьшили на 84%.
Запуск возможен на Mac с 256 ГБ памяти или на системах с достаточным объёмом RAM/VRAM.
GLM-5.2 называют самой сильной открытой моделью на данный момент.
Гайд: https://unsloth.ai/docs/models/glm-5.2
GGUF: https://huggingface.co/unsloth/GLM-5.2-GGUF | 1 704 |
| 16 | ⚡️ Ling & Ring 2.6: новый техрепорт и open-weight модели
Ant Ling выпустили технический отчёт по Ling & Ring 2.6 и открыли два base checkpoint.
Главное:
* 7:1 Hybrid Linear Attention: 7 Lightning Attention слоёв + 1 MLA слой, чтобы сделать 256K context практичнее
* KPop RL: адаптивный Binary KL вместо uniform KL, прирост SWE-bench Verified с 70.8% до 76.28%
* ~4× token efficiency: больше “интеллекта” на меньшее число output-токенов
* Ling-2.6-flash: 104B, быстрый inference
* Ling-2.6-1T: trillion-scale flagship
* Ring-2.6-1T: deep reasoning и long-horizon agentic задачи
Суть релиза: команда оптимизирует не только модель, а всю связку architecture + training + agentic capability.
Открыты:
* Ling-2.6-1T-base
* Ling-2.6-flash-base
* код и inference-стек
📑 Full technical report: http://arxiv.org/abs/2606.15079
🧱 Ling-2.6-1T-base:
http://huggingface.co/inclusionAI/Ling-2.6-1T-base
🧱 Ring-2.6-flash-base:
http://huggingface.co/inclusionAI/Ling-2.6-flash-base
💻 Code:
http://github.com/inclusionAI/Ling-V2.5
⚙️ Inference:
http://github.com/inclusionAI/linghe | 1 576 |
| 17 | Если хочется не только предсказывать цены на рынке, но и принимать решения на нём, то:
Команда Reinforce.fi (ex-Overnight.fi) запускает хакатон по ML, Reinforcement Learning и алгоритмической торговле - Market-Action Arena с призовым фондом $5,000
Задача отличается от классического прогнозирования.
Для каждого состояния рынка необходимо выбрать одно из 10 возможных действий (A1–A10), чтобы максимизировать итоговую прибыль стратегии.
Участникам предоставляются:
• реальные рыночные данные с анонимизированными признаками
• последовательности длиной 1000 шагов
• различные рыночные режимы и временные периоды
• train и validation датасеты в формате Parquet
Метрика:
Score = суммарный PnL по всем принятым решениям.
Призовой фонд:
1️⃣ $2,500
2️⃣ $1,500
3️⃣ $1,000
Финал соревнования:
Топ-10 участников лидерборда предоставляют код или ноутбук для проверки на скрытом датасете. Финалисты презентуют свои решения команде Reinforce.fi в онлайн или офлайн формате.
Период проведения:
Старт — конец июня 2026 года.
Продолжительность — около 1,5–2 месяцев.
💬 Telegram-чат участников:
https://t.me/+R6lMJ10VXP5hOTI0
Регистрация и подробные условия | 1 504 |
| 18 | ### NYT показала внутренние сообщения Anthropic, но есть важный нюанс
The New York Times получила и описала внутренние сообщения сотрудников Anthropic на фоне давления со стороны властей США.
Судя по переписке, часть сотрудников считает, что компанию «несправедливо выбрали целью». Один из них прямо написал, что ощущение такое, будто правительство США «не хочет, чтобы Anthropic существовала».
Но в этой истории есть важная деталь, которую легко потерять.
Anthropic сама не раз подчёркивала, что её новые модели могут создавать серьёзные риски в кибербезопасности. В частности, Mythos описывали как модель, настолько сильную в поиске уязвимостей в ПО, что она может спровоцировать настоящий cybersecurity reckoning.
Именно поэтому компания заявляла, что будет ограничивать доступ к модели и выдавать его только избранным организациям.
Получается странная ситуация:
* сотрудники Anthropic видят давление как несправедливую атаку
* власти США смотрят на frontier-модели как на актив национальной безопасности
* сама Anthropic публично признаёт, что такие модели могут быть слишком чувствительными для свободного доступа
Главный конфликт уже не в том, «можно ли давать модель всем».
Главный конфликт в том, кто теперь решает, кому можно иметь доступ к frontier AI: сама лаборатория, рынок или государство. | 1 532 |
| 19 | 📢 Открыта регистрация на RecSys Meetup от AI VK
1 июля в Москве инженеры и исследователи AI VK расскажут о трансформерных моделях и LLM-агентах в рекомендациях, представят исследовательское направление и поделятся опытом внедрения технологий Discovery в продукты VK с многомиллионной аудиторией.
Спикеры:
🟣 Андрей Зимовнов, директор по AI, VK
🟣 Александр Дьяконов, руководитель отдела исследований AI VK Research
🟣 Евгений Астафуров, ведущий разработчик, AI VK
🟣 Михаил Трапезников, руководитель группы рекомендательных технологий, AI VK
В программе:
🟣 Нейропрофиль в Discovery
🟣 Контентные LLM-агенты
🟣 Научные исследования в AI VK
🟣 Cоциальное общение, светомузыка и активности
➡️Регистрация по ссылке
Количество мест ограничено, трансляции не будет.
📍1 июля, ДК «Кристалл», Москва
#aivkhub #recsys | 1 517 |
| 20 | Исследователи из Stanford, University of California и Nanjing University представили SEFD - переработанную версию EDGAR filings для обучения LLM на финансовых документах.
Главная проблема старого подхода в том, что SEC-отчёты часто превращались в плоский текст. Модель видела слова и цифры, но теряла структуру: вложенные таблицы, объединённые заголовки, отступы, знаки, иерархию строк и связь между показателями.
SEFD решает это через layout-faithful MultiMarkdown. Он сохраняет логику документа и финансовых таблиц, но убирает лишний HTML-шум, который раздувает токены и мешает обучению.
Публичный снапшот содержит 152 млрд токенов. Полный архив, по оценке авторов, может дать около 550 млрд токенов длинных финансовых документов. При этом пересечение с Common Crawl-корпусами меньше 0,1%, то есть это почти незаезженный источник данных для финансовых LLM.
Модели получают структуру отчётности. Для финансового анализа это критично, потому что в таких документах значение часто лежит не в отдельной цифре, а в том, где она стоит, к какому заголовку относится и как связана с соседними строками.
arxiv.org/abs/2606.18192v1 | 1 508 |
Уже доступно! Исследование Telegram 2025 — ключевые инсайты года 
