Машинное обучение RU
Все о машинном обучении админ - @workakkk @data_analysis_ml - анализ даннных @ai_machinelearning_big_data - Machine learning @itchannels_telegram -лучшие ит-каналы @pythonl - Python @pythonlbooks- python 📚 @datascienceiot - 📚 РКН: clck.ru/3FmrUw
Mostrar más📈 Análisis del canal de Telegram Машинное обучение RU
El canal Машинное обучение RU (@machinelearning_ru) en el segmento lingüístico de Ruso es un actor destacado. Actualmente la comunidad reúne a 18 057 suscriptores, ocupando la posición 7 351 en la categoría Tecnologías y Aplicaciones y el puesto 37 247 en la región Rusia.
📊 Métricas de audiencia y dinámica
Desde su creación el невідомо, el proyecto ha mostrado un crecimiento acelerado, reuniendo a 18 057 suscriptores.
Según los últimos datos del 25 junio, 2026, el canal mantiene una actividad estable. En los últimos 30 días la variación de miembros fue de -2, y en las últimas 24 horas de 1, conservando un alto alcance.
- Estado de verificación: No verificado
- Tasa de interacción (ER): El promedio de interacción de la audiencia es 10.70%. Durante las primeras 24 horas tras publicar, el contenido suele obtener 4.97% de reacciones respecto al total de suscriptores.
- Alcance de las publicaciones: Cada publicación recibe en promedio 1 932 visualizaciones. En el primer día suele acumular 898 visualizaciones.
- Reacciones e interacción: La audiencia responde de forma activa: el promedio de reacciones por publicación es 9.
- Intereses temáticos: El contenido se centra en temas clave como github, llm, openai, параметр, архитектура.
📝 Descripción y política de contenido
El autor describe el recurso como un espacio para expresar opiniones subjetivas:
“Все о машинном обучении
админ - @workakkk
@data_analysis_ml - анализ даннных
@ai_machinelearning_big_data - Machine learning
@itchannels_telegram -лучшие ит-каналы
@pythonl - Python
@pythonlbooks- python 📚
@datascienceiot - 📚
РКН: clck.ru/...”
Gracias a la alta frecuencia de actualizaciones (últimos datos recibidos el 26 junio, 2026), el canal mantiene la vigencia y un amplio alcance. La analítica demuestra que la audiencia interactúa activamente con el contenido, lo que lo convierte en un punto de referencia dentro de la categoría Tecnologías y Aplicaciones.
Carga de datos en curso...
| Fecha | Crecimiento de Suscriptores | Menciones | Canales | |
| 26 junio | +2 | |||
| 25 junio | +3 | |||
| 24 junio | +1 | |||
| 23 junio | +5 | |||
| 22 junio | +2 | |||
| 21 junio | +3 | |||
| 20 junio | +4 | |||
| 19 junio | +5 | |||
| 18 junio | +5 | |||
| 17 junio | +6 | |||
| 16 junio | +10 | |||
| 15 junio | +10 | |||
| 14 junio | +3 | |||
| 13 junio | +3 | |||
| 12 junio | +3 | |||
| 11 junio | +1 | |||
| 10 junio | +3 | |||
| 09 junio | +7 | |||
| 08 junio | +1 | |||
| 07 junio | +1 | |||
| 06 junio | +2 | |||
| 05 junio | +1 | |||
| 04 junio | +1 | |||
| 03 junio | +1 | |||
| 02 junio | 0 | |||
| 01 junio | +2 |
| 2 | Как запустить своего Джарвиса за 5 минут: локальный AI-ассистент OpenJarvis
Идея простая: вместо очередного облачного чат-бота вы собираете персонального AI-помощника, который работает ближе к вашему устройству, файлам и задачам.
https://github.com/open-jarvis/OpenJarvis
Д | 954 |
| 3 | LLM уже находят реальные memory safety баги в Rust-коде.
И, что неожиданно, это работает очень хорошо.
Сергей Давыдов, руководитель Rust Secure Code Working Group, использовал GPT-5.5 и Claude Opus для аудита unsafe-блоков в популярных Rust-крейтах.
В итоге нашлись десятки реальных багов:
• use-after-free
• чтение за пределами буфера
• data races
• неправильные реализации Send / Sync
Все находки проверялись через miri, чтобы убрать ложные срабатывания.
Почему в Rust это работает лучше, чем в C?
• unsafe явно помечен и изолирован, поэтому LLM сразу понимает, где искать
• miri может точно подтвердить, настоящий баг или нет
• не нужно отслеживать data flow по всей кодовой базе, как часто бывает в C
Получается, дизайн Rust случайно сделал его почти идеальным языком для LLM-аудита безопасности.
Стоит прочитать всем, кто думает про AI в security tooling.
https://gist.github.com/Shnatsel/eb0a4be79a0657e4eb67c4f085f991bc
https://shnatsel.medium.com/the-unreasonable-effectiveness-of-llms-for-auditing-rust-code-d4df8bf0afd3
#Rust #RustLang #MemorySafety #Security #LLM | 1 187 |
| 4 | Codex начал отправлять SSD пользователей на пенсию раньше времени 😬
Пользователи заметили баг: агент может записывать до 640 ТБ данных в год на накопитель.
Причина банальная, но болезненная: логгер слишком подробно сохраняет действия агента и постепенно превращает диск в расходник.
Для сравнения: обычный SSD на 1 ТБ часто рассчитан примерно на 600 ТБ записи за весь срок службы.
А один пользователь уже поймал 37 ТБ записи всего за 21 день работы Codex.
Фикса пока нет.
https://www.notebookcheck.net/OpenAI-Codex-has-a-bug-that-could-kill-your-SSD-in-under-a-year.1326191.0.html | 1 611 |
| 5 | NVIDIA выкатили кое-что большое для AI-агентов.
Компания открыла каталог из 110+ проверенных agent skills. Это переносимые наборы инструкций, которые учат AI-агентов правильно использовать библиотеки CUDA-X и платформенные инструменты.
Что внутри:
• cuOpt
• NeMo
• Dynamo
• RAG
• DeepStream
• medical AI
• physical AI
• и другие направления
Каждый skill подписан OMS-подписью. Её можно проверить через trust anchor NVIDIA.
Работает из коробки с Claude Code, Codex, Cursor и Kiro.
Установка одной командой:
npx skills add nvidia/skills
Это уже не просто набор инструментов, а governance возможностей для AI-агентов.
Проверенные, подписанные и аудируемые инструкции, которым агент может доверять.
https://github.com/nvidia/skills | 1 681 |
| 6 | ✔️ DeepSeek раскатал Vision Mode в чат-боте
DeepSeek запустил Vision Mode в веб-версии и мобильном приложении. Режим поддерживает визуальный CoT для сложных задач (геометрические выводы, анализ графиков и прямую конвертацию UI-скринов в HTML).
В основе функции лежит работа Thinking with Visual Primitives, в которой авторы решили проблему восприятия MMLM при точной локализации и пространственных рассуждениях.
Координаты и граничные рамки используются как минимальные единицы мышления и встраиваются непосредственно в визуальную цепочку CoT.
Это дает модели точную пространственную ориентацию в инференсе без опоры на описания естественным языком.
Vision Mode обрабатывает только статические изображения. Поддержки аудио, видео и генерации картинок нет.
@ai_machinelearning_big_data
#news #ai #ml | 690 |
| 7 | ✔️ DeepSeek раскатал Vision Mode в чат-боте
DeepSeek запустил Vision Mode в веб-версии и мобильном приложении. Режим поддерживает визуальный CoT для сложных задач (геометрические выводы, анализ графиков и прямую конвертацию UI-скринов в HTML).
В основе функции лежит работа Thinking with Visual Primitives, в которой авторы решили проблему восприятия MMLM при точной локализации и пространственных рассуждениях.
Координаты и граничные рамки используются как минимальные единицы мышления и встраиваются непосредственно в визуальную цепочку CoT.
Это дает модели точную пространственную ориентацию в инференсе без опоры на описания естественным языком.
Vision Mode обрабатывает только статические изображения. Поддержки аудио, видео и генерации картинок нет.
@ai_machinelearning_big_data
#news #ai #ml | 697 |
| 8 | Займи слот ИТ-Пикником от Т-Банка
8 августа — время отложить ноутбуки и встретиться офлайн на ИТ-Пикнике от Т-Банка в музее-заповеднике «Коломенское». Вот сколько всего запланировано:
— научпоп-лекции;
— мастер-классы;
— дискуссии об ИИ и больших языковых моделях;
— доклады о кибербезопасности;
— примеры, как данные из логов становятся решениями;
— много музыки.
Бери с собой друзей, супругов и детей — каждый найдет себе что-то по душе.
Зарегистрироваться и узнать больше можно здесь | 1 338 |
| 9 | Video Pre-Training (VPT) использует неразмеченные видео геймплея Minecraft, чтобы обучать AI-агентов играть через имитацию человеческих действий.
Что внутри:
* предобученные модели в конфигурациях 1x, 2x и 3x width
* модели behavioral cloning, обученные на видео с демонстрациями игроков
* RL-модели, дообученные на задачу получения алмазной кирки
* отдельные fine-tuned варианты для foundation, постройки дома и early game сценариев
Идея простая: агент сначала смотрит, как играют люди, учится повторять поведение, а потом дообучается под конкретные цели в Minecraft.
https://github.com/openai/Video-Pre-Training | 1 276 |
| 10 | AI VK проведет митап по рекомендательным системам
1 июля в Москве пройдет RecSys Meetup от AI VK - встреча для ML-инженеров, исследователей и специалистов, которые работают с рекомендательными системами.
Команда AI VK расскажет, как развиваются Discovery-технологии в продуктах VK с многомиллионной аудиторией: от трансформерных моделей до LLM-агентов, графового RAG и генеративных рекомендаций.
С докладами выступят Андрей Зимовнов, Александр Дьяконов, Евгений Астафуров и Михаил Трапезников. После основной программы будет возможность пообщаться со спикерами в неформальной обстановке.
Место: ДК «Кристалл», Москва
Дата: 1 июля
Регистрация доступна по ссылке | 1 390 |
| 11 | The Economist: ИИ перевёл интернет-машину контента в новую фазу
Теперь книги, иски, научные статьи, приложения и песни производятся в таких объёмах, на которые старые системы проверки просто не были рассчитаны.
На Amazon число новых e-book релизов выросло примерно со 100 тысяч в месяц до ChatGPT-3.5 до примерно 300 тысяч к концу 2025 года. Инструменты детекции указывают, что значительную часть этого роста дал AI-generated текст.
В США количество гражданских исков, поданных самостоятельно без юристов, удвоилось с 2023 по 2025 год и достигло 41 тысячи. При этом 18% выборки жалоб за 2026 год были помечены как написанные ИИ, но их успешность не снизилась.
Наука испытывает похожее давление. Количество сабмитов на arXiv продолжает расти, доля отклонённых работ с 2023 года выросла более чем вдвое, а одно исследование показало, что 57% статей 2025 года содержали язык, на который повлиял ИИ. В 2023 году таких было 12%.
Кодинг-агенты тоже изменили объёмы производства софта. Новые релизы в iOS App Store теперь превышают 100 тысяч в месяц, хотя ещё в мае прошлого года показатель держался ниже 50 тысяч.
В музыке ситуация такая же: ежедневно появляется около 75 тысяч AI-песен против прежних 10 тысяч. Уже 44% новых загрузок сделаны ИИ, а 97% слушателей в одном опросе не смогли надёжно отличить их от человеческих треков.
economist.com/graphic-detail/2026/06/16/did-ai-write-this-article | 1 |
| 12 | GLM-5.2 теперь можно запускать локально.
2-битная версия сохраняет около 82% точности после сжатия модели с 1,51 ТБ до 238 ГБ, то есть размер уменьшили на 84%.
Запуск возможен на Mac с 256 ГБ памяти или на системах с достаточным объёмом RAM/VRAM.
GLM-5.2 называют самой сильной открытой моделью на данный момент.
Гайд: https://unsloth.ai/docs/models/glm-5.2
GGUF: https://huggingface.co/unsloth/GLM-5.2-GGUF | 1 676 |
| 13 | ⚡️ Ling & Ring 2.6: новый техрепорт и open-weight модели
Ant Ling выпустили технический отчёт по Ling & Ring 2.6 и открыли два base checkpoint.
Главное:
* 7:1 Hybrid Linear Attention: 7 Lightning Attention слоёв + 1 MLA слой, чтобы сделать 256K context практичнее
* KPop RL: адаптивный Binary KL вместо uniform KL, прирост SWE-bench Verified с 70.8% до 76.28%
* ~4× token efficiency: больше “интеллекта” на меньшее число output-токенов
* Ling-2.6-flash: 104B, быстрый inference
* Ling-2.6-1T: trillion-scale flagship
* Ring-2.6-1T: deep reasoning и long-horizon agentic задачи
Суть релиза: команда оптимизирует не только модель, а всю связку architecture + training + agentic capability.
Открыты:
* Ling-2.6-1T-base
* Ling-2.6-flash-base
* код и inference-стек
📑 Full technical report: http://arxiv.org/abs/2606.15079
🧱 Ling-2.6-1T-base:
http://huggingface.co/inclusionAI/Ling-2.6-1T-base
🧱 Ring-2.6-flash-base:
http://huggingface.co/inclusionAI/Ling-2.6-flash-base
💻 Code:
http://github.com/inclusionAI/Ling-V2.5
⚙️ Inference:
http://github.com/inclusionAI/linghe | 1 487 |
| 14 | Если хочется не только предсказывать цены на рынке, но и принимать решения на нём, то:
Команда Reinforce.fi (ex-Overnight.fi) запускает хакатон по ML, Reinforcement Learning и алгоритмической торговле - Market-Action Arena с призовым фондом $5,000
Задача отличается от классического прогнозирования.
Для каждого состояния рынка необходимо выбрать одно из 10 возможных действий (A1–A10), чтобы максимизировать итоговую прибыль стратегии.
Участникам предоставляются:
• реальные рыночные данные с анонимизированными признаками
• последовательности длиной 1000 шагов
• различные рыночные режимы и временные периоды
• train и validation датасеты в формате Parquet
Метрика:
Score = суммарный PnL по всем принятым решениям.
Призовой фонд:
1️⃣ $2,500
2️⃣ $1,500
3️⃣ $1,000
Финал соревнования:
Топ-10 участников лидерборда предоставляют код или ноутбук для проверки на скрытом датасете. Финалисты презентуют свои решения команде Reinforce.fi в онлайн или офлайн формате.
Период проведения:
Старт — конец июня 2026 года.
Продолжительность — около 1,5–2 месяцев.
💬 Telegram-чат участников:
https://t.me/+R6lMJ10VXP5hOTI0
Регистрация и подробные условия | 1 392 |
| 15 | ### NYT показала внутренние сообщения Anthropic, но есть важный нюанс
The New York Times получила и описала внутренние сообщения сотрудников Anthropic на фоне давления со стороны властей США.
Судя по переписке, часть сотрудников считает, что компанию «несправедливо выбрали целью». Один из них прямо написал, что ощущение такое, будто правительство США «не хочет, чтобы Anthropic существовала».
Но в этой истории есть важная деталь, которую легко потерять.
Anthropic сама не раз подчёркивала, что её новые модели могут создавать серьёзные риски в кибербезопасности. В частности, Mythos описывали как модель, настолько сильную в поиске уязвимостей в ПО, что она может спровоцировать настоящий cybersecurity reckoning.
Именно поэтому компания заявляла, что будет ограничивать доступ к модели и выдавать его только избранным организациям.
Получается странная ситуация:
* сотрудники Anthropic видят давление как несправедливую атаку
* власти США смотрят на frontier-модели как на актив национальной безопасности
* сама Anthropic публично признаёт, что такие модели могут быть слишком чувствительными для свободного доступа
Главный конфликт уже не в том, «можно ли давать модель всем».
Главный конфликт в том, кто теперь решает, кому можно иметь доступ к frontier AI: сама лаборатория, рынок или государство. | 1 491 |
| 16 | 📢 Открыта регистрация на RecSys Meetup от AI VK
1 июля в Москве инженеры и исследователи AI VK расскажут о трансформерных моделях и LLM-агентах в рекомендациях, представят исследовательское направление и поделятся опытом внедрения технологий Discovery в продукты VK с многомиллионной аудиторией.
Спикеры:
🟣 Андрей Зимовнов, директор по AI, VK
🟣 Александр Дьяконов, руководитель отдела исследований AI VK Research
🟣 Евгений Астафуров, ведущий разработчик, AI VK
🟣 Михаил Трапезников, руководитель группы рекомендательных технологий, AI VK
В программе:
🟣 Нейропрофиль в Discovery
🟣 Контентные LLM-агенты
🟣 Научные исследования в AI VK
🟣 Cоциальное общение, светомузыка и активности
➡️Регистрация по ссылке
Количество мест ограничено, трансляции не будет.
📍1 июля, ДК «Кристалл», Москва
#aivkhub #recsys | 1 479 |
| 17 | Исследователи из Stanford, University of California и Nanjing University представили SEFD - переработанную версию EDGAR filings для обучения LLM на финансовых документах.
Главная проблема старого подхода в том, что SEC-отчёты часто превращались в плоский текст. Модель видела слова и цифры, но теряла структуру: вложенные таблицы, объединённые заголовки, отступы, знаки, иерархию строк и связь между показателями.
SEFD решает это через layout-faithful MultiMarkdown. Он сохраняет логику документа и финансовых таблиц, но убирает лишний HTML-шум, который раздувает токены и мешает обучению.
Публичный снапшот содержит 152 млрд токенов. Полный архив, по оценке авторов, может дать около 550 млрд токенов длинных финансовых документов. При этом пересечение с Common Crawl-корпусами меньше 0,1%, то есть это почти незаезженный источник данных для финансовых LLM.
Модели получают структуру отчётности. Для финансового анализа это критично, потому что в таких документах значение часто лежит не в отдельной цифре, а в том, где она стоит, к какому заголовку относится и как связана с соседними строками.
arxiv.org/abs/2606.18192v1 | 1 490 |
| 18 | Бесплатный вебинар «Обзор инфраструктуры Ollama» 23 июня в 20:00 МСК .
Все больше команд разворачивают ИИ-модели внутри своей инфраструктуры, чтобы защитить данные, снизить зависимость от внешних сервисов и сократить расходы на API.
На занятии разберем:
• как устроена платформа Ollama для локального запуска LLM;
• установку и настройку на Linux, macOS и Windows;
• работу с моделями: загрузку, запуск, управление версиями;
• квантизацию и оптимизацию моделей для ограниченных ресурсов.
После урока вы:
• поймете архитектуру Ollama и принципы ее работы;
• сможете развернуть локальную LLM без облачных зависимостей;
• узнаете, как эффективно использовать вычислительные ресурсы и выбирать подходящие модели.
Урок пройдет в рамках «курса ИИ для разработчиков» и будет полезен разработчикам, DevOps-инженерам и всем, кто изучает практическое применение ИИ.
Регистрация: https://tglink.io/0d54bd21761c54?erid=2W5zFGyzKCu
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963. | 916 |
| 19 | Рост продуктивности от ИИ не линейный. Он ускоряется по мере глубины использования.
Сотрудники, которые активно используют продвинутые возможности ChatGPT вроде GPT-5 Thinking, Deep Research и Image Generation, а также работают с разными моделями и инструментами, сообщают о гораздо большей экономии времени.
В новом исследовании OpenAI показано: группа, которая экономит больше 10 часов в неделю, использует примерно в 8 раз больше AI-кредитов, чем сотрудники, которые сообщают о нулевой экономии времени.
То есть история не в том, что «дали всем чат-бота и получили небольшой равномерный прирост».
Чем глубже люди встраивают мощные AI-функции в свой рабочий процесс, тем сильнее накапливается экономия времени. Активные пользователи превращают ИИ не в случайного помощника, а в полноценного рабочего ассистента.
Из отчёта OpenAI “The state of enterprise AI”.
openai.com/index/the-state-of-enterprise-ai-2025-report/ | 1 539 |
| 20 | Исследователи Amazon с помощью серии промптов добились от модели Anthropic Fable информации о небольшом числе уязвимостей безопасности.
Amazon передала результаты американским чиновникам. Это помогло запустить экспортные ограничения, из-за которых Anthropic пришлось отключить Fable 5 и Mythos 5 для всех клиентов.
Главный спор сейчас в том, что именно показало исследование: серьёзный jailbreak, который раскрыл кибервозможности уровня Mythos, или обычную помощь по кибербезопасности, уже доступную в других продвинутых моделях.
Anthropic не согласна с трактовкой правительства. Эксперты по кибербезопасности, изучившие отчёт, тоже сомневаются, стоит ли вообще считать этот случай jailbreak’ом. | 1 741 |
¡Ya disponible! Investigación de Telegram 2025 — los principales insights del año 
