Data Secrets

Kanalga Telegram’da o‘tish

Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN

Ko'proq ko'rsatish

Tarmoq:AI Insider Rossiya6 190 Texnologiyalar & Aralashmalar1 408...

📈 Telegram kanali Data Secrets analitikasi

Data Secrets (@data_secrets) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 90 699 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 1 408-o'rinni va Rossiya mintaqasida 6 190-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 90 699 obunachiga ega bo‘ldi.

26 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni 506 ga, so‘nggi 24 soatda esa 25 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

Tasdiqlash holati: Tasdiqlangan (Telegram tomonidan rasmiy tasdiq)
Jalb etish (ER): Auditoriya o‘rtacha 26.08% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 18.53% ini tashkil etuvchi reaksiyalarni to‘playdi.
Post qamrovi: Har bir post o‘rtacha 23 655 marta ko‘riladi; birinchi sutkada odatda 16 809 ta ko‘rish yig‘iladi.
Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 311 ta reaksiya keladi.
Tematik yo‘nalishlar: Kontent claude, openai, контекст, стартап, llm kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN”

Yuqori yangilanish chastotasi (oxirgi ma’lumot 27 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

90 699

Obunachilar

+2524 soatlar

+1697 kunlar

+50630 kunlar

23 655

Post ko'rishlar

~ 16 80924 soatlar

~ 18 52448 soatlar

26.08%

Muloqot nisbati

~ 4

Kuniga postlar

Ads index

beta

Postlar arxiv

90 707

😁😆😁 не забыть напомнить подписчикам, что скоро нас всех заменит ИИ

90 707

Practical ML Conf 2026 принимает заявки на доклады Яндекс открыл подачу заявок на участие в качестве спикера. Конференция хардовая: технические доклады, инженерные мастер-классы, аудитория мидл+. Ждут именно практику: ML-технологии, которые уже работают в продакшене и приносят измеримую пользу. Заявки оцениваются по четырём критериям – новизна, польза для сообщества, практическая применимость и техническая глубина. Тем, кого отберут, помогут с подготовкой: проработка доклада с программным комитетом, работа с тренером по публичным выступлениям, оформление презентации от дизайнеров. Плюс промо до и после конференции. Ключевые даты: ➖до 22 мая – прием заявок ➖6-10 июля – решение программного комитета ➖август-сентябрь – подготовка совместно с комитетом ➖19 сентября – выступление Если есть что рассказать по существу – это хороший повод заявить о себе перед профессиональным сообществом. Подробности здесь

90 707

Традиционно начинаем день с обновлений Anthropic: на этот раз они выкатили Advisor Strategy Это способ получить почти топовое качество без оплаты топовой модели. Вот как работает: – Есть две модели: Executor (исполнитель, дешевая и быстрая модель, Sonnet) и Advisor (советник, дорогая и сильная модель, Opus). – Исполнитель делает всю основную работу. Но когда сталкивается со сложным моментом, вызывает advisor, который подсказывает, что делать дальше. – Все происходит внутри одного запроса и вмешательства юзера не требует. На самом деле задач, которые требуют вмешательства сильной модели, не так много. Так что на практике такой подход выходит ощутимо дешевле Opus (примерно на 10-12%) с качеством сильно выше Sonnet. Например, относительно базового Sonnet на SWE bench метрика растет почти на 3 процентных пункта. Полезная вещь

90 707

⚡️В службе поддержки Т-Банка уже больше года работает AI-сотрудник Оператора зовут Афанасий Иванов (сокращенно – АИ). Он использует те же инструменты и интерфейсы, что и живые сотрудники. Главная его фича – он позволяет легко масштабировать нагрузку, помогая бизнесу расти. О таком ИИ-специалисте на GoCloud 2026 рассказал руководитель направления обработки естественного языка (NLP) в Центре ИИ Т-Банка Артем Бондарь. По его словам, Афанасий прошел тот же путь, что и обычный сотрудник, например, две недели получал доступ в системы. Именно благодаря такому drop-in сценарию он способен работать по тем же рельсам, что и живые люди. Эксперт отметил, что самый заметный сегодня финансовый эффект дает автоматизация поддержки и операционки. Для этого задействуют целый спектр GenAI-подходов. Помимо AI-воркера, в компании есть еще два основных направления. Для четко регламентированных бизнес-процессов — пошаговая автоматизация с помощью LLM, а для общих задач — агенты, которые ищут решения в сконструированной для них среде. Получается, KPI у Афанасия тоже есть. Что думаете, коллеги?🤫

90 707

OpenAI сделали новую Pro Lite подписку за 100 долларов Доступы будут все те же самые, что и у «настоящего» Pro за 200$, только лимиты поменьше. То есть: вам доступна GPT-5.4 Pro

90 707

OpenAI сделали новую Pro Lite подписку за 100 долларов Доступы будут все те же самые, что и у «настоящего» Pro за 200$, только в Codex лимиты поменьше. То есть: вам доступна GPT-5.4 Pro, ChatGPT Pulse и есть безлимитный доступ к Instant и Thinking моделям в ChatGPT, НО в Codex ваши лимиты в 5 раз больше, чем в Plus (а не в ~10 раз больше, как в полноценном Pro). А еще:

Чтобы отпраздновать запуск, мы увеличиваем использование Codex до 31 мая, чтобы подписчики Pro Lite $100 получили до 10х лимитов ChatGPT Plus на Codex для реализации ваших самых амбициозных идей.

Опять же, все для конкуренции с Anthropic: у тех уже давно есть Max подписка за 100 долларов. Такой формат видимо пользуется популярностью, потому что хорошо закрывает большой и страшный для юзера разрыв между 20$ и 200$, и очевидно больше подходит очень многим. https://chatgpt.com/pricing/

90 707

ReplaceMe: в ИТМО придумали, как радикально ускорять LLM без дообучения На конференции Data Fusion уже 5 лет вручают премию Data Fusion Awards. Награждают компании, лаборатории и отдельные статьи. С каждым годом популярность премии растет: в 2026 на трек "Научный прорыв года в ИИ" поступило уже более 140 заявок. Призовой фонд составил 3 миллиона рублей. Поздравляем победителей этого года и советуем к прочтению их работы: 1. Татьяна Земскова с серией работ о 3DGraphLLM – про то, как ребра графов могут помочь роботам лучше понимать окружающий мир 2. Александр Колесов с серией работ Field Matching – о разработке генеративной модели на основе идеи электростатического согласования полей 3. Дмитрий Шопхоев с работой ReplaceMe – про сжатие LLM Последняя работа приглянулась нам особенно. Студенты ИТМО с научными руководителями обнаружили крайне интересную вещь: в трансформерах целые группы слоев можно схлопывать до линейных операций, существенно ускоряя модели без больших потерь в качестве. Почти любая попытка прунинга обычно упирается в необходимость дообучения, но здесь ученые продемонтировали совершенно другой подход. Они берут последовательность трансформер-блоков, которые "по идее" выполняют сложные нелинейные преобразования, и заменяют их одной линейной операцией, подобранной так, чтобы она максимально точно воспроизводила их поведение. Для этого не нужно обучать модель заново – достаточно прогнать небольшой калибровочный датасет через оригинальную сеть и посчитать линейное отображение между входами и выходами этих блоков. Авторы показывают, что можно удалить примерно до четверти слоев и сохранить около 90% исходной производительности. Это очень сильный результат, если учитывать, что речь идёт о полностью training-free подходе. На фоне других методов сжатия ReplaceMe выглядит особенно сильно: при сопоставимом уровне прунинга он держит качество лучше большинства подходов и при этом избавляет от дорогостоящего дообучения. Действительно значимая работа. Еще раз поздравляем авторов с заслуженной победой и желаем дальнейших сильных результатов и научных прорывов!

90 707

1000 и 1 стартап на агентах сегодня:

90 707

Останется ли Nvidia монополистом в ИИ, или рынок уже начал ломаться На Data Fusion только что послушали сильную практическую сессию про альтернативы Nvidia. На сцене были эксперты из МФТИ, ИИ МГУ, НотаТех, ВТБ и Т1. Разговор получился неожиданно приземленным: без хайпа, зато с цифрами, кейсами и трезвым взглядом на то, что реально происходит с инфраструктурой. Главное: поиск альтернатив – больше не экзотика. Это вынужденная стратегия. ИИ нужно внедрять всем, а значит всем нужны мощности. Но доступ к Nvidia усложняется, и для многих стран, включая Китай и Россию, это уже вопрос не удобства, а возможности вообще участвовать в гонке. ⚙️ Отсюда и начинается движение. В первую очередь – появляются китайские GPU. Артем Каранович из T1 сравнивает этот рынок с рынком автомобилей: если раньше китайцы выглядели странно и сыро, то сейчас появляются полноценные игроки. Лев Меркушов из ВТБ рассказал, что они проводили масштабное тестирование на широком спектре задач и установили, что китайские карточки – это уже вполне production-ready решение, и компании начинают осознанно диверсифицироваться. Да, это сложнее, и проблем достаточно, но зависеть от одного вендора становится слишком рискованно. ⚙️ Но железо – это только один слой. Когда давление на инфраструктуру растет, неизбежно приходится оптимизироваться и инженерно. И тут показательный кейс был от Ильи Семенова из Ростелекома. Они занимались анализом видеопотока для ЕГЭ (выявляли списывающих), и нужно было ускорить тяжелый пайплайн в 4 раза без изменения кластера. В итоге инженеры сделали ×9 – за счет перехода на смешанную точность (FP16 + FP32) и дистилляции. То есть часть проблем с «не хватает GPU» на практике часто решается не закупкой, а нормальной работой с моделями. ⚙️ В итоге картина такая: Nvidia по-прежнему остается лидером – за счет экосистемы и удобства. Но монополия начинает размываться. Сам Хуанг признает, что конкуренция появляется, и сильная. А что касается практики, то сейчас альтернатива – это не один «убийца», а комбинация: другое железо, инженерные оптимизации и адаптация софта. Еще раз напоминаем, что трансляция Data Fusion идет прямо сейчас здесь

90 707

Илон Маск обучает модель на 10 триллионов параметров В Твиттере он недавно заявил, что на Colossus 2 сейчас обучается целых 7 моделей: - Imagine V2 - 2 варианта модели на 1T - 2 варианта модели на 1.5T - модель на 6T - модель на 10T Если это правда, то две последние бьют (скорее всего) любые рекорды по размеру среди современных моделей. Причем не просто бьют, а на порядок: аналитики насчитывают в текущих фронтирах максимум 1–1,8 триллионов параметров. Но это если эти громадины действительно дообучат, а то Илон у нас любитель раскидываться цифрами и датами 🤫

"Нужно наверстать упущенное" – написал Маск.

90 707

OpenAI пойдут точно по стопам Anthropic: они заканчивают разработку модели, которую выпустят только для ограниченного числа компаний Модель называется Spud (картошка). В конце марта слухи о ней уже ходили: The Information тогда сообщали, что OpenAI закончили претрейн, и что модель получилась настолько сильной, что вокруг нее даже начала меняться структура компании. В частности, вместо отдела продуктовых интеграций там образовалось подразделение «AGI Deployment». Эта команда будет отвечать за то, как Spud будет работать в продуктах. Сообщалось также, что OpenAI планируют построить на ее основе «супер‑приложение», в котором объединят ChatGPT, Codex и браузер Atlas. Но теперь оказывается, что запуск Spud на широкую аудиторию пока откладывается. Причина – та же, что и у Anthropic: мол, модель слишком опасна в терминах автономности и возможностей кибератак. Так что в ближайшем будущем доступ получит только небольшая группа компаний (но надеемся, что хотя бы метрики мы увидим). Только не списывай точь-в-точь...

90 707

⚡️ Мы с командой Data Secrets снова приехали на Data Fusion Это одна из крупнейших ежегодных конференций по ИИ и анализу данных. В этот раз проект вышел на еще больший масштаб: собрались главы всего бигтеха, огромное количество специалистов и много иностранных гостей. В программе 70+ сессий, среди тем: экономика данных, инфраструктура ИИ, агенты, RL, CV, NLP, Open Source, Embodied AI, рексис, кибербез, AgentOps. Если вы работаете в IT – это вам точно надо. Делимся ссылкой на трансляцию докладов и расписание для тех, с кем в этот раз не встретимся очно. Мы сегодня уже успели послушать дискуссию про ИИ агентов и Embodied AI с участием Радослава Нейчева, Тиграна Саркисова (директор по управлению данными в X5), Романа Стягюгина (руководитель ИИ в VK) и других экспертов. Прозвучало несколько интересных мыслей о том, что останаливает нас на пути полного внедрения агентов и развития ИИ в индустрии: ➖ Во-первых, это, конечно, стоимость. Агенты и LLM – это все еще очень дорого. У большинства стран просто нет необходимой инфраструктуры. А что касается прода, то, как сказал Радослав: "Иногда все еще лучше просто воткнуть CatBoost". ➖ Во-вторых, неочевидно: образование. По словам Константина Романова, директора по ИИ в Билайне, 80% мировых экспертов все еще приходится только на Китай и США. ➖ В-третьих, инженерия. Модели уже достаточно хороши, чтобы работать качественно, но настройка необходимого окружения и оркестрация агентов требует слишком много ресурсов – человеческих и финансовых. Скоро, кстати, стартует сессия с двумя специалистами из Китая, они расскажут про опыт внедрения AI со своей стороны. Присоединяйтесь к конференции здесь: https://data-fusion.ru/

90 707

Кстати, теперь мы наконец знаем, благодаря кому у Anthropic такая невероятная скорость разработки ⌨️

90 707

Anthropic выпустили Claude Managed Agents – среду для запуска сложных и долгих агентных задач По сути, автопилот: вы задаете цель, инструменты и ограничения, а платформа берет на себя весь рантайм, все планирование, весь мониторинг и инфраструктуру. То есть теперь вам вообще не нужно самостоятельно заниматься оркестрацией, управлять файлами и тд, Managed Agents все делает за вас. Систему уже успели попробовать несколько ранних клиентов. Например, у Notion она уже внедрена на уровне полноценного исполнителя процессов: команды работают с Managed Agents над долгоиграющими проектами. Они захватывают этот рынок все больше https://www.anthropic.com/engineering/managed-agents

90 707

Тем временем происходящее в новой соцсети Андрея Карпаты:

90 707

Meta* показали первую языковую модель от нового подразделения Meta Superintelligence Lab by Александр Ван И это... оказалась не очередная Llama 😐 Модель назвали Muse Spark, она пока не в опенсорсе, но в блоге пишут, что "надеются на опенсорс будущих версий". В блоге пишут, что за последние девять месяцев компания переработала архитектуру, оптимизацию и процесс обработки данных, и теперь достигает сопоставимых возможностей с более ранними моделями, используя на порядок меньше компьюта. По метрикам: – По кодингу ничего сверхъестественного, ожидаемо отстает от Opus 4.6 и GPT-5.4 – Хорошие показатели на HLE, но на ARC-AGI-2 до соты далеко – Впечатляющие результаты на медицине и мультимодальных бенчмарках, модель отлично прокачали для всяких визуальных задач Также представили режим Contemplating для запуска нескольких агентов. Это некий аналог Gemini Deep Think и GPT Pro. Пока модель доступна только на meta.ai. Скоро ее обещают добавить в WhatsApp, Instagram, Facebook и в Meta Ray-Ban (видимо, для очков визуальные способности и качали). В целом, неплохой старт, чтобы вернуться в гонку. ai.meta.com/blog/introducing-muse-spark-msl

90 707

Некто реализовал хлыст, который бьет агента Claude, и Anthropic отправили ему за это досудебную претензию Уже пару дней в Интернете вирусится цифровой хлыст для Claude. Это просто игрушечная утилита, которая «размахивает» в терминале хлыстом и раз в несколько секунд пишет в Claude Code “FASTER FASTER FASTER”. Всем смешно, а вот антропикам – нет. Они взяли и выслали создателю юридическое письмо, требующее прекратить действия, нарушающие торговую марку или вводящие пользователей в заблуждение относительно связи с компанией. Все из-за того, что в названии проекта фигурирует название их модели (Whip for Claude). Anthropic требует убрать любое использование их бренда или «намеков на партнерство», а также предоставить письменное подтверждение выполнения требований до 14 апреля. На самом деле они просто защищают хрупкие чувства своего агента 😭

90 707

Почему омни-модели — это больше про инфраструктуру, чем про архитектуру Последние пару лет вся индустрия пытается склеить модели: текст с изображениями, речь с текстом, диффузию с трансформерами. Со стороны это выглядит как архитектурная задача. Берем несколько моделей, склеим друг с другом, учим на мультимодальных данных — готово. На практике все оказывается сильно сложнее. На примере собственного опыта это отлично показал Роман Исаченко в докладе. Роман отвечает за базовые технологии ART и VLM в Яндекс R&D, и вот что он рассказывает о том, как на самом деле обстоят дела с омни-моделями: Первый bottleneck на уровне предобучения — не архитектура, а инфраструктура мультимодального обучения. На тысячах GPU это превращается в сложную систему с несколькими видами параллелизмов. Любая неэффективность сразу стоит скорости. В докладе был хороший пример про картиночный энкодер: в нем половина времени уходит не на основные вычисления, а на операции типа резидуалов и сложения байесов. Такое ловится только через глубокий профайлинг. Вторый важный нюанс уже на уровне алайнмента. Здесь RL становится ключевой частью системы. Нужно проектировать реворды под разные модальности и следить, чтобы полученная система ревордов обладала свойством независимости, то есть отдельные реворды были нескорелированными между модальностями. Ну и куда же без данных. Смешивание данных для обучения — отдельная история, тут очень важны пропорции. Нельзя просто добавить картинки к тексту и надеяться, что все заработает. Это долгий путь экспериментов, где подбор правильной микстуры занимает огромное количество времени. Отсюда главный вывод: омни-модели — это не про новые архитектуры, а про умение обучать сложные системы. И именно на этом уровне сейчас происходит основной прогресс.