Data Secrets
Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN
Show more📈 Analytical overview of Telegram channel Data Secrets
Channel Data Secrets (@data_secrets) in the Russian language segment is an active participant. Currently, the community unites 90 699 subscribers, ranking 1 408 in the Technologies & Applications category and 6 190 in the Russia region.
📊 Audience metrics and dynamics
Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 90 699 subscribers.
According to the latest data from 26 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by 506 over the last 30 days and by 25 over the last 24 hours, overall reach remains high.
- Verification status: Verified (Officially confirmed by Telegram)
- Engagement rate (ER): The average audience engagement rate is 26.08%. Within the first 24 hours after publication, content typically collects 18.53% reactions from the total number of subscribers.
- Post reach: On average, each post receives 23 655 views. Within the first day, a publication typically gains 16 809 views.
- Reactions and interaction: The audience actively supports content: the average number of reactions per post is 311.
- Thematic interests: Content is focused on key topics such as claude, openai, контекст, стартап, llm.
📝 Description and content policy
The author describes the resource as a platform for expressing subjective opinions:
“Главный по машинному обучению
Сотрудничество: @veron_28
РКН: clck.ru/3FY3GN”
Thanks to the high frequency of updates (latest data received on 27 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.
Data loading in progress...
| Date | Subscriber Growth | Mentions | Channels | |
| 27 June | +15 | |||
| 26 June | +43 | |||
| 25 June | +52 | |||
| 24 June | +69 | |||
| 23 June | +49 | |||
| 22 June | +26 | |||
| 21 June | +39 | |||
| 20 June | +31 | |||
| 19 June | +26 | |||
| 18 June | +18 | |||
| 17 June | +48 | |||
| 16 June | +43 | |||
| 15 June | +32 | |||
| 14 June | +28 | |||
| 13 June | +56 | |||
| 12 June | +23 | |||
| 11 June | +47 | |||
| 10 June | +74 | |||
| 09 June | +43 | |||
| 08 June | +45 | |||
| 07 June | +21 | |||
| 06 June | +26 | |||
| 05 June | +16 | |||
| 04 June | +36 | |||
| 03 June | +23 | |||
| 02 June | +27 | |||
| 01 June | +18 |
С 12 июня мы тесно сотрудничаем с правительством США, чтобы восстановить доступ к Claude Mythos 5 и Fable 5. Сегодня правительство уведомило нас, что мы можем повторно развернуть Mythos 5 для некоторых организаций США, которые управляют и защищают критическую инфраструктуру. Мы быстро восстанавливаем доступ для этих организаций, и мы продолжаем работать с правительством, чтобы расширить доступ к Mythos 5 и снова сделать Fable 5 доступным для общего использования.Честно говоря, пока не слишком обнадеживающе
| 2 | Итак, встречайте: GPT-5.6
https://openai.com/index/previewing-gpt-5-6-sol/
Анонсировали три модели, в честь солнечной системы (с самооценкой у создателей все ок):
1. Sol – самая крупная и крутая. На многих бенчмарках обходит Mythos, и при этом дешевле в два раза. При этом авторы пишут, что модель использует в три раза меньше токенов. В целом экономия в 5-6 раз (ну типа).
2. Terra – промежуточный вариант. Уже в три раза дешевле Mythos, уверенно обходит Opus 4.8.
3. Luna – самый дешевая и быстрая, но по результатам все еще хороша.
Бенчмарков показали маловато, так что на другие замеры еще посмотрим. Общий доступ обещают в ближайшие недели, пока что модели вышли только для ограниченной группы тестеров.
Хоть бы не повторилась история с Fable 🙏 | 14 832 |
| 3 | Оранжевый – доля API американских моделей в OpenRouter
Серый – доля китайских
Сверху разбиение в июне 2025, снизу – в июне 2026
И кто тут теперь техно-лидер? ⌨️
* из статьи Bloomberg | 16 718 |
| 4 | Они добрались до OpenAI: правительство США будет одобрять доступ к GPT-5.6 «клиент за клиентом»
Администрация Трампа связалась с Альтманом и «попросила» его не выпускать модель без одобрения. Конечно же, «по соображениям безопасности».
Так что модель сначала выйдет в ограниченном preview, и только когда-нибудь потом (возмооожно) станет возможно простым смертным: во время периода превью чиновники будут «одобрять доступ клиент за клиентом» (цитата Сэма).
Лицензирование де-факто | 18 840 |
| 5 | 😳 | 19 970 |
| 6 | OpenAI поделились статистикой по Codex. Есть интересное.
openai.com/index/how-agents-are-transforming-work/
Смотрим:
– Внутри OpenAI Codex теперь составляет 99,8% их выходных токенов, а ChatGPT – только 0,2%
– Индивидуальные юзеры все еще концентрируются в ChatGPT, а вот у бизнеса токены в Codex составляют ~64% от общего потребления
– Топ-1% самых активных юзеров Codex в среднем запускают агентов на 71 час в сутки (это сумма по всем агентам)
– Со временем люди все больше и больше делегируют агентам действительно долгие задачи. Например, промпты на задачи, которые занимают ~8-часов работы человека, теперь составляют более четверти запросов. Для сравнения, в декабре их было чуть больше 2%.
Исходя из перечисленного, вопрос: это все еще люди вайбкодят с агентами, или уже агенты с людьми? | 18 370 |
| 7 | ⚡Выбирать железо для обучения и инференса моделей больше не нужно
Qwen, Whisper, Deepseek и другие нейросети уже готовы к работе на приватной инфраструктуре. Просто выбираете нужную модель и получаете готовый инференс-сервис в пару кликов в Selectel.
Каталог ИИ-моделей Selectel — удобный инструмент для работы с нейросетями, когда нужны безопасность и производительность.
Что вы получаете в пару кликов:
⚡Большой выбор моделей для ваших задач: для генерации текстов и кода, распознавания речи, создания контента и других.
⚡Производительность и гибкое масштабирование. Инференс-сервис развернут на современном железе с актуальными видеокартами и автоматически адаптируется при росте или снижении нагрузки.
⚡Прогнозируемая стоимость: платите за фактическое время потребления вычислительных ресурсов.
Начните работать с ИИ-моделями на выделенной инфраструктуре: https://slc.tl/sm4xh
Реклама. АО "Селектел". erid:2W5zFGrgm6h | 16 367 |
| 8 | Черный рынок токенов в Китае
Исследовательница из Оксфордской лаборатории китайской политики написала статью о том, как китайские провайдеры торгуют токенами по ценам ниже официальных. Иногда цена за доступ к модели может составлять всего 10% от официальной. Встает вопрос: как?
Так вот варианта, оказывается, три. Выбирайте, какой нравится больше ☕️:
1. Массовый сбор данных. Подобные провайдеры собирают все запросы, ответы и цепочки ризонинга – и перепродают. На этом и зарабатывают.
2. Подмена моделей. Вам продают Opus 4.7, а на деле подсовывают какой-нибудь Qwen местного разлива. И вот уже скидка на мощную модель превращается в прибыль с дешевой.
3. Арбитраж подписки. Например, берут Claude Max за $200 и делят на десятки клиентов через лимиты по токенам в час. Снова профит! Сюда же генерация кучи поддельных API-аккаунтов для получения бесплатных стартовых кредитов, фейковые студенческие аккаунты и перепродажа чужих неиспользованных квот.
Всякие геоблокировки, телефонные верификации, требования к зарубежным картам и все прочее эти прокси с легкостью обходят. Так что рынок разросся, и официалы с этим ничего поделать не могут.
Китайцы пользуются подобным массово, потому что прямой доступ без VPN и иностранных карт для них закрыт. И все, кажется, довольны. | 17 675 |
| 9 | Какие-то гении изобрели кебаб-банчмарк ❓
https://evaluateai.ai/app/comparisons/0e156620-928b-4a40-bded-84ed556309c5/results/?view=model
Спасибо за внимание | 18 618 |
| 10 | Фиона Фанг, Head of Engineering в Claude Code, сказала, что использование агентов делает инженеров более одинокими
Люди перестают обмениваться опытом и в итоге все больше и больше зацикливаются на работе со своими агентами. Кодинг становится «изолированным».
Фанг говорит, что это серьезная проблема, и Anthropic уже стараются с ней бороться. Оказывается, что помимо всяких хакатонов и кодинг-завтраков в компании проводят так называемые «maker time» встречи: инженеры собираются, вместе программируют и делятся практиками использования агентов.
Вы там как, справляетесь с одиночеством? 😭 | 20 118 |
| 11 | Модель BerryLM от RWB вошла в топ-3 бенчмарка MERA
В основном русскоязычном рейтинге дообученная компанией большая языковая модель BerryLM-XL выдала результаты, сопоставимые с GPT-5.4 и Opus 4.6, и в итоге заняла третье место. Еще одна LLM из семейства моделей RWB, BerryLM-v2, сейчас на 5-ом месте рейтинга.
Обе модели Wildberries активно использует для разных прикладных задач. Например, в ИИ-ассистенте для покупателей, сравнении и поиске товаров, и в ИИ-инструментах, помогающих продавцам отвечать на вопросы и отзывы.
Хорошие места в бенчмарках – это здорово, но когда модель при этом еще и действительно работает в продуктах с миллионами пользователей – это уже интереснее.
Лидерборд: mera.a-ai.ru/ru/text/leaderboard | 17 885 |
| 12 | ⚡️ Некоторые юзеры сообщают, что Fable 5 стал снова доступен для выбора в Claude Code | 17 395 |
| 13 | Anthropic снова обвинили китайцев в незаконной дистилляции Claude
Никогда такого не было, и вот опять.
Стартап утверждает, что операторы, связанные с Alibaba Qwen, провели крупнейшую на данный момент «атаку» на Claude: они зафиксировали около 28.8 млн взаимодействий через почти 25 000 фейковых аккаунтов за полтора месяца.
Основной целью, по словам Anthropic, было извлечь способности моделей в сфере кодинга, ризонинга и tool use.
Сейчас Anthropic направили нескольким сенаторам официальное письмо, в котором попросили Конгресс отреагировать. Но пока ответа от правительства нет, как и комментариев от Alibaba. | 17 465 |
| 14 | Когда языковые модели читают текст, они не просто обрабатывают токен за токеном. В каком-то смысле они испытывают от чтения эмоции.
www.goodfire.ai/research/stories-in-space#
Рисерчеры из GoodFire продолжают исследовать так называемую геометрию LLM. Некоторое время назад они показали, что мысли моделей организованы в виде определенных форм. Например, числа – это окружности, и складывая одно число с другим, LLM на самом деле суммируют множество бубликов: t.me/data_secrets/9223.
Теперь они обнаружили новые любопытные детали. Оказывается, внутри моделей существует целый ландшафт эмоциональных состояний.
Ученые взяли LLama, давали ей читать рассказы и наблюдали за состоянием активаций. Так вот по мере чтения модель как бы перемещается по некоторому многомерному пространству состояний, "испытвая" те или иные эмоции в зависимости от того, что происходит в тексте в данный момент.
Причем если визуализировать соответствующие разным эмоциям состояния модели, то получается структура, очень похожая на классическую психологическую модель эмоций человека. Например, радость находится рядом с интересом, страх и гнев имеют схожую высокую интенсивность и тд.
Еще по этой карте можно предсказывать дальнейшие ответы модели. И если искусственно подталкивать активации в направлении определенной эмоции, настроение и суть генераций меняется.
Красиво | 18 706 |
| 15 | Авито открыли набор на две магистратуры по ML, разработанные совместно с МФТИ и ВШЭ
Самые интересные образовательные программы получаются, когда бигтех приходит в университет не только с финансированием, а еще и с собственными задачами, данными и экспертами. И это как раз случай Авито.
Прямо сейчас открылась отличная возможность поступить в их магистратуры на ML-программы «Прикладное машинное обучение и анализ данных» с МФТИ и «Машинное обучение в цифровом продукте» с ФКН ВШЭ. В основе программ – реальные кейсы компании, а часть занятий будут вести действующие специалисты Авито. Всего в подготовке материалов участвовали более 300 сотрудников.
Стек довольно широкий: это и классический ML, и компьютерное зрение, и рекомендательные системы, и аналитика, и генеративный ИИ. При этом речь идет не про абстрактное изучение алгоритмов, а про применение всего, что вы проходите, в продуктовой среде.
Отдельный плюс: поступать можно из любого региона России. Ждут всех, кто готов всерьез погружаться в ML и перенимать знания из первых рук, от практикующих специалистов.
Подробнее о программах:
– «Машинное обучение (ML) в цифровом продукте» в ФКН НИУ ВШЭ
– «Прикладное машинное обучение и анализ данных» в МФТИ | 17 414 |
| 16 | ⚡️ OpenAI сделали первый собственный чип
Архитектура разработана с нуля вместе с Broadcom, а назвали чип Jalapeño. Предназначен халапеньо специально для инференса LLM и соответсвующих систем а-ля Codex.
Сейчас чип проходит стадию тестирования, но ранние внутренние замеры уже показали, что он перформит лучше текущей SOTA на целый ватт.
openai.com/index/openai-broadcom-jalapeno-inference-chip/ | 17 723 |
| 17 | Топовая работа для инженера 🥰✋🤚 | 18 055 |
| 18 | GLM-5.2 теперь можно запустить локально
Unsloth сделали отличные GGUF 2-bit и 4-bit. Модель 2-bit сохраняет ~82% точности модели и при этом уменьшает потребление памяти на 84%. Запускается на 256GB Mac.
Можно взять даже 1-bit, и все равно будет норм. На простом примере по сравнению с Claude 4.8 Opus и GPT-5.5 модель ведет себя удивительно хорошо ⬆️
huggingface.co/unsloth/GLM-5.2-GGUF
Инструкция по запуску | 21 137 |
| 19 | Многие ML-инженеры (инженеры машинного обучения) сталкиваются с одной и той же ситуацией: опыта становится больше, задачи — сложнее, а следующий карьерный шаг так и не происходит
Специалист уверенно работает с моделями, строит пайплайны (конвейер обработки данных), участвует в экспериментах, решает задачи своей команды. Но вакансии уровня ведущего специалиста или руководителя команды требуют опыта с системами и направлениями, которых в текущем проекте просто нет.
Поэтому многие делают ставку на дальнейшую специализацию: изучают новые архитектуры, глубже погружаются в модели и совершенствуют текущие навыки.
Но проблема в том, что переход на следующий профессиональный уровень часто связан не столько с углублением существующих компетенций, сколько с их расширением.
На более высоких позициях ценится не только умение обучать модели, но и понимание прикладных ML-систем: рекомендательные системы, ранжирование, эксперименты, MLOps (сопровождение машинного обучения), динамическое ценообразование и другие прикладные задачи, напрямую влияющие на продукт и бизнес.
Поэтому дополнительное обучение для опытных специалистов часто становится способом получить опыт в областях, до которых сложно дотянуться в рамках текущего проекта.
Этой задаче посвящен курс Валерия Бабушкина «Продвинутое машинное обучение» от karpovꓸcourses. Его особенность в том, что программу не обязательно проходить целиком. Можно выбрать только те блоки, которые нужны именно сейчас: рекомендательные системы, ранжирование, MLOps, A/B-тестирование, uplift-моделирование (моделирование прироста эффекта) или динамическое ценообразование.
Такой формат позволяет изучать только те компетенции, которые действительно нужны для следующего карьерного шага, экономя и время, и ресурсы на лишние учебные блоки.
Выберите направления, которых сейчас не хватает для интересующих вас ролей, а по промокоду JUNML15 получите скидку 15%: https://clc.to/erid_2W5zFJD9PUm
Реклама. ООО «КАРПОВ КУРСЫ». ИНН 7811764627. erid: 2W5zFJD9PUm | 18 750 |
| 20 | Anthropic выпустили Claude Tag, и Андрей Карпаты назвал это третьим мощным редизайном UX в истории LLM
Теперь Claude можно добавить как члена команды в канал Slack, вызывать его через @ и делегировать ему задачи.
Он тут же пойдет выполнять таску и вернется с результатами в тот же чат, где можно продолжить диалог и смерджить готовый код, не отрываясь от основной переписки с коллегами. Причем разговор с Claude может в любой перехватить любой человек из канала. Пример на видео ⬆️
Обновление создано для более проактивного и бесшовного стиля работы агента. По словам Anthropic, теперь 65% кода внутри стартапа создается именно благодаря внутренней версии Claude Tag.
www.anthropic.com/news/introducing-claude-tag
А Андрей Карпаты написал про Claude Tag следующее:
Это новая парадигма для взаимодействия с Claude. Имхо, это 3-й крупный редизайн LLM UIUX. Первый заключался в том, что LLM - это веб-сайт, на который вы заходите; второй – в том, что это приложение, которое вы загружаете на свой компьютер. Третий же про то, что это автономная, стойкая, асинхронная сущность с общеорганизационными инструментами и контекстом, работающая вместе с командами людей. Понимание этого займет некоторое время, но это работает, и это потрясающе. | 30 732 |
Available now! Telegram Research 2025 — the year's key insights 
