Data Secrets

Open in Telegram

Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN

Network:AI Insider Russia6 141 Technologies & Applications1 388...

📈 Analytical overview of Telegram channel Data Secrets

Channel Data Secrets (@data_secrets) in the Russian language segment is an active participant. Currently, the community unites 90 966 subscribers, ranking 1 388 in the Technologies & Applications category and 6 141 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 90 966 subscribers.

According to the latest data from 04 July, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by 731 over the last 30 days and by 34 over the last 24 hours, overall reach remains high.

Verification status: Verified (Officially confirmed by Telegram)
Engagement rate (ER): The average audience engagement rate is 25.92%. Within the first 24 hours after publication, content typically collects 18.76% reactions from the total number of subscribers.
Post reach: On average, each post receives 23 574 views. Within the first day, a publication typically gains 17 065 views.
Reactions and interaction: The audience actively supports content: the average number of reactions per post is 304.
Thematic interests: Content is focused on key topics such as claude, openai, контекст, стартап, llm.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
“Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN”

Thanks to the high frequency of updates (latest data received on 05 July, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

90 966

Subscribers

+3424 hours

+2257 days

+73130 days

23 574

Post views

~ 17 06524 hours

~ 18 79748 hours

25.92%

Engagement rate

~ 4

Posts per day

Ads index

beta

Posts Archive

90 968

Anthropic опенсорснули свой микроскоп для LLM Помните, в марте мы рассказывали о большом исследовании Anthropic про способ отслеживания "мыслей" моделей? Метод назывался Circuit Tracing (то есть цепная трассировка) и позволял выделять какие-то интерпретируемые концепты и рисовать настоящие карты внутренних "размышлений" LLM. Тогда эта работа стала большым шагом в исследованиях по интерпретируемости, и вот теперь Anthropic выпустили целую опенсорсную библиотеку, основанную на их методе + готовую интерактивную песочницу на Neuronpedia. Вот как это работает: ➖ вы выбираете модель, ➖ задаете промпт, ➖ настраиваете гиперпараметры (если хотите) ➖ ... и получаете большой аналитический граф того, как модель обдумывает ответ на ваш запрос. С этим графом можно взаимодействовать, рассматривать на разных уровнях и тд. Как это все работает технически – читайте в нашем разборе вот тут. Ну и пробуйте сами, конечно, работа у ребят получилась большая и интересная

90 968

У Manus тоже обновление: теперь там есть тулза для генерации презентаций По одному текстовому запросу и любым референсам (картинки, шаблоны и прочее) можно сгенерировать нужное количество слайдов с желаемым дизайном, наполнением и даже графиками. Если нужно что-то отредактировать, можно просто нажать на нужное место и поправить, ну или попросить это сделать агента. Тем, у кого скоро защита диплома – привет 😁

90 968

Perplexity запустили режим Labs: аналог Deep Research на максималках Мод предназначен для сложных поисковых задач и в нем можно создавать отчеты, таблицы, картинки, презентации и даже панели мониторинга. На выходе получается не просто текст со ссылками, а целая интерактивная раскладка с графиками и дашбордами. Labs даже может развернуть мини-приложение. При этом весь написанный агентом код (для графиков, для вот таких мини-приложений и тд) доступен в отдельной вкладке. Посмотреть и потыкать больше примеров можно бесплатно здесь Попробовать фичу можно в подписке Pro (20$ в месяц)

90 968

ИИ обошел 90% команд на соревновании хакеров Исследователи из Palisade Research (это те, у которых недавно выходило вот это громкое исследование про саботаж моделей) сделали специальный AI-трек на двух недавних соревнованиях Capture The Flag от крупнейшей платформы Hack The Box. Суммарно участие принимали почти 18 тысяч человек и 8 500 команд. Из них несколько полностью состояли из ИИ-агентов. Вот что вышло: ➖ В первом небольшом соревновании (≈400 команд) четыре из семи агентов решили по 19 из 20 задач и вошли в топ 5 % участников ➖ Во втором большом CTF (≈8 000 команд) лучшему ИИ-агенту удалось захватить 20 флагов из 62 и оказаться в топ-10% ➖ При этом агенты справляются почти со всеми задачами, на которые человек тартит до часа времени, и делают это в разы быстрее Одинаково неплохо моделям удавались и с задачи на взлом шифра, и веб-взломы, и с форензика, и с эксплуатация уязвимостей 💀 Ну и экономический эффект тоже на месте. Если принять во внимание, что на одну команду из топ-5% обычно уходит не менее нескольких сотен человеко-часов на подготовку, анализ и написание эксплойтов, то даже самый дорогой агент, который работал 500ч, в итоге обошелся дешевле, чем 10 таких живых команд. arxiv.org/pdf/2505.19915

90 968

Haha, classic: ИИ лондонской компании BuilderAI на деле оказался сотнями индийцов За много лет существования в стартап инвестировали Microsoft, Суверенный инвестфонд Катара и ряд других крупных фондов. Всего они привлекли около 440 миллионов долларов. В 2018 году стоимость компании достигала 1.5 миллиардов. Суть в том, что заказчики оставляют ТЗ, а «нейросеть» Natasha AI пишет для них код приложения или сайта. Вот только оказалось, что вместо нейросети в стартапе использовали труд сотен живых сотрудников. Самое интересное, что это не такая уж и новость: об этом еще в 2019 году сделали расследование The Wall Street Journal. Вот только почему-то тогда на него никто не обратил внимание, и инвесторы продолжили нести деньги. И даже после бума ИИ в 2022 компания еще несколько лет продолжала оставаться на плаву за счет живых программистов и, частично, API сторонних вендоров. Теперь кредиторы наконец проснулись и заморозили стартапу большинство счетов. Плюсом ко всему теперь BuilderAI подозревают в фальсификации финансовых прогнозов. Сейчас они подают в суд по защите от банкротства 🤡

90 968

Интересное фото прилетело к нам в предложку: на госэкзамене по профилю «Реклама и связи с общественностью» в Финансовом университете при Правительстве РФ в качестве задачи используют кейс Сбера с их моделью Kandinsky, когда компания помогла в сохранении культурного наследия и восстановила изображение картины «Портрет Званцевой» Ильи Репина. Студентам нужно было предложить план PR-кампании для нейросети. Надеемся, Сбер учтет лучшие предложения 😏

90 968

Джеффри Хинтон в новом интервью внезапно сказал, что у ИИ, возможно, уже есть эмоции По его мнению, реальные и симулированные эмоции не такие уж и разные. У человека есть два аспекта эмоций: физиологический (как краснеть от смущения) и когнитивный. Когнитивный аспект – это, по сути, выученная реакция на раздражитель, усвоенное поведение.

«С точки зрения когнитивного поведения, эмоции машины могут быть такими же, как у нас»

Ждем, когда появятся движения за защиту чувств ИИ youtu.be/uuOPOO90NBo

90 968

Полезная новость для всех, кто работает с аналитикой в DataLens Теперь вы можете подтвердить свои навыки официально и со скидкой 50%. Сертификация DataLens Analyst от Yandex Cloud помогает систематизировать знания и добавить весомый пункт в резюме. На экзамене — все по делу: — чарты и датасеты, — вычисляемые поля и параметры, — подключение источников, — дашборды и доступы. До конца августа пройти сертификацию можно за 2 500 ₽ вместо 5 000 ₽. Плюс — бесплатный курс и примеры заданий уже собраны на сайте. Переходите по ссылке и подтвердите свои знания и навыки работы с DataLens.

90 968

Смотрите, какого симпатичного робота-игрока в бадминтон обучили в Robotic Systems Lab в Цюрихе Робота обучали полностью в симуляции с высокой частотой и крупным пулом параллельных сред (4096 экземпляров), чтобы охватить разнообразие ударов и позиций. Самое сложное здесь – это точно предсказывать точку перехвата (удара), так что ученые заранее генерировали случайные траектории волана, задавая начальные координаты и скорости по равномерному распределению, а затем отслеживали его положение через HSV-фильтрацию камеры. На самое интересное, что здесь основная моделька – это обычная полносвязная (feed-forward) MLP. Ее обучали политике по схеме PPO с AdamW. На выходе она выдаёт параметры (μ и σ) гауссовского распределения действий. Из этого распределения затем и сэмплируются управляющие команды: целевые крутящие моменты или позиции суставов. Такого бы летом возить с собой на пикники www.science.org/doi/10.1126/scirobotics.adu3922

90 968

⚡️ Вышел Apache Spark 4.0. Что интересного а релизе: 1️⃣ Новая архитектура клиент-сервер Spark Connect. Теперь клиентское приложение отделено от кластера Spark. Это значит, что подключаться к Spark можно будет из любой среды и ЯП, включая Python, Scala, Go, Swift и Rust. Кстати, клиент для Python весит всего 1,5 МБ и устанавливается просто через pip install pyspark-connect. 2️⃣ Режим ANSI SQL по умолчанию. Раньше Spark прощал многие ошибки — например, если ты делил на ноль или числа не влезали в столбец, он просто возвращал NULL или тихо обрезал значение. Это было удобно, но могло скрывать баги. Теперь включён режим ANSI SQL по умолчанию — как в классических базах данных. Если в запросе ошибка, Spark сразу об этом скажет и выбросит ошибку. Получается более надежно и предсказуемо. 3️⃣ Materialized Views. Это сохранённый результат SQL-запроса, который может автоматически использоваться при выполнении будущих запросов, если Spark понимает, что часть запроса уже была вычислена и закеширована. То есть теперь повторяющиеся запросы не надо каждый раз пересчитывать, можно просто достать из кэша. Супер существенно для времени и нагрузки на кластер. 4️⃣ Python Data Source API. Это прямо очень приятно: теперь не надо учить Scala, чтобы подключиться к кастомному источнику данных, все можно сделать просто на питоне. Это сильно упрощает интеграцию Spark с веб-сервисами, файлами, базами данных и вообще чем угодно. 5️⃣ Новый тип данных VARIANT. Это специально для полуструктурированных данных. То есть теперь, если у вас где-то лежат вложенные поля или JSON, запросы к ним можно выполнять прямо из коробки, предварительно не описывая схему. Официальный релиз

90 968

Преимущества DVC: Как улучшить ваш ML-процесс! Присоединяйтесь к бесплатному вебинару и получите скидку на большое обучение онлайн-курса «MLOps». На открытом вебинаре 2 июня в 20:00 мск. Обсудим: - Контроль версий данных – необходим для воспроизведения экспериментов и отката к предыдущим датасетам. - Совместная работа – DVC помогает синхронизировать данные и модели, избегая хаоса в репозиториях. - Эффективное хранение – большие файлы хранятся отдельно от кода, но связаны через Git. Кому будет полезен вебинар? - Data Scientists, Data Engineers, ML-инженеры. Результаты: - Настройка DVC в Git и подключение внешнего хранилища. - Переключение между версиями датасетов и моделей. - Создание воспроизводимых пайплайнов для ML-моделей. 👉 Зарегистрируйтесь по ссылке: https://tglink.io/42b712047eaf?erid=2W5zFGre51z Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.

90 968

Веса новой R1 официально выложили на HF По первым бенчмаркам точность теперь действительно примерно на уровне o3 (на картинке – LiveCodeBench). На Aider R1 теперь на уровне Claude 4 Opus. Сами разработчики пишут, что у версии большой буст в ризонинге, фронтэнде и использовании инструментов. Снова открытая ризонинг SOTA, получается huggingface.co/deepseek-ai/DeepSeek-R1-0528

90 968

СЕО Anthropic Дарио Амодеи дал интервью изданию Axios и заявил, что ИИ в ближайшие 5 лет поднимет уровень безработицы на 10-20% По его мнению, ИИ-компаниям и государству надо перестать подслащивать пилюлю и наконец трезво открыть людям глаза на то, что будет происходить в сфере технологий, финансов, консалтинга и тд.

«Половину рабочих мест белых воротничков ИИ заменит в ближайшие 5 лет, и мы к этому не готовы»

Иронично, что заявляет он это сразу после громкого выпуска Claude 4

90 968

Кто обучает будущих архитекторов AGI Каждый второй стартап пишет «AI-native» в питч-деке, но остаётся вопрос: кто вообще готовит тех, кто сможет строить такие системы? Это преподаватели и эксперты-практики, которые не только работают в индустрии, но и делятся знаниями со студентами. Они читают курсы, вытаскивают студентов в реальные проекты и актуализируют программы в университетах. Yandex ML Prize 2025 как раз про таких — про тех, кто стоит у истоков индустрии, хотя их обычно не видно в релизах и исследованиях. В этом году премия от Яндекса вручает гранты и поддерживает преподавателей, которые формируют будущую экосистему ML в России. Прием заявок на премию открыт до 22 июня. Категории: от преподавателей со стажем до руководителей целых ML-программ.

90 968

DeepSeek обновили R1 В официальном аккаунте на WeChat разработчики написали, что R1 подучила «минорное тестовое обновление», и что попробовать его уже можно на официальном сайте. Хотя обновление и минорное, пользователи пишут, что теперь рассуждения модели стали глубже и вышли на уровень o3 + стали дольше (кто-то даже делится неподтвержденными скриншотами 25 минут рассуждений). Официальных бенчмарков пока нет. Ждем. Если это действительно уровень o3, то какой будет r2?

90 968

Исследователи Яндекса разработали и выложили в опенсорс YaMBDa — один из самых больших датасетов в области рекомендательных систем. В нем 4,79 миллиардов обезличенных пользовательских действий на Яндекс Музыке. Для RecSys это редкость, так как качественных открытых датасетов в этой области дефицит. Тем более очень нечасто такие данные публикуют коммерческие платформы. Структура YaMBDa (YAndex Music Billion-interactions DAtaset): внутри прослушивания, лайки, дизлайки (то есть неявный фидбэк), некоторые характеристики треков и флаг is_organic, который означает, было ли действие пользователя органическим или вызванным рекомендациями. Файлы предоставляются в формате Apache Parquet с глобальным временным сплитом. Опять же, удобно, потому что в отличие от Leave-One-Out сохраняется глобальная временная последовательность и исключаются лики. Допом к датасету идет набор бэйзлайнов (MostPop, DecayPop, ItemKNN, iALS, BPR, SANSA, SASRec). Можно не реализовывать базу, а сразу сравнивать ваши алгоритмы с существующими метриками. Хабр | Hugging Face

90 968

Дуров 🤝 Маск Только что стало известно, что уже этим летом Grok встроят в Telegram. И это будет не просто официальный бот, а большая колаба: – Можно будет задавать модели вопросы прямо из поиска в тг – Агент сможет модерировать чаты и помогать писать сообщения, – … проверять и суммаризировать посты, – … и даже генерировать картинки За такую интеграцию Telegram получит 300 миллионов долларов + долю в акционерном капитале xAI + 50% с каждой проданной через тг подписку на Grok. Жирно, конечно. Неудивительно, что на фоне новости TON уже взлетел на 23 процента 💵 UPD: Маск опроверг информацию

90 968

Знаете функцию «Войти с помощью Google / Apple / др»? Скоро так можно будет входить с помощью учетки ChatGPT Это не просто отдаленные планы компании: вчера OpenAI уже запустили форму поиска разработчиков, которые заинтересованы интегрировать вход по ChatGPT на свои платформы. Документация по тому, как это будет работать, тут. Кажется, что это минорная фича, но на самом деле это большой шаг в конкуренции с Google, Microsoft и другими. Чем шире такие интеграции – тем больше OpenAI становится крупной корпорацией.

90 968

Вау, Google раскатали приложение для локального запуска моделек на телефоне Оно абсолютно бесплатное, опенсорсное и поддерживает даже мультимодальные модели. Инструкция, как запустить: 1. Заходим в репозиторий Google AI Edge Gallery, заходим в Releases и скачиваем файл .apk. Это для Android, на айфоны будет позже. 2. Заходим в приложение, скачиваем одну из моделей оттуда или загружаем свою. 3. Все, теперь вы можете пользоваться этой моделью локально, то есть оффлайн и только на ресурсах вашего телефона. Особенно хорошо это работает с новыми Gemma 3n, адаптированными специально под локальный запуск.

90 968

МТС приглашает разработчиков на масштабную ИТ-конференцию True Tech Day 6 июня. Участие бесплатно Ключевая тема конференции в этом году — искусственный интеллект. Тебя ждут доклады ученых, выступления зарубежных спикеров по AI и экспертов крупных ИТ-компаний. В программе: — 4 трека и больше 40 докладов. — Выступления зарубежных спикеров с индексом Хирша более 50. — Концентрация практических кейсов: как создаются большие ML-проекты. — Доклады по архитектуре, бэкенд-разработке и построению ИТ-платформ. — AI-интерактивы и технологические квесты. — Пространство для нетворкинга, …а еще after-party со звездным лайн-апом. Когда: 6 июня Где: Москва, МТС Live Холл и онлайн Участие бесплатно. Регистрация по ссылке.