en
Feedback
Data Secrets

Data Secrets

Open in Telegram

Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN

Show more

📈 Analytical overview of Telegram channel Data Secrets

Channel Data Secrets (@data_secrets) in the Russian language segment is an active participant. Currently, the community unites 90 790 subscribers, ranking 1 410 in the Technologies & Applications category and 6 172 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 90 790 subscribers.

According to the latest data from 29 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by 589 over the last 30 days and by 35 over the last 24 hours, overall reach remains high.

  • Verification status: Verified (Officially confirmed by Telegram)
  • Engagement rate (ER): The average audience engagement rate is 26.17%. Within the first 24 hours after publication, content typically collects 19.15% reactions from the total number of subscribers.
  • Post reach: On average, each post receives 23 760 views. Within the first day, a publication typically gains 17 384 views.
  • Reactions and interaction: The audience actively supports content: the average number of reactions per post is 314.
  • Thematic interests: Content is focused on key topics such as claude, openai, контекст, стартап, llm.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN

Thanks to the high frequency of updates (latest data received on 30 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

90 790
Subscribers
+3524 hours
+2287 days
+58930 days
Posts Archive
Kaggle запустили собственный официальный MCP Это открывает кучу прикольных возможностей. Например, теперь вы можете подключит
Kaggle запустили собственный официальный MCP Это открывает кучу прикольных возможностей. Например, теперь вы можете подключить этот MCP к Cursor (или любому другому агенту) и давать запросы типа «Найди лучший датасет по классификации фото собак и кошек и обработай его». И агент сможет: искать и просматривать конкурсы/датасеты/ноутбуки, скачивать файлы, отправлять сабмиты и даже создавать и запускать ноутбуки. При этом вам вообще не надо выходить из IDE и заходить на Kaggle. Просто запускаете Kaggle MCP сервер, даете ему свои API ключи и готово. Приятно. https://www.kaggle.com/docs/mcp

Fun fact: эта картинка полностью сгенерирована новой Nano Banana Pro (если верить автору) Красота же?
Fun fact: эта картинка полностью сгенерирована новой Nano Banana Pro (если верить автору) Красота же?

Только что на True Tech Champ послушали доклад исследователя Валентина Малых (@valuableai). Валентин руководит фундаментальными исследованиями в MWS AI и преподает в ИТМО, МФТИ и НИУ ВШЭ.  Он уже очень долго занимается информационным поиском и рассказал много интересного на тему реального развертывания таких систем. В частности, затронул довольно горячую тему: RAG против длинного контекста.  Бытует мнение, что RAG – это костыль, обходной путь вокруг ограничений короткого контекста LLM, который работает хуже. И действительно, с RAG бывают проблемы.  Например, Валентин упомянул статью от DeepMind, чьи исследователи доказали, что RAG имеет фундаментальное ограничение: при фиксированной длине вектора, начиная с некоторого размера базы, извлечение всех релевантных документов становится математически невозможным. Более подробно эту статью мы разбирали здесь.  А вот что Валентин говорит по поводу полной замены RAG длинным контекстом:
1. Длинный контекст – не панацея. Сейчас появляются модели все с большим и большим контекстным окном, но прогонять текст через них дорого и долго. Можно пользоваться RAG, и при этом получать почти такое же качество в десятки раз быстрее. 2. В ближайшем будущем вряд ли будет модель, которая сможет прочитать «все и сразу». Все знания человечества – это примерно 30 триллионов токенов, то есть довольно много. Так что RAG останется актуальным даже с увеличением контекста. И из-за качества, и из-за эффективности: во многих задачах лучше получить не очень хороший ответ сейчас, чем хороший через полчаса.  3. Возможно, с развитием ИИ понимание RAG изменится. Технологии поменяются, но концепция останется: извлекаем из чего-то большого что-то маленькое, чтобы с этим работать. Например, тренд на появление в сетях долгосрочной памяти – тоже из этой области.
Спасибо Валентину за содержательную презентацию и разговор! Выступление полностью и трансляцию остальных выступлений спикеров смотрите здесь

Миниатюра: Grok, известный со слов Илона Маска, как «самый честный и непредвзятый ИИ в мире», уверенно вещает на весь твиттер
+3
Миниатюра: Grok, известный со слов Илона Маска, как «самый честный и непредвзятый ИИ в мире», уверенно вещает на весь твиттер о том, что Маск самый умный, красивый, спортивный и харизматичный человек из ныне живущих Сейчас тред, кстати, уже удалили 🤡. Возможно рассмотрели какую-то толику предвзятости. Или нам показалось?

Mediascope опубликовал статистику самых популярных ИИ-ассистентов России: победила Алиса AI Нейросетью Яндекса пользуется 14.
Mediascope опубликовал статистику самых популярных ИИ-ассистентов России: победила Алиса AI Нейросетью Яндекса пользуется 14.3% населения. Для сравнения, у ближайшего конкурента, DeepSeek, доля в полтора раза меньше (9%). Для российского продукта такая планка покорилась впервые, еще весной уверенно лидировали зарубежные нейросети. Ближайший российский конкурент — GigaChat — отстал еще сильнее и расположился примерно на одной ступеньке с ChatGPT (4% и 3,5% соответственно). На самом деле, неудивительно. Продукт у Яндекса получился действительно удобный для широкой аудитории, понимает реальные запросы пользователей, да и по-русски говорит лучше, чем зарубежные модели. К тому же не требует VPN, что очень весомо для среднего пользователя, и легко оплачивается. Переломным моментом стало недавнее громкое обновление Алисы AI, которое сделало ее самой быстрорастущей нейронкой — за первую неделю приложение скачали полтора миллиона раз.

Через полчаса на True Tech Champ начинается суперфинал по программированию роботов. 10 команд со всей страны, которые вышли в
Через полчаса на True Tech Champ начинается суперфинал по программированию роботов. 10 команд со всей страны, которые вышли в финал, с утра соревновались в прохождении трех трасс: полоса препятствий (ее хорошо видно на фото), лабиринт и трасса «над пропастью». Сейчас 6 победителей сразятся в поединках в формате "Царь горы". Должно быть зрелищно. Трансляцию битвы можно будет смотреть вот тут. В том числе выступят команды от многих вузов, так что болейте за свою альма-матер! Ну а мы пока еще успеваем на пару локаций. Уже были на ИТ-Родео, проходили ИИ-лабиринт, сражались робо-пауками и проходили мини-квест с электронными замками. Даже заработали несколько True Coins (но на мерч пока не хватает, так что идем добивать 😐)

Буквально все мы на этой неделе:
Буквально все мы на этой неделе:

OpenAI выложили большую статью/сборник кейсов, в которых GPT‑5 помог сделать научные открытия Во многом там собрано то, о чем
OpenAI выложили большую статью/сборник кейсов, в которых GPT‑5 помог сделать научные открытия Во многом там собрано то, о чем мы с вами уже слышали: – Скандально известные задачи Эрдеша (подробнее) – Самый знаменитый случай с задачкой из выпуклой оптимизации (подробнее) – Прохождение теста Геделя (подробнее) Но есть и много новенького. Разделено все на 4 раздела: переоткрытие научных результатов, глубокий литературный рисерч, работа в тандеме ученый+ИИ, новые научные результаты. Последняя глава, конечно, самая интересная. Собственно, авторы собрали десяток не очень сложных, но все-таки нерешенных задачек из разных областей математики, закинули их в GPT-5. В итоге модель решила четыре. Среди них была одна (на этот раз реально нерешенная) задача из списка Эрдеша, геометрическая задачка поиска выпуклых тел, открытая проблема COLT 2012 и личная гипотеза одного из авторов по теории графов. Не гипотеза Римана, конечно, но тоже ничего, занятненько. Только надо понимать, что задачки решались в scaffolded-режиме, то есть модель работала не автономно, а вместе с экспертом, который ее поправлял, направлял и указывал на дыры. В статье пишут, что эксперт не давал явных подсказок, но все же. Почитать полностью можно тут

⚡️ Сбер порадовал: все модели линейки Kandinsky 5.0 доступны разработчикам в открытом доступе Это: 1️⃣ Video Lite: компактная
+1
⚡️ Сбер порадовал: все модели линейки Kandinsky 5.0 доступны разработчикам в открытом доступе Это: 1️⃣ Video Lite: компактная модель, оптимизированная для запуска на GPU от 12 ГБ VRAM. Обучена на 520 млн изображений и 120 млн видео, значительно превосходит по качеству в 7 раз большую по параметрам Wan 2.1-14B. 2️⃣Video Pro: флагманская модель, способная генерировать HD-видео длительностью до 10 секунд. Обучена на 520 млн изображений и 250 млн видео, на финальном этапе доучивалась на датасете, отобранном профессиональными художниками. Понимает русские и английские промпты, в паритете по динамике и визуалу с Veo3, превосходит Wan 2.2-A14B в Text-to-Video и Image-to-Video. 3️⃣Image Lite: модель для генерации и редактирования изображений в HD-качестве. Обучена на 520 млн изображений, среди них 1 млн с российским культурным кодом. По SBS лучше FLUX.1 [dev] по Text-to-Image и в паритете по качеству с FLUX.1 Kontext по Image Editing. 4️⃣ K-VAE 1.0 (2D/3D): вариационные автоэнкодеры, сжимающие изображения и видео без потери качества. Восстанавливают исходный сигнал лучше (+0.5dB PSNR), чем лучшие open source альтернативы (Flux, Hunyaun, Wan) Все модели линейки доступны полностью (код, веса, лицензия MIT) на GitHub, Gitverse и HuggingFace. Подробности собрaны в техническом репорте

⚫ Мы приехали на True Tech Champ 2025 – третий всероссийский чемпионат по алгоритмическому и робототехническому программирова
+2
⚫ Мы приехали на True Tech Champ 2025 – третий всероссийский чемпионат по алгоритмическому и робототехническому программированию. Сегодня тут можно будет понаблюдать, как 350 самых талантливых программистов со всей страны сразятся за 10 250 000 рублей, послушать выступления известных экспертов, самому покодить на воркшопах и развлечься на одиннадцати специальных станциях. Например, тут есть айтивность, где надо решить алго-задачку, при этом удерживаясь в седле механического быка (100% must). А лекторий оформлен в стиле ИТ-качалки. Трансляцию выступлений, кстати, уже запустили, так что можете взглянуть на расписание и смотреть фест сами, он абсолютно бесплатный. Вот ради чего приехали мы: 1. Воркшоп знаменитого Майкла Лэнхема. Он автор книги AI Agents in Action и сегодня проведет тут двухчасовой мастер-класс по ИИ-агентам. 2. Выступления Тони Янга (директор по североамериканскому бизнесу в Unitree Robotics), Валентина Малых (один из лучших экспертов по RAG в России) и Артема Лыкова (специалист по world models). 3. И, конечно, битва роботов. Финалистам чемпионата предстоит пройти полосу препятствий, лабиринт и узкую трассу, а в суперфинале будут поединки между роботами 1–1. Кто тоже пришел офлайн – подходите общаться!

Сэм Альтман обратился к своим сотрудникам и предупредил их, что из-за Google в компании могут настать «сложные времена» The I
Сэм Альтман обратился к своим сотрудникам и предупредил их, что из-за Google в компании могут настать «сложные времена» The Information якобы получили доступ к внутреннему меморандуму директора, в котором тот говорит сотрудникам, что новые релизы Google могут изменить баланс сил и вызвать волну перемен и во внутренней среде, и со стороны инвесторов.
«Возврат Google в центр внимания спровоцирует напряжённость и rough vibes на рынке»
Кто-то заволновался 🔵

OpenAI уже второй день всеми силами пытается оттянуть внимание от новостей от Google: на этот раз в ход пошел козырь в виде о
OpenAI уже второй день всеми силами пытается оттянуть внимание от новостей от Google: на этот раз в ход пошел козырь в виде общих чатов в ChatGPT Работает просто. Приглашаете в чат кого хотите, общаетесь, по мере надобности вызываете в диалог модельку. Удобно для локального обсуждения какого-нибудь проекта, но очень ситуативно. Уже раскатили на всех платников. Лайк, если тоже считаете, что лучше бы они сделали тг-бота ✌️ openai.com/index/group-chats-in-chatgpt/

Немного примеров генераций новой Nano Banana Pro
+9
Немного примеров генераций новой Nano Banana Pro

Google опять радуют: вышла новая Nano Banana Pro на базе Gemini 3 Подробностей пока нет, но модель уже доступна в Google Vert
Google опять радуют: вышла новая Nano Banana Pro на базе Gemini 3 Подробностей пока нет, но модель уже доступна в Google Vertex AI как "Gemini 3 Pro Image Preview", и первые пользователи в восторге. Пробуйте и делитесь в комментариях: https://gemini.google.com/app

🤝У вас есть AI-проект, у Selectel – мощности для него Арендуйте выделенные серверы с GPU в Selectel для ускорения задач по и
🤝У вас есть AI-проект, у Selectel – мощности для него Арендуйте выделенные серверы с GPU в Selectel для ускорения задач по инференсу и обучению LLM в Selectel: Большой выбор видеокарт (от RTX 4090 до H200), • Готовые и кастомные конфигурации серверов, • Аренда на день или месяц, • Запуск сервера от 2 минут, • Возможность аренды сервера с доставкой до вашей площадки. Разверните ваш проект на выделенных серверах с GPU в Selectel: https://slc.tl/ukwsk Реклама. АО "Селектел". erid:2W5zFHzHnGx

Есть еще «ChatGPT думает», запоминаем
Есть еще «ChatGPT думает», запоминаем

Все, Ян Лекун официально подтвердил, что уходит из Meta* В посте на LinkedIn он написал, что создает стартап для продолжения
Все, Ян Лекун официально подтвердил, что уходит из Meta* В посте на LinkedIn он написал, что создает стартап для продолжения исследовательской программы Advanced Machine Intelligence (AMI). Что такое AMI и чем Лекуну не угодил термин AGI, мы писали тут. Цель стартапа – «сделать следующую большую революцию в ИИ»: создать системы, которые понимают физический мир, обладают постоянной памятью, могут рассуждать и планировать сложные действия.
По моему замыслу, AMI будет иметь широкое применение в различных секторах экономики. Некоторые из них пересекаются с коммерческими интересами Meta, а многие нет. Продолжать работу AMI как независимой организации – мой способ максимизировать её масштабное влияние.
Ушла эпоха.

А это просто красиво: в эти выходные в Лас-Вегасе проходит Гран-при Формулы-1, и в преддверии гоночного викенда Google совместно с McLaren запустили там вот такую огромную залипательную рекламу на Sphere. Google знает, как делать правильные коллаборации

🦾 Argo Workflows и MLOps: автоматизируйте всё, что можно Если вы хотите, чтобы обучение и деплой моделей стали управляемыми
🦾 Argo Workflows и MLOps: автоматизируйте всё, что можно Если вы хотите, чтобы обучение и деплой моделей стали управляемыми и предсказуемыми — пора переходить к автоматизации. На открытом уроке разберём, как оркестрация ML-процессов в Kubernetes превращает хаос в стройную систему. Мы покажем, как описывать пайплайны в YAML, передавать данные между шагами и управлять всем через UI и CLI. Разберём архитектуру Argo Workflows и создадим типовой ML-процесс: от обучения до деплоя модели. Вы научитесь использовать Argo Workflows для автоматизации задач, которые раньше занимали дни. Вы увидите, как CI/CD становится естественной частью ML-инфраструктуры. Поймёте, как Data Scientists и DevOps могут говорить на одном языке. ➡️ Регистрируйтесь на открытый урок в преддверии старта курса “MLOps”. Создавайте надёжные и масштабируемые ML-пайплайны: https://otus.pw/jHgt/ Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576

⚡️ У OpenAI свежая модель для кодинга: GPT-5.1-Codex-Max Видимо, они хотят хотя бы немного перебить хайп вокруг Gemini. Вот ч
⚡️ У OpenAI свежая модель для кодинга: GPT-5.1-Codex-Max Видимо, они хотят хотя бы немного перебить хайп вокруг Gemini. Вот что в релизе действительно интересного: 1️⃣ Это первый Codex, обученный работать в Windows и, в частности, в Powershell. Теперь модель разбирается в особенностях Windows-окружения, структуре файловой системы и тд. Также для Windows появился Agent mode, с помощью которого агент может работать в терминале автономно (доступы можно настраивать). 2️⃣ Заявляют, что модель может непрерывно самостоятельно работать над задачами более 24 часов! Невероятно, если правда (хотя Anthropic для своей Sonnet 4.5 вообще декларировали 30 часов).
«Претрейн и test-time не уперлись в стену» – написал Ноам Браун про релиз. Это он намекает, что масштабирование продолжается.
При этом благодаря новой фишке – «компакции» – Codex теперь может работать с огромными контекстами. Это как бы аналог краткосрочной и долгосрочной памяти. Когда лимит токенов контекстного окна близок, модель сжимает самую старую информацию, а затем вместе с этой выжимкой + последней актуальной информацией переходит в новое контекстное окно. Процесс может повторяться много раз. 3️⃣ Метрики. На SWE-bench Verified GPT-5.1-Codex-Max (xhigh) показывает 77.9% точности. Это лучше, чем у Gemini 3 и Claude Sonnet 4.5, то есть сота. При этом модель теперь еще больше экономит токены. На среднем уровне рассуждений она достигает результатов предыдущей версии, потребляя на 30% меньше токенов. Уже доступно в IDE и Codex CLI, в API завезут «soon» openai.com/index/gpt-5-1-codex-max/