en
Feedback
Data Secrets

Data Secrets

Open in Telegram

Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN

Show more

📈 Analytical overview of Telegram channel Data Secrets

Channel Data Secrets (@data_secrets) in the Russian language segment is an active participant. Currently, the community unites 90 966 subscribers, ranking 1 388 in the Technologies & Applications category and 6 141 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 90 966 subscribers.

According to the latest data from 04 July, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by 731 over the last 30 days and by 34 over the last 24 hours, overall reach remains high.

  • Verification status: Verified (Officially confirmed by Telegram)
  • Engagement rate (ER): The average audience engagement rate is 25.92%. Within the first 24 hours after publication, content typically collects 18.76% reactions from the total number of subscribers.
  • Post reach: On average, each post receives 23 574 views. Within the first day, a publication typically gains 17 065 views.
  • Reactions and interaction: The audience actively supports content: the average number of reactions per post is 304.
  • Thematic interests: Content is focused on key topics such as claude, openai, контекст, стартап, llm.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN

Thanks to the high frequency of updates (latest data received on 05 July, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

90 966
Subscribers
+3424 hours
+2257 days
+73130 days
Posts Archive
Хотите не просто пользоваться нейросетями, а создавать их? Тогда есть повод присмотреться - МТС и НИУ ВШЭ объявили набор на третий поток магистратуры «Исследования и предпринимательство в искусственном интеллекте». Для студентов предусмотрено 30 оплачиваемых мест. В программе — генеративный ИИ, большие языковые модели, агентные системы, машинное обучение, видеоаналитика и реальные кейсы МТС Web Services.
«За время обучения ребята получили хорошую базу для карьеры в сфере ИИ: работали с индустриальными задачами, использовали виртуальную инфраструктуру MWS Cloud и ресурсы GPU, учились создавать и масштабировать ИИ-решения в бизнес-среде», – заявил гендиректор МТС Web Services Павел Воронин.
Лучших студентов пригласят на стажировку или сразу предложат работу в МТС Web Services. Кстати, первый выпуск уже состоялся — дипломы получили 25 человек. Оставить заявку можно по ссылке.

Еще одна интересная новинка от Anthropic: Claude Science Это агент для рисерча, буквально Claude Code для исследователей. Разработчики описывают Claude Science как полноценную ИИ-инфраструктуру для рисерча end-to-end. То есть это поиск литературы, анализ данных, вычисления, визуализация и подготовка статей в одном интерфейсе. В комплекте уже идет база скиллов для агента + есть всякие приятные визуализации и отображения артефактов, посмотрите видео. Пока в бете, попробовать можно в виде приложения на MacOS или Linux. https://www.anthropic.com/news/claude-science-ai-workbench

📣 Чтобы LLM-система рассуждала, проверяла ответы, работала с внешними знаниями и меньше ошибалась, нужна продуманная архитек
📣 Чтобы LLM-система рассуждала, проверяла ответы, работала с внешними знаниями и меньше ошибалась, нужна продуманная архитектура. Именно она отличает полезное решение от чат-бота, который отвечает неточно. 📆 23 июля в 20:00 МСК приглашаем вас на открытый урок в преддверии старта курса «Большие языковые модели. Экспертный уровень / LLM». На занятии разберём: ➖ как ReAct помогает модели совмещать рассуждение и действия; ➖ зачем нужен Reflection для проверки и улучшения ответов; ➖ как RAG подключает LLM к внешним источникам знаний и снижает риск фактических ошибок. ❗️ Урок подойдёт DS-, ML- и NLP-специалистам, а также ИТ-специалистам, которые хотят проектировать более надёжные LLM-решения для рабочих сценариев. Зарегистрируйтесь и разберитесь, как комбинировать ReAct, Reflection и RAG в архитектуре LLM-систем: https://otus.pw/tvIBW/ Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576

Коротко о возвращении Fable
Коротко о возвращении Fable

Проснулись улыбнулись: Fable 5 возвращают для всех! https://www.anthropic.com/news/redeploying-fable-5 Никакой верификации гр
Проснулись улыбнулись: Fable 5 возвращают для всех! https://www.anthropic.com/news/redeploying-fable-5 Никакой верификации гражданства пока не будет, но в модель добавили еще больше фильтров и защит, поэтому, как пишут сами Anthropic, даже некоторые рутинные задачи по кодингу или дебаггингу с большой долей вероятности будут перекидываться на Opus 4.8. Не разгуляешься, в общем, но хотя бы так. Также антропики вынуждены расширить сотрудничество с правительством. Им будут давать предварительные доступы к новым моделям «для оценки безопасности» + будут проводиться некие «совместные исследования». Mythos, кстати, тоже возвращают. Но только для части организаций в США, которые были одобрены государством.

⚫ Модель уже доступна в нашем API-сервисе DS Lab https://dslab.tech/ai/models/llm/claude-sonnet-5 Цены: 200р/м input, 1000р/м output. Без VPN и иностранных карт. Подключайтесь в один клик и пользуйтесь.

⚡️ Anthropic выпустили Sonnet 5 https://www.anthropic.com/news/claude-sonnet-5
⚡️ Anthropic выпустили Sonnet 5 https://www.anthropic.com/news/claude-sonnet-5

VP of Engineering из Spotify дал интервью Борису Черному и случайно стал мемом Он заявил, что в его компании делается 4500 PR ежедневно, из них 73% – с помощью агентов. Пользователи в комментариях не поняли, откуда взялись такие огромные цифры:
«Это они добавляют каждую новую песню в git или что-то в таком роде?» «Наглядное пособие по созданию ИИ-пузыря» «Зачем? Последняя новая фича в Spotify появлялась 15 лет назад»
Главное, что KPI по токенмаксингу выполнили

В будущем не будет продактов, инженеров и дизайнеров: создатель Claude Code Борис Черный сказал, что нас ждет всего 5 архетип
+1
В будущем не будет продактов, инженеров и дизайнеров: создатель Claude Code Борис Черный сказал, что нас ждет всего 5 архетипов
1. Prototyper: генератор множества идей, только некоторые из которых будут реализованы. 2. Builder: быстро превращает прототипы и идеи в продукт. 3. Sweeper: чистит UX, упрощает код, оптимизирует систему. 4. Grower: берет продукт и итеративно улучшает его с точки зрения Product-Market Fit. 5. Maintainer: владеет зрелой системой и следит за ее безопасностью, надежностью и эффективностью.
При этом эти архетипы не будут зависеть от домена или специфического стека, как большинство современных ролей, и один человек сможет объединять в себе до трех статусов. В новой системе не нашлось места только эйчарам 🤷‍♂️

Новый дроп в опенсорс от Сбера: выложили токенизатор KVAE-Audio Фундаментально эта модель решает давнюю проблему обучения диф
+2
Новый дроп в опенсорс от Сбера: выложили токенизатор KVAE-Audio Фундаментально эта модель решает давнюю проблему обучения диффузионных систем. Им требуется максимально качественное сжатое представление данных, от которого напрямую зависит верхний предел возможностей создания нового контента. Разработчики закрыли эту потребность, представив третью часть семейства KVAE. Ранее команда уже публиковала схожие алгоритмы для работы с видео и картинками, а теперь очередь дошла до аудио формата. Система способна переваривать треки на частоте 48 кГц, охватывая весь спектр человеческого слуха. Во время обработки алгоритм уплотняет временную шкалу в 960 раз. На выходе получается сверхкомпактное пространство, состоящее из 64 каналов. Такие скромные размерности сильно упрощают жизнь при тренировке генеративных архитектур. Главный инженерный вызов здесь заключался в адаптации выходных данных именно под диффузию. Классические подходы часто показывают отличные цифры при воссоздании исходного аудио, но плохо справляются с созданием оригинального материала. Чтобы сбалансировать результаты в обеих задачах, авторы применили уникальный метод регуляризации. Если посмотреть на бенчмарки, новинка уверенно обходит MMAudio от Sony абсолютно по всем фронтам. При сравнении с DACVAE от Meta и SAME-L от Stability AI разработка выигрывает в качестве генерации и держит паритет в реконструкции, при этом обладая значительно меньшим весом. Код и веса под свободной лицензией MIT уже лежат на GitHub и Hugging Face. Habr

Чтение мыслей 2.0 от Meta*: компания выпустила Brain2Qwerty v2 В компании сделали модель, которая может с большой точностью восстанавливать текст, который человек молча печатает на клавиатуре. И, кажется, они впервые доказали, что неинвазивные методы могут приближаться к качеству, которое раньше считалось достижимым только после операции на мозге аля Neuralink. Итак, Brain2Qwerty v2: – Система основана на Brain2Qwerty v1. Но, в отличие от первой версии, v2 восстанавливает текст без знания момента каждого нажатия клавиши. Она получает непрерывный поток мозговой активности и сразу генерирует предложение целиком. – Внутри задача разбита на три уровня: есть энкодер, который преобразовывает сырые сигналы MEG в отдельные символы. Дальше эту последовательность обрабатывает Aligner: он пытается понять, где начинаются и заканчиваются слова и строит их эмбеддинги. Далее эти эмбеддинги вместе с исходными сигналами отправляются в LLM, и она уже правит все в конечный вид. – Выглядит это все как огромная установка стоимостью в миллионы долларов. Точность относительно предыдущих методов, можно сказать, зашкаливает. Заявляется 61% word accuracy в среднем (около 70% на лучших участниках). При этом система может допускать больше символьных ошибок, чем первая версия, потому что не знает времени нажатия клавиш, но смысл оказывается намного ближе к оригиналу. И да, это все еще слишком низкая точность для массового применения. НО (и это самое интересное!) исследователи открыли почти идеальный scaling law. Качество продолжает улучшаться почти логарифмически с увеличением объема данных, и насыщения пока не видно. Так что возможно все, что нужно для очень точного неинвазивного чтения мыслей – это больше данных. В удивительное время живем. facebookresearch.github.io/brain2qwerty/

Дарио Амодеи заявил, что опенсорс в ИИ – это «отвлекающий маневр» Он сказал, что на самом деле это не тот опенсорс, к которому мы привыкли:
«Вы не можете видеть внутренности модели, и основные плюсы опенсорса вроде коллективной доработки работают с сфере ИИ иначе»
Основной аргумент:
«В итоге вам все равно придется хостить ее в облаке»
В довершении CEO Anthropic заявил, что для конкуренции важнее способности модели и ее эффективность на инференсе, а не «ярлык» опенсорса и лицензия. Мнения? 😐

GitVerse × GigaCode: ваш персональный ИИ-напарник Запустили ранний доступ к ИИ-чату внутри GitVerse. Чат — часть GigaCode, аг
GitVerse × GigaCode: ваш персональный ИИ-напарник Запустили ранний доступ к ИИ-чату внутри GitVerse. Чат — часть GigaCode, агентного ИИ-ассистента, который умеет самостоятельно работать с файлами, анализировать кодовую базу и генерировать тесты. Как чат упрощает жизнь: · Разбор ошибок. Кидаете запрос — он изучает логи и объясняет, что пошло не так. · Навигация по платформе. Мгновенно находит нужные инструкции и подсказывает, как всё работает. · Помощь с кодом. Объяснит незнакомый фрагмент и предложит решение. Запросить ранний доступ и протестировать

Правительство США дропнуло новый бенчмарк для LLM ⚡️
Правительство США дропнуло новый бенчмарк для LLM ⚡️

Новый дроп от DeepSeek: выложили полностью открытый стек для ускорения генерации LLM Внутри готовые алгоритмы, обучение, эвал
Новый дроп от DeepSeek: выложили полностью открытый стек для ускорения генерации LLM Внутри готовые алгоритмы, обучение, эвал и даже пайплайн для данных. Бери и пользуйся, супер практично. github.com/deepseek-ai/DeepSpec Основная соль – в алгоритме DSpark. Его DeepSeek уже использует для DeepSeek-V4 Flash и Pro в проде, и, по их данным, относительно старого бейзлайна скорость генерации для пользователя выросла примерно на 60–85%. Как устроен алгоритм: – Фундаментально, это небольшая модель, которая пишет черновики для основной LLM. Это называется драфт-модель. – Такой подход сейчас в моде (Google, например, делают такое для Gemma: t.me/data_secrets/9179), но DeepSeek выводят его на новый уровень. Их драфт-модель работает необычно, в два этапа. Сначала параллельно набрасывается блок токенов, а потом легкий марковский модуль уточняет зависимости между соседними токенами. Благодаря такому подходу драфтер и работает быстро, и не очень сыпится в хвостах. – После того, как драфтер накидал черновик, основная LLM его проверяет и принимает только прафильный префикс, корректируя остальное. При этом DSpark сам решает, сколько токенов отправить на проверку, основываясь на оценках уверенности по токенам и текущей нагрузке на железо. В результате получаем ускорение минимум в 1.5 раза абсолютно без потери качества. Снимаем шляпу перед DeepSeek за такой опенсорс.

Обновление по Fable и Mythos: С 12 июня мы тесно сотрудничаем с правительством США, чтобы восстановить доступ к Claude Mythos
Обновление по Fable и Mythos:
С 12 июня мы тесно сотрудничаем с правительством США, чтобы восстановить доступ к Claude Mythos 5 и Fable 5. Сегодня правительство уведомило нас, что мы можем повторно развернуть Mythos 5 для некоторых организаций США, которые управляют и защищают критическую инфраструктуру. Мы быстро восстанавливаем доступ для этих организаций, и мы продолжаем работать с правительством, чтобы расширить доступ к Mythos 5 и снова сделать Fable 5 доступным для общего использования.
Честно говоря, пока не слишком обнадеживающе

Итак, встречайте: GPT-5.6 https://openai.com/index/previewing-gpt-5-6-sol/ Анонсировали три модели, в честь солнечной системы
+2
Итак, встречайте: GPT-5.6 https://openai.com/index/previewing-gpt-5-6-sol/ Анонсировали три модели, в честь солнечной системы (с самооценкой у создателей все ок): 1. Sol – самая крупная и крутая. На многих бенчмарках обходит Mythos, и при этом дешевле в два раза. При этом авторы пишут, что модель использует в три раза меньше токенов. В целом экономия в 5-6 раз (ну типа). 2. Terra – промежуточный вариант. Уже в три раза дешевле Mythos, уверенно обходит Opus 4.8. 3. Luna – самый дешевая и быстрая, но по результатам все еще хороша. Бенчмарков показали маловато, так что на другие замеры еще посмотрим. Общий доступ обещают в ближайшие недели, пока что модели вышли только для ограниченной группы тестеров. Хоть бы не повторилась история с Fable 🙏

Оранжевый – доля API американских моделей в OpenRouter Серый – доля китайских Сверху разбиение в июне 2025, снизу – в июне 20
Оранжевый – доля API американских моделей в OpenRouter Серый – доля китайских Сверху разбиение в июне 2025, снизу – в июне 2026 И кто тут теперь техно-лидер? ⌨️ * из статьи Bloomberg

Они добрались до OpenAI: правительство США будет одобрять доступ к GPT-5.6 «клиент за клиентом» Администрация Трампа связалас
Они добрались до OpenAI: правительство США будет одобрять доступ к GPT-5.6 «клиент за клиентом» Администрация Трампа связалась с Альтманом и «попросила» его не выпускать модель без одобрения. Конечно же, «по соображениям безопасности». Так что модель сначала выйдет в ограниченном preview, и только когда-нибудь потом (возмооожно) станет возможно простым смертным: во время периода превью чиновники будут «одобрять доступ клиент за клиентом» (цитата Сэма). Лицензирование де-факто

😳
😳