Data Secrets
前往频道在 Telegram
Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN
显示更多📈 Telegram 频道 Data Secrets 的分析概览
频道 Data Secrets (@data_secrets) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 90 893 名订阅者,在 技术与应用 类别中位列第 1 401,并在 俄罗斯 地区排名第 6 182 位。
📊 受众指标与增长动态
自 невідомо 创建以来,项目保持高速增长,吸引了 90 893 名订阅者。
根据 01 七月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 628,过去 24 小时变化为 36,整体触达仍然可观。
- 认证状态: 已认证(Telegram 官方确认)
- 互动率 (ER): 平均受众互动率为 26.37%。内容发布后 24 小时内通常能获得 19.13% 的反应,占订阅者总量。
- 帖子覆盖: 每篇帖子平均可获得 23 954 次浏览,首日通常累积 17 375 次浏览。
- 互动与反馈: 受众积极参与,单帖平均反应数为 318。
- 主题关注点: 内容集中在 claude, openai, контекст, стартап, llm 等核心主题上。
📝 描述与内容策略
作者将该频道定位为表达主观观点的平台:
“Главный по машинному обучению
Сотрудничество: @veron_28
РКН: clck.ru/3FY3GN”
凭借高频更新(最新数据采集于 02 七月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。
90 893
订阅者
+3624 小时
+1667 天
+62830 天
帖子存档
90 893
Nvidia выложили в опенсорс универсальный Deep Research, который можно обернуть вокруг любой LLM
Он так и называется: Universal Deep Research (UDR). Фактически, это готовый конструктор для построения системы поиска или анализа.
Пользователь просто задает стратегию работы на уровне сценариев: правила сбора и анализа данных, последовательность действий, критерии отбора источников и формат результата. А дальше агент все делает сам: ищет источники, обрабатывает их, верифицирует и синтезирует. Движок под капотом может быть абсолютно любой, то есть модель можно взять какую угодно.
Почему это круто? Тут все просто: демократизация. Нет привязки к конкретной платформе и обертку можно делать даже над чайником.
Почему это не панацея? Тут не предполагается никакого рода файнтюнинг. А значит, итоговые метрики могут страдать, даже если в основе у вас отличная базовая модель. Поэтому – доверяем, но всегда проверяем.
Статья | Страница проекта | Гитхаб | Лаб
90 893
Облачный и AI-провайдер Cloud.ru на конференции GoCloud Tech удивил всех сразу несколькими крутыми обновлениями. Делимся:
Первое и самое важное: объявление цен на открытые LLM! С 1 ноября на платформе Evolution AI Factory языковые модели будут стоить в среднем 35 рублей за миллион входных токенов и 70 рублей за выходной. Это почти мировая планка, так что теперь пробовать и внедрять AI смогут не только корпорации, но и компании поменьше. Например, цена на Qwen3-235B – 17 и 50 рублей соответственно.
Второе: появились первые результаты работы AI-помощника Клаудии на платформе Cloud.ru Evolution, которого представили в конце июня. Два месяца работы, и статистика говорит, что в среднем агент ускоряет рутинные операции DevOps-инженеров в 15 раз. Например, если раньше создание виртуалки занимало у пользователей от пяти до тридцати минут, то с Клаудией время сократилось до одной-двух. Агентом активно пользуется каждый четвертый юзер сервиса.
И видимо, классные метрики вдохновили компанию на обновления, потому что теперь помощник будет работать еще в двух новых сценариях:
– Как SRE-агент для мониторинга и алертов.
– Как FinOps-помощник, который автоматически выявляет лишние траты и подсказывает оптимизацию. Приятно.
Ну и еще несколько инженерных обновлений, которые стоит оценить:
1. Ребята расширили возможности сервиса для создания и управления сетевыми связями Magic Router. Теперь в нем появился Magic Link, которая организует сетевую связность между облачными ресурсами под использования интернета.
2. Релизнули Evolution VPN – облачный сервис, который даёт защищённый доступ к корпоративным и облачным ресурсам.
3. Evolution Data Platform наконец-то вышла из превью и теперь в коммерции. Система поддерживает полный цикл работы с данными и может срезать до 40% затрат на инфраструктуру.
Все новинки тестируем тут
90 893
OpenAI открывают направление OpenAI for Science
Об этом сообщил CTO стартапа Кевин Вейл. Цель: создать научный инструмент, который сможет ускорять научные открытия. Специально под направление OpenAI нанимает небольшую группу ученых мирового уровня из разных областей (имена пока не раскрывают).
Альтман и остальные руководители стартапа уже кучу раз говорили о том, что их ИИ будет катализировать прогресс, и вот, видимо, момент заняться этим всерьез настал. Какие-то предпосылки уже есть – вспоминаем недавние новости:
– Буквально пару недель назад OpenAI совместно с биотехнологическим стартапом Retro Biosciences разработали модель, которая смогла в 50 раз ускорить генерацию стволовых клеток (подробности)
– В другой раз GPT-5 решила открытую математическую задачу (подробности)
– Сам Кевин в своем анонсе еще приводит в пример случай, когда ученые использовали GPT-5 для доказательства некоторых теорем по квантовой теории поля (статья)
В общем, подразделение появляется вполне своевременно. На доказательство Теории струн не надеемся, но к чему-то полезному прийти, вполне вероятно, можно. К тому же, они в своей инициативе не первые: Google вон уже 10+ лет занимаются моделями Alpha серии, и идея там вполне близкая к тому, что будет происходить в OpenAI for Science.
90 893
На ARC-AGI-2 новый лидер: это модель всего на 200M параметров от стартапа giotto_ai
Малышка выбила аж 24,58%. Для сравнения:
– Скор предыдущего лидера – 16.94%
– Скор o3 – около 3%
– Скор o4-mini – 2–2.4%
– Скор Gemini 2.5 Pro – примерно 1%
Соревнование на kaggle пока не закончилось, так что архитектуру и детали обучения, естественно, не раскрывают. Но результат потрясающий.
90 893
Начинаем утро с хороших новостей: Google Colab снизили цены на GPU и TPU
– GPU подешевели на 13% (A100, L4, T4)
– TPU на 10% (V28, V5E1, V6E1)
A100 теперь будет стоить около $1.03 за час вместо $1.18. T4 – примерно $0.16 вместо $0.18. Напоминаем, что ценообразование у Colab динамическое, так что числа примерные.
А, и маленький нюанс: цены на CPU подняли (😄). Говорят, чтобы «компенсировать снижение стоимости ускорителей».
90 893
+2
Очень понравилась свежая статья "Be like a Goldfish, Don't Memorize!": исследователи из университета Мэриленда предлагают аналог дропаута для токенов
Проблема рассматривается следующая. LLM часто запоминают части тренировочного датасета и могут воспроизводить их дословно. И это приводит к ряду очень неприятных последствий: сюда все иски за авторские права, утечки конфиденциальных данных и лицензированного кода и прочее.
В общем, загвоздка достаточно значимая, и решать ее пытаются в основном через unlearning после обучения или Differential Privacy. И то и другое приводит к понижению точности и в целом не очень надежно работает.
Здесь авторы предлагают более фундаментальный подход. Интуиция: модель не сможет воспроизвести дословно последовательность, если часть токенов никогда не участвовала в вычислении ошибки.
А значит, мы можем случайным образом исключать часть токенов из лосс-функции на обратном проходе. Это и не очень сильно портит метрики, потому что общие закономерности языка модель все-равно выучивает, и на 100% исключает возможность дословного повторения текстов.
Формально процесс обучения остается ровно таким же, меняется только лосс. В него добавляется коэффициент G_i, который равен единице, если токен учитывается в бэкпропе, и нулю – если нет. Формулу шутливо назвали Goldfish Loss: по аналогии с рыбкой, которая тут же забывает то, что увидела секунду назад.
В итоге если при стандартном лоссе процент точных повторений выученных текстов – примерно 85%, то на Goldfish Loss – 0. И по качеству просаживается не сильно, нужно просто либо чуть больше данных, либо чуть больше шагов. Плюс, применять на всем датасете не обязательно, можно использовать только для чувствительных данных.
Изящно, скажите?
arxiv.org/pdf/2406.10209
90 893
🔥 Вчера организаторы «Лето с AIRI 2025» выложили плейлист со всеми выступлениями спикеров.
Напомним: AIRI провёл летнюю школу для студентов и молодых исследователей в области ИИ в Томске. Вчера организаторы выложили плейлист со всеми лекциями. Темы охватывают всё, что сегодня волнует сообщество:
– LLM-агенты и мультиагентные системы
– Обучение с подкреплением
– Мультимодальные модели и VLM
– Интерпретируемость и безопасность
– Химия и биология с ИИ
– Генеративный дизайн и проектирование
и многое другое.
Это десятки часов контента от исследователей AIRI, МФТИ, МГУ, Сбера, Авито и других компаний 🔍
👉 Смотреть можно здесь: VK, YouTube
90 893
Хах, оказывается услугами стартапа Statsig, который только что купил OpenAI, активно пользовались еще и Anthropic
Причем сообщили они об этом буквально за пару дней до сделки
Совпадение? 🤔
90 893
В CERN ИИ помогает найти крайне редкие виды распада бозона Хиггса
В эфире наша любимая рубрика: ускорение прогресса с помощью Deep Learning. На очереди снова физика.
Контекст. В науке существует так называемая Стандартная модель – это теория, объясняющая, из каких элементарных частиц состоит вся материя и какие силы между ними действуют. По этой модели, частицы получают массу благодаря бозону Хиггса. Но чтобы подтвердить это, нужны распады Хиггса на лёгкие кварки: если Хиггс на самом деле отвечает за массы всей обычной материи, такие распады должны происходить (пусть и очень редко), так что это что-то типа лакмусовой бумажки.
Сложность в том, что эти распады утопают в шумах. Раньше физики считали, что поймать их – почти фантастика: технически всё слишком тонко.
И вот сегодня стало известно, что исследователи детектора CMS на Большом адронном коллайдере впервые представили результаты поиска распада бозона на пару очарованных кварков. И сделали это с помощью ИИ.
Сразу скажем: сам распад пока не обнаружен. Но прорыв все равно колоссальный: точность анализа удалось улучшить на 35%.
Под капотом графовая нейронная сеть и трансформер. GNN позволяет анализировать взаимосвязи между наблюдаемыми частицами в каждом событии ускорителя, а трансформер выделяет те самые едва уловимые паттерны, отличающие истинный сигнал от шума. Сетки обучали на на сотнях миллионов смоделированных столкновений (они называются джеты).
Ну и да, 35% – действительно гигантский шаг. На практике это означает, что доказательство распада Хиггса на лёгкие кварки может быть обнаружено уже в ближайщие годы, когда еще пару лет назад это считалось почти невыполнимой задачей.
90 893
📌Приглашаем вас на три бесплатных вебинара курса «MLOps»
💎Вебинар №1: «MLFlow - контроль над ML-экспериментами»
⏰ 4 сентября в 20:00 мск
🔹На вебинаре:
• Узнаете как проводить ML эксперименты и главное как их контролировать;
• Поймете что такое MLFlow и какие компоненты он содержит;
• Разберём основные возможности MLFlow: трекинг экспериментов, управление моделями и воспроизводимость;
• Проведём живую демонстрацию, где шаг за шагом внедрим MLFlow в ML-проект.
💎Вебинар №2: «Вывод ML моделей в промышленную среду на примере онлайн-скоринга»
⏰ 11 сентября в 20:00 мск
🔹На вебинаре:
• Направления развития в DataScience
• Построение модели машинного обучения на примере скоринга
• Интеграция модели в промышленную среду на примере API на Flas
💎Вебинар №3: «Serverless подход в MLOps для небольших ML-проектов»
⏰ 18 сентября в 18:00 мск
🔹На вебинаре:
• Преимущества serverless подхода для развертывания ML-моделей и когда его стоит использовать.
• Развертывание ML-модели с помощью Yandex Cloud: Object Storage и Cloud Functions.
• Создание и тестирование API для инференса модели.
🎁Участники вебинаров получат подарки на почту🎁
Регистрация на вебинары ➡️ OTUS.RU
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576
90 893
OpenAI купила стартап Statsig
Сделка обошлась в 1.1 миллиард долларов (сущие копейки для OpenAI ✨ ).
Statsig – это платформа для продуктовой аналитики и экспериментов, её технологии нужны OpenAI для ускорения разработки и тестирования новых продуктов. Но они купили не только технологию.
Сделка значится как «all-stock deal», то есть все сотрудники стартапа также перейдут в OpenAI. А CEO – Виджай Раджи – станет новым CTO of Applications в OpenAI. В этой роли он будет отвечать за инфраструктуру и надежность всех пользовательских продуктов, включая ChatGPT и Codex.
90 893
Не могли не запостить сюда этот отрывок из нового интервью Альтмана
– Приведи пример случая, когда тебе пришлось сделать выбор в пользу того, что будет лучше для мира, а не для лидерства компании – Ну, мы еще не добавили секс-аватара в ChatGPTНазовите противостояние прекраснее, чем у Альтмана с Маском. Мы подождем.
90 893
Anthropic привлекли 13 миллиардов долларов при оценке в 183 миллиарда
На секундочку, еще в марте этого года они стоили всего 62 миллиарда. Это рост на 300% за пол года.
А run-rate revenue с начала года вырос уже в 5 раз: $5 млрд сейчас против $1 млрд в январе. Спасибо Claude Code и API (сейчас в стартапе 70–75% выручки дают API-платежи по токенам, только 10–15% – подписки) ✌️
Такая оценка делает Anthropic четвертым по стоимости стартапом в мире и одной из самых дорогих AI-компаний после OpenAI и xAI.
Раунд возглавили Iconiq, Fidelity и Lightspeed. Для Anthropic это уже серия F, то есть шестой или седьмой по счету раунд.
www.anthropic.com/news/anthropic-raises-series-f-at-usd183b-post-money-valuation
90 893
12 сентября мы идем на big tech night в Москве. Зовем и вас! 🤓
big tech night — это большое событие для IT-специалистов, которое одновременно пройдет сразу в 5 офисах бигтехов. Инициативу придумал Яндекс, а Сбер, X5, Т-Банк и Lamoda присоединились и поддержали.
Будет возможность заглянуть за кулисы бигтеха, посмотреть, как отличается культура в разных компаниях и послушать доклады от тех, кто решает нетривиальные задачи каждый день. А еще — это шанс пообщаться с единомышленниками, сравнить подходы в разработке и задать давно наболевшие вопросы. Ну, и просто отдохнуть: активностей для перезагрузки будет достаточно.
Программу смотрите на сайте: там три трека по степени хардовости (доклады про железки, выступления по прокачке софтов и фестивальные активности). Нам приглянулись вот эти темы:
– Ре(Э)волюция инструментов разработки в эпоху AI: в мире и Яндексе
– GPT-функции в Алисе: backstage
– Как быть AI-инженером
– Архитектура производительных и отказоустойчивых мультиагентных систем
– Роадмап разработчика 2.0: как адаптироваться к новой реальности ИИ
Еще будет много фестивальных активностей. Например:
– Яндекс организует IT-стендап и Open Source Space, где можно пообщаться с любителями опенсорса и сделать коммит в проект
– У X5 будет кодинг-челлендж
– У T-Банка – иммерсивная экскурсия
Если не сможете присутствовать — для вас будет отдельная онлайн-студия. Там даже проведут эксклюзивные интервью с экспертами: про рекомендашки и автономных роботов-курьеров.
Не пропускаем и регистрируемся здесь.
90 893
Microsoft очнулись и представили MAI-1-Preview – свою первую полностью самостоятельную модель
Видимо, до компании окончательно дошло, что OpenAI так или иначе их кинет, и они наконец-то решили действовать сами.
Обучали примерно на 15к H100, это сопоставимо с большинством ведущих моделей. Архитектура MoE. Вроде бы без ризонинга.
Публичных бенчмарков пока нет, но на LMArena модель заняла 15 место рядом с Qwen3-325b-thinking и o1-2024-12-17 (смотрим, и не осуждаем, все-таки у ребят первый опыт 😁). Попробовать пока нигде нельзя, кроме той же LMArena.
В перспективе модель должна интегрироваться в продукты Microsoft Copilot, постепенно вытесняя решения OpenAI.
В довесок еще выпустили MAI-Voice-1 – речевую Text-to-Speech модель. Вот ее потрогать уже можно здесь. Заявляют, что за секунду можно сгенерировать до минуты звучания на одной GPU.
microsoft.ai/news/two-new-in-house-models/
90 893
Repost from Navio
Оффер за один день в Navio
One Day Offer — уникальное онлайн-мероприятие, где можно пройти все технические этапы и получить оффер всего за один день.
Кого ищем:
Deep Learning Engineer c опытом разработки сложных нейросетевых решений для production-задач от 3 лет и умением писать качественный код на Python.
Процесс:
Оставьте заявку до 10.09 — получите приглашение до 11.09 — приходите на мероприятие 13.09!
Что нужно делать:
- Разрабатывать и обучать Vision-Language Models (VLM) для задач автономного вождения.
- Создавать и оптимизировать модели представления 3D-сцен, таких, как NeRF и Gaussian Splatting.
- Обучать нейронные сети для задач распознавания объектов на автомобилях-автоматах.
- Анализировать, выдвигать гипотезы, работать с данными и архитектурой моделей и многое другое.
Условия:
- Ежедневная компенсация питания.
- ДМС с первого дня. Стоматология — после испытательного срока.
- Курсы и другие формы внешнего обучение для роста компетенций.
- Подписка на медиасервисы и широкий список дисконт-программ от партнеров.
- Субсидия на ипотеку и продукты банка-партнера на выгодных условиях.
Регистрация и отклик по ссылке: https://vk.cc/cP8LFm?erid=2W5zFH4oUSk
90 893
Если вы думали, что ИИ дешевеет, то передумайте. Оказывается, сейчас он дороже, чем когда-либо
Аналитику подвели WSJ. Тут парадокс Джевонса в действии: рост эффективности использования ресурса ведет не к уменьшению, а к увеличению его потребления. То есть:
➖ Да, цена на токен падает. Но чем дешевле становятся базовые вычисления, тем больше компании могут позволить себе использовать их для решения бОльшего количества сложных задач. Таким образом, цены падают, а косты – растут 😏
➖ Плюс использование токенов возрастает за счет использования ризонинг-моделей. Они все еще дают ощутимые приросты на большинстве задач, так что компании готовы переплачивать.
Ну, например, условный анализ юридических контрактов с точностью 99% оправданно стоит гораздо больше, чем такой же анализ с точностью 90%. И эти +9% – это в десятки раз больше токенов за счет ризонинга.
Когда мы начнем выходить на плато по большинству корпоративных задач, оптимизация уже сделает свое дело. Но пока – вот так.
➖ Ну и железо, конечно. Переплачивать приходится не только за дополнительные токены, но и за новые и новые сервера.
А ведет это все – к консолидации, к сожалению. Но это уже другая история.
Разбор полностью можно почитать тут
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
