Data Secrets

Открыть в Telegram

Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN

Больше

Сеть:AI Insider Россия6 182 Технологии и приложения1 401...

📈 Аналитический обзор Telegram-канала Data Secrets

Канал Data Secrets (@data_secrets) языкового сегмента Русский является активным участником. Сейчас сообщество объединяет 90 893 подписчиков, занимая 1 401 место в категории Технологии и приложения и 6 182 место в регионе Россия.

📊 Показатели аудитории и динамика

С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 90 893 подписчиков.

Согласно последним данным от 01 июля, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило 628, а за последние 24 часа — 36, при этом общий охват остаётся высоким.

Статус верификации: Верифицирован (официально подтверждён Telegram)
Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 26.37%. В первые 24 часа после публикации контент обычно набирает 19.13% реакций от общего числа подписчиков.
Охват публикаций: В среднем каждый пост получает 23 954 просмотров. В течение первых суток публикация набирает 17 375 просмотров.
Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 318.
Тематические интересы: Контент сосредоточен на ключевых темах, таких как claude, openai, контекст, стартап, llm.

📝 Описание и контентная политика

Автор описывает ресурс как площадку для выражения субъективного мнения:
“Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN”

Благодаря высокой частоте обновлений (последние данные получены 02 июля, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.

90 893

Подписчики

+3624 часа

+1667 дней

+62830 день

23 954

Просмотры поста

~ 17 37524 часа

~ 19 14248 часов

26.37%

Коэффициент вовлеченности

~ 4

Постов в день

Ads index

beta

Архив постов

90 893

Nvidia выложили в опенсорс универсальный Deep Research, который можно обернуть вокруг любой LLM Он так и называется: Universal Deep Research (UDR). Фактически, это готовый конструктор для построения системы поиска или анализа. Пользователь просто задает стратегию работы на уровне сценариев: правила сбора и анализа данных, последовательность действий, критерии отбора источников и формат результата. А дальше агент все делает сам: ищет источники, обрабатывает их, верифицирует и синтезирует. Движок под капотом может быть абсолютно любой, то есть модель можно взять какую угодно. Почему это круто? Тут все просто: демократизация. Нет привязки к конкретной платформе и обертку можно делать даже над чайником. Почему это не панацея? Тут не предполагается никакого рода файнтюнинг. А значит, итоговые метрики могут страдать, даже если в основе у вас отличная базовая модель. Поэтому – доверяем, но всегда проверяем. Статья | Страница проекта | Гитхаб | Лаб

90 893

Облачный и AI-провайдер Cloud.ru на конференции GoCloud Tech удивил всех сразу несколькими крутыми обновлениями. Делимся: Первое и самое важное: объявление цен на открытые LLM! С 1 ноября на платформе Evolution AI Factory языковые модели будут стоить в среднем 35 рублей за миллион входных токенов и 70 рублей за выходной. Это почти мировая планка, так что теперь пробовать и внедрять AI смогут не только корпорации, но и компании поменьше. Например, цена на Qwen3-235B – 17 и 50 рублей соответственно. Второе: появились первые результаты работы AI-помощника Клаудии на платформе Cloud.ru Evolution, которого представили в конце июня. Два месяца работы, и статистика говорит, что в среднем агент ускоряет рутинные операции DevOps-инженеров в 15 раз. Например, если раньше создание виртуалки занимало у пользователей от пяти до тридцати минут, то с Клаудией время сократилось до одной-двух. Агентом активно пользуется каждый четвертый юзер сервиса. И видимо, классные метрики вдохновили компанию на обновления, потому что теперь помощник будет работать еще в двух новых сценариях: – Как SRE-агент для мониторинга и алертов. – Как FinOps-помощник, который автоматически выявляет лишние траты и подсказывает оптимизацию. Приятно. Ну и еще несколько инженерных обновлений, которые стоит оценить: 1. Ребята расширили возможности сервиса для создания и управления сетевыми связями Magic Router. Теперь в нем появился Magic Link, которая организует сетевую связность между облачными ресурсами под использования интернета. 2. Релизнули Evolution VPN – облачный сервис, который даёт защищённый доступ к корпоративным и облачным ресурсам. 3. Evolution Data Platform наконец-то вышла из превью и теперь в коммерции. Система поддерживает полный цикл работы с данными и может срезать до 40% затрат на инфраструктуру. Все новинки тестируем тут

90 893

OpenAI открывают направление OpenAI for Science Об этом сообщил CTO стартапа Кевин Вейл. Цель: создать научный инструмент, который сможет ускорять научные открытия. Специально под направление OpenAI нанимает небольшую группу ученых мирового уровня из разных областей (имена пока не раскрывают). Альтман и остальные руководители стартапа уже кучу раз говорили о том, что их ИИ будет катализировать прогресс, и вот, видимо, момент заняться этим всерьез настал. Какие-то предпосылки уже есть – вспоминаем недавние новости: – Буквально пару недель назад OpenAI совместно с биотехнологическим стартапом Retro Biosciences разработали модель, которая смогла в 50 раз ускорить генерацию стволовых клеток (подробности) – В другой раз GPT-5 решила открытую математическую задачу (подробности) – Сам Кевин в своем анонсе еще приводит в пример случай, когда ученые использовали GPT-5 для доказательства некоторых теорем по квантовой теории поля (статья) В общем, подразделение появляется вполне своевременно. На доказательство Теории струн не надеемся, но к чему-то полезному прийти, вполне вероятно, можно. К тому же, они в своей инициативе не первые: Google вон уже 10+ лет занимаются моделями Alpha серии, и идея там вполне близкая к тому, что будет происходить в OpenAI for Science.

90 893

На ARC-AGI-2 новый лидер: это модель всего на 200M параметров от стартапа giotto_ai Малышка выбила аж 24,58%. Для сравнения: – Скор предыдущего лидера – 16.94% – Скор o3 – около 3% – Скор o4-mini – 2–2.4% – Скор Gemini 2.5 Pro – примерно 1% Соревнование на kaggle пока не закончилось, так что архитектуру и детали обучения, естественно, не раскрывают. Но результат потрясающий.

90 893

Начинаем утро с хороших новостей: Google Colab снизили цены на GPU и TPU – GPU подешевели на 13% (A100, L4, T4) – TPU на 10% (V28, V5E1, V6E1) A100 теперь будет стоить около $1.03 за час вместо $1.18. T4 – примерно $0.16 вместо $0.18. Напоминаем, что ценообразование у Colab динамическое, так что числа примерные. А, и маленький нюанс: цены на CPU подняли (😄). Говорят, чтобы «компенсировать снижение стоимости ускорителей».

90 893

Очень понравилась свежая статья "Be like a Goldfish, Don't Memorize!": исследователи из университета Мэриленда предлагают аналог дропаута для токенов Проблема рассматривается следующая. LLM часто запоминают части тренировочного датасета и могут воспроизводить их дословно. И это приводит к ряду очень неприятных последствий: сюда все иски за авторские права, утечки конфиденциальных данных и лицензированного кода и прочее. В общем, загвоздка достаточно значимая, и решать ее пытаются в основном через unlearning после обучения или Differential Privacy. И то и другое приводит к понижению точности и в целом не очень надежно работает. Здесь авторы предлагают более фундаментальный подход. Интуиция: модель не сможет воспроизвести дословно последовательность, если часть токенов никогда не участвовала в вычислении ошибки. А значит, мы можем случайным образом исключать часть токенов из лосс-функции на обратном проходе. Это и не очень сильно портит метрики, потому что общие закономерности языка модель все-равно выучивает, и на 100% исключает возможность дословного повторения текстов. Формально процесс обучения остается ровно таким же, меняется только лосс. В него добавляется коэффициент G_i, который равен единице, если токен учитывается в бэкпропе, и нулю – если нет. Формулу шутливо назвали Goldfish Loss: по аналогии с рыбкой, которая тут же забывает то, что увидела секунду назад. В итоге если при стандартном лоссе процент точных повторений выученных текстов – примерно 85%, то на Goldfish Loss – 0. И по качеству просаживается не сильно, нужно просто либо чуть больше данных, либо чуть больше шагов. Плюс, применять на всем датасете не обязательно, можно использовать только для чувствительных данных. Изящно, скажите? arxiv.org/pdf/2406.10209

90 893

🔥 Вчера организаторы «Лето с AIRI 2025» выложили плейлист со всеми выступлениями спикеров. Напомним: AIRI провёл летнюю школу для студентов и молодых исследователей в области ИИ в Томске. Вчера организаторы выложили плейлист со всеми лекциями. Темы охватывают всё, что сегодня волнует сообщество: – LLM-агенты и мультиагентные системы – Обучение с подкреплением – Мультимодальные модели и VLM – Интерпретируемость и безопасность – Химия и биология с ИИ – Генеративный дизайн и проектирование и многое другое. Это десятки часов контента от исследователей AIRI, МФТИ, МГУ, Сбера, Авито и других компаний 🔍 👉 Смотреть можно здесь: VK, YouTube

90 893

Хах, оказывается услугами стартапа Statsig, который только что купил OpenAI, активно пользовались еще и Anthropic Причем сообщили они об этом буквально за пару дней до сделки Совпадение? 🤔

90 893

В CERN ИИ помогает найти крайне редкие виды распада бозона Хиггса В эфире наша любимая рубрика: ускорение прогресса с помощью Deep Learning. На очереди снова физика. Контекст. В науке существует так называемая Стандартная модель – это теория, объясняющая, из каких элементарных частиц состоит вся материя и какие силы между ними действуют. По этой модели, частицы получают массу благодаря бозону Хиггса. Но чтобы подтвердить это, нужны распады Хиггса на лёгкие кварки: если Хиггс на самом деле отвечает за массы всей обычной материи, такие распады должны происходить (пусть и очень редко), так что это что-то типа лакмусовой бумажки. Сложность в том, что эти распады утопают в шумах. Раньше физики считали, что поймать их – почти фантастика: технически всё слишком тонко. И вот сегодня стало известно, что исследователи детектора CMS на Большом адронном коллайдере впервые представили результаты поиска распада бозона на пару очарованных кварков. И сделали это с помощью ИИ. Сразу скажем: сам распад пока не обнаружен. Но прорыв все равно колоссальный: точность анализа удалось улучшить на 35%. Под капотом графовая нейронная сеть и трансформер. GNN позволяет анализировать взаимосвязи между наблюдаемыми частицами в каждом событии ускорителя, а трансформер выделяет те самые едва уловимые паттерны, отличающие истинный сигнал от шума. Сетки обучали на на сотнях миллионов смоделированных столкновений (они называются джеты). Ну и да, 35% – действительно гигантский шаг. На практике это означает, что доказательство распада Хиггса на лёгкие кварки может быть обнаружено уже в ближайщие годы, когда еще пару лет назад это считалось почти невыполнимой задачей.

90 893

Новый день – новая сохраненная статья, которую никто не будет читать

90 893

📌Приглашаем вас на три бесплатных вебинара курса «MLOps» 💎Вебинар №1: «MLFlow - контроль над ML-экспериментами» ⏰ 4 сентября в 20:00 мск 🔹На вебинаре: • Узнаете как проводить ML эксперименты и главное как их контролировать; • Поймете что такое MLFlow и какие компоненты он содержит; • Разберём основные возможности MLFlow: трекинг экспериментов, управление моделями и воспроизводимость; • Проведём живую демонстрацию, где шаг за шагом внедрим MLFlow в ML-проект. 💎Вебинар №2: «Вывод ML моделей в промышленную среду на примере онлайн-скоринга» ⏰ 11 сентября в 20:00 мск 🔹На вебинаре: • Направления развития в DataScience • Построение модели машинного обучения на примере скоринга • Интеграция модели в промышленную среду на примере API на Flas 💎Вебинар №3: «Serverless подход в MLOps для небольших ML-проектов» ⏰ 18 сентября в 18:00 мск 🔹На вебинаре: • Преимущества serverless подхода для развертывания ML-моделей и когда его стоит использовать. • Развертывание ML-модели с помощью Yandex Cloud: Object Storage и Cloud Functions. • Создание и тестирование API для инференса модели. 🎁Участники вебинаров получат подарки на почту🎁 Регистрация на вебинары ➡️ OTUS.RU Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576

90 893

OpenAI купила стартап Statsig Сделка обошлась в 1.1 миллиард долларов (сущие копейки для OpenAI ✨ ). Statsig – это платформа для продуктовой аналитики и экспериментов, её технологии нужны OpenAI для ускорения разработки и тестирования новых продуктов. Но они купили не только технологию. Сделка значится как «all-stock deal», то есть все сотрудники стартапа также перейдут в OpenAI. А CEO – Виджай Раджи – станет новым CTO of Applications в OpenAI. В этой роли он будет отвечать за инфраструктуру и надежность всех пользовательских продуктов, включая ChatGPT и Codex.

90 893

Не могли не запостить сюда этот отрывок из нового интервью Альтмана

– Приведи пример случая, когда тебе пришлось сделать выбор в пользу того, что будет лучше для мира, а не для лидерства компании – Ну, мы еще не добавили секс-аватара в ChatGPT

Назовите противостояние прекраснее, чем у Альтмана с Маском. Мы подождем.

90 893

Anthropic привлекли 13 миллиардов долларов при оценке в 183 миллиарда На секундочку, еще в марте этого года они стоили всего 62 миллиарда. Это рост на 300% за пол года. А run-rate revenue с начала года вырос уже в 5 раз: $5 млрд сейчас против $1 млрд в январе. Спасибо Claude Code и API (сейчас в стартапе 70–75% выручки дают API-платежи по токенам, только 10–15% – подписки) ✌️ Такая оценка делает Anthropic четвертым по стоимости стартапом в мире и одной из самых дорогих AI-компаний после OpenAI и xAI. Раунд возглавили Iconiq, Fidelity и Lightspeed. Для Anthropic это уже серия F, то есть шестой или седьмой по счету раунд. www.anthropic.com/news/anthropic-raises-series-f-at-usd183b-post-money-valuation

90 893

12 сентября мы идем на big tech night в Москве. Зовем и вас! 🤓 big tech night — это большое событие для IT-специалистов, которое одновременно пройдет сразу в 5 офисах бигтехов. Инициативу придумал Яндекс, а Сбер, X5, Т-Банк и Lamoda присоединились и поддержали. Будет возможность заглянуть за кулисы бигтеха, посмотреть, как отличается культура в разных компаниях и послушать доклады от тех, кто решает нетривиальные задачи каждый день. А еще — это шанс пообщаться с единомышленниками, сравнить подходы в разработке и задать давно наболевшие вопросы. Ну, и просто отдохнуть: активностей для перезагрузки будет достаточно. Программу смотрите на сайте: там три трека по степени хардовости (доклады про железки, выступления по прокачке софтов и фестивальные активности). Нам приглянулись вот эти темы: – Ре(Э)волюция инструментов разработки в эпоху AI: в мире и Яндексе – GPT-функции в Алисе: backstage – Как быть AI-инженером – Архитектура производительных и отказоустойчивых мультиагентных систем – Роадмап разработчика 2.0: как адаптироваться к новой реальности ИИ Еще будет много фестивальных активностей. Например: – Яндекс организует IT-стендап и Open Source Space, где можно пообщаться с любителями опенсорса и сделать коммит в проект – У X5 будет кодинг-челлендж – У T-Банка – иммерсивная экскурсия Если не сможете присутствовать — для вас будет отдельная онлайн-студия. Там даже проведут эксклюзивные интервью с экспертами: про рекомендашки и автономных роботов-курьеров. Не пропускаем и регистрируемся здесь.

90 893

Microsoft очнулись и представили MAI-1-Preview – свою первую полностью самостоятельную модель Видимо, до компании окончательно дошло, что OpenAI так или иначе их кинет, и они наконец-то решили действовать сами. Обучали примерно на 15к H100, это сопоставимо с большинством ведущих моделей. Архитектура MoE. Вроде бы без ризонинга. Публичных бенчмарков пока нет, но на LMArena модель заняла 15 место рядом с Qwen3-325b-thinking и o1-2024-12-17 (смотрим, и не осуждаем, все-таки у ребят первый опыт 😁). Попробовать пока нигде нельзя, кроме той же LMArena. В перспективе модель должна интегрироваться в продукты Microsoft Copilot, постепенно вытесняя решения OpenAI. В довесок еще выпустили MAI-Voice-1 – речевую Text-to-Speech модель. Вот ее потрогать уже можно здесь. Заявляют, что за секунду можно сгенерировать до минуты звучания на одной GPU. microsoft.ai/news/two-new-in-house-models/

90 893

О, уже и мемы соответствующие пошли

90 893

Repost from Navio

Оффер за один день в Navio One Day Offer — уникальное онлайн-мероприятие, где можно пройти все технические этапы и получить оффер всего за один день. Кого ищем: Deep Learning Engineer c опытом разработки сложных нейросетевых решений для production-задач от 3 лет и умением писать качественный код на Python. Процесс: Оставьте заявку до 10.09 — получите приглашение до 11.09 — приходите на мероприятие 13.09! Что нужно делать: - Разрабатывать и обучать Vision-Language Models (VLM) для задач автономного вождения. - Создавать и оптимизировать модели представления 3D-сцен, таких, как NeRF и Gaussian Splatting. - Обучать нейронные сети для задач распознавания объектов на автомобилях-автоматах. - Анализировать, выдвигать гипотезы, работать с данными и архитектурой моделей и многое другое. Условия: - Ежедневная компенсация питания. - ДМС с первого дня. Стоматология — после испытательного срока. - Курсы и другие формы внешнего обучение для роста компетенций. - Подписка на медиасервисы и широкий список дисконт-программ от партнеров. - Субсидия на ипотеку и продукты банка-партнера на выгодных условиях. Регистрация и отклик по ссылке: https://vk.cc/cP8LFm?erid=2W5zFH4oUSk

90 893

Если вы думали, что ИИ дешевеет, то передумайте. Оказывается, сейчас он дороже, чем когда-либо Аналитику подвели WSJ. Тут парадокс Джевонса в действии: рост эффективности использования ресурса ведет не к уменьшению, а к увеличению его потребления. То есть: ➖ Да, цена на токен падает. Но чем дешевле становятся базовые вычисления, тем больше компании могут позволить себе использовать их для решения бОльшего количества сложных задач. Таким образом, цены падают, а косты – растут 😏 ➖ Плюс использование токенов возрастает за счет использования ризонинг-моделей. Они все еще дают ощутимые приросты на большинстве задач, так что компании готовы переплачивать. Ну, например, условный анализ юридических контрактов с точностью 99% оправданно стоит гораздо больше, чем такой же анализ с точностью 90%. И эти +9% – это в десятки раз больше токенов за счет ризонинга. Когда мы начнем выходить на плато по большинству корпоративных задач, оптимизация уже сделает свое дело. Но пока – вот так. ➖ Ну и железо, конечно. Переплачивать приходится не только за дополнительные токены, но и за новые и новые сервера. А ведет это все – к консолидации, к сожалению. Но это уже другая история. Разбор полностью можно почитать тут

90 893

Наконец-то исследования, которые мы заслужили P.S. Не мем, ссылка на статью вот