Data Secrets

رفتن به کانال در Telegram

Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN

نمایش بیشتر

شبکه:AI Insider روسيا6 182 فناوری و برنامه‌ها1 401...

📈 تحلیل کانال تلگرام Data Secrets

کانال Data Secrets (@data_secrets) در بخش زبانی روسی بازیگری فعال است. در حال حاضر جامعه شامل 90 893 مشترک است و جایگاه 1 401 را در دسته فناوری و برنامه‌ها و رتبه 6 182 را در منطقه روسيا دارد.

📊 شاخص‌های مخاطب و پویایی

از زمان ایجاد در невідомо، پروژه رشد سریعی داشته و 90 893 مشترک جذب کرده است.

بر اساس آخرین داده‌ها در تاریخ 01 ژوئیه, 2026، کانال فعالیت پایداری دارد. در ۳۰ روز گذشته تغییر اعضا برابر 628 و در ۲۴ ساعت گذشته برابر 36 بوده و همچنان دسترسی گسترده‌ای حفظ شده است.

وضعیت تأیید: تأیید شده (به صورت رسمی توسط تلگرام)
نرخ تعامل (ER): میانگین تعامل مخاطب 26.37% است و در ۲۴ ساعت نخست پس از انتشار، محتوا معمولاً 19.13% واکنش نسبت به کل مشترکان کسب می‌کند.
دسترسی پست‌ها: هر پست به طور میانگین 23 954 بازدید دریافت می‌کند. در اولین روز معمولاً 17 375 بازدید جمع‌آوری می‌شود.
واکنش‌ها و تعامل: مخاطبان به‌طور فعال حمایت می‌کنند؛ میانگین واکنش به هر پست 318 است.
علایق موضوعی: محتوا بر موضوعات کلیدی مانند claude, openai, контекст, стартап, llm تمرکز دارد.

📝 توضیح و سیاست محتوایی

نویسنده این فضا را محل بیان دیدگاه‌های شخصی توصیف می‌کند:
“Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN”

به لطف به‌روزرسانی‌های پرتکرار (آخرین داده در تاریخ 02 ژوئیه, 2026)، کانال همواره به‌روز و دارای دسترسی بالاست. تحلیل‌ها نشان می‌دهد مخاطبان به‌طور فعال با محتوا تعامل دارند و آن را به نقطه اثرگذاری مهم در دسته فناوری و برنامه‌ها تبدیل کرده‌اند.

90 893

مشترکین

+3624 ساعت

+1667 روز

+62830 روز

23 954

نمایش های پست

~ 17 37524 ساعت

~ 19 14248 ساعت

26.37%

نرخ مشارکت

~ 4

پست های در روز

Ads index

beta

آرشیو پست ها

90 893

Nvidia выложили в опенсорс универсальный Deep Research, который можно обернуть вокруг любой LLM Он так и называется: Universal Deep Research (UDR). Фактически, это готовый конструктор для построения системы поиска или анализа. Пользователь просто задает стратегию работы на уровне сценариев: правила сбора и анализа данных, последовательность действий, критерии отбора источников и формат результата. А дальше агент все делает сам: ищет источники, обрабатывает их, верифицирует и синтезирует. Движок под капотом может быть абсолютно любой, то есть модель можно взять какую угодно. Почему это круто? Тут все просто: демократизация. Нет привязки к конкретной платформе и обертку можно делать даже над чайником. Почему это не панацея? Тут не предполагается никакого рода файнтюнинг. А значит, итоговые метрики могут страдать, даже если в основе у вас отличная базовая модель. Поэтому – доверяем, но всегда проверяем. Статья | Страница проекта | Гитхаб | Лаб

90 893

Облачный и AI-провайдер Cloud.ru на конференции GoCloud Tech удивил всех сразу несколькими крутыми обновлениями. Делимся: Первое и самое важное: объявление цен на открытые LLM! С 1 ноября на платформе Evolution AI Factory языковые модели будут стоить в среднем 35 рублей за миллион входных токенов и 70 рублей за выходной. Это почти мировая планка, так что теперь пробовать и внедрять AI смогут не только корпорации, но и компании поменьше. Например, цена на Qwen3-235B – 17 и 50 рублей соответственно. Второе: появились первые результаты работы AI-помощника Клаудии на платформе Cloud.ru Evolution, которого представили в конце июня. Два месяца работы, и статистика говорит, что в среднем агент ускоряет рутинные операции DevOps-инженеров в 15 раз. Например, если раньше создание виртуалки занимало у пользователей от пяти до тридцати минут, то с Клаудией время сократилось до одной-двух. Агентом активно пользуется каждый четвертый юзер сервиса. И видимо, классные метрики вдохновили компанию на обновления, потому что теперь помощник будет работать еще в двух новых сценариях: – Как SRE-агент для мониторинга и алертов. – Как FinOps-помощник, который автоматически выявляет лишние траты и подсказывает оптимизацию. Приятно. Ну и еще несколько инженерных обновлений, которые стоит оценить: 1. Ребята расширили возможности сервиса для создания и управления сетевыми связями Magic Router. Теперь в нем появился Magic Link, которая организует сетевую связность между облачными ресурсами под использования интернета. 2. Релизнули Evolution VPN – облачный сервис, который даёт защищённый доступ к корпоративным и облачным ресурсам. 3. Evolution Data Platform наконец-то вышла из превью и теперь в коммерции. Система поддерживает полный цикл работы с данными и может срезать до 40% затрат на инфраструктуру. Все новинки тестируем тут

90 893

OpenAI открывают направление OpenAI for Science Об этом сообщил CTO стартапа Кевин Вейл. Цель: создать научный инструмент, который сможет ускорять научные открытия. Специально под направление OpenAI нанимает небольшую группу ученых мирового уровня из разных областей (имена пока не раскрывают). Альтман и остальные руководители стартапа уже кучу раз говорили о том, что их ИИ будет катализировать прогресс, и вот, видимо, момент заняться этим всерьез настал. Какие-то предпосылки уже есть – вспоминаем недавние новости: – Буквально пару недель назад OpenAI совместно с биотехнологическим стартапом Retro Biosciences разработали модель, которая смогла в 50 раз ускорить генерацию стволовых клеток (подробности) – В другой раз GPT-5 решила открытую математическую задачу (подробности) – Сам Кевин в своем анонсе еще приводит в пример случай, когда ученые использовали GPT-5 для доказательства некоторых теорем по квантовой теории поля (статья) В общем, подразделение появляется вполне своевременно. На доказательство Теории струн не надеемся, но к чему-то полезному прийти, вполне вероятно, можно. К тому же, они в своей инициативе не первые: Google вон уже 10+ лет занимаются моделями Alpha серии, и идея там вполне близкая к тому, что будет происходить в OpenAI for Science.

90 893

На ARC-AGI-2 новый лидер: это модель всего на 200M параметров от стартапа giotto_ai Малышка выбила аж 24,58%. Для сравнения: – Скор предыдущего лидера – 16.94% – Скор o3 – около 3% – Скор o4-mini – 2–2.4% – Скор Gemini 2.5 Pro – примерно 1% Соревнование на kaggle пока не закончилось, так что архитектуру и детали обучения, естественно, не раскрывают. Но результат потрясающий.

90 893

Начинаем утро с хороших новостей: Google Colab снизили цены на GPU и TPU – GPU подешевели на 13% (A100, L4, T4) – TPU на 10% (V28, V5E1, V6E1) A100 теперь будет стоить около $1.03 за час вместо $1.18. T4 – примерно $0.16 вместо $0.18. Напоминаем, что ценообразование у Colab динамическое, так что числа примерные. А, и маленький нюанс: цены на CPU подняли (😄). Говорят, чтобы «компенсировать снижение стоимости ускорителей».

90 893

Очень понравилась свежая статья "Be like a Goldfish, Don't Memorize!": исследователи из университета Мэриленда предлагают аналог дропаута для токенов Проблема рассматривается следующая. LLM часто запоминают части тренировочного датасета и могут воспроизводить их дословно. И это приводит к ряду очень неприятных последствий: сюда все иски за авторские права, утечки конфиденциальных данных и лицензированного кода и прочее. В общем, загвоздка достаточно значимая, и решать ее пытаются в основном через unlearning после обучения или Differential Privacy. И то и другое приводит к понижению точности и в целом не очень надежно работает. Здесь авторы предлагают более фундаментальный подход. Интуиция: модель не сможет воспроизвести дословно последовательность, если часть токенов никогда не участвовала в вычислении ошибки. А значит, мы можем случайным образом исключать часть токенов из лосс-функции на обратном проходе. Это и не очень сильно портит метрики, потому что общие закономерности языка модель все-равно выучивает, и на 100% исключает возможность дословного повторения текстов. Формально процесс обучения остается ровно таким же, меняется только лосс. В него добавляется коэффициент G_i, который равен единице, если токен учитывается в бэкпропе, и нулю – если нет. Формулу шутливо назвали Goldfish Loss: по аналогии с рыбкой, которая тут же забывает то, что увидела секунду назад. В итоге если при стандартном лоссе процент точных повторений выученных текстов – примерно 85%, то на Goldfish Loss – 0. И по качеству просаживается не сильно, нужно просто либо чуть больше данных, либо чуть больше шагов. Плюс, применять на всем датасете не обязательно, можно использовать только для чувствительных данных. Изящно, скажите? arxiv.org/pdf/2406.10209

90 893

🔥 Вчера организаторы «Лето с AIRI 2025» выложили плейлист со всеми выступлениями спикеров. Напомним: AIRI провёл летнюю школу для студентов и молодых исследователей в области ИИ в Томске. Вчера организаторы выложили плейлист со всеми лекциями. Темы охватывают всё, что сегодня волнует сообщество: – LLM-агенты и мультиагентные системы – Обучение с подкреплением – Мультимодальные модели и VLM – Интерпретируемость и безопасность – Химия и биология с ИИ – Генеративный дизайн и проектирование и многое другое. Это десятки часов контента от исследователей AIRI, МФТИ, МГУ, Сбера, Авито и других компаний 🔍 👉 Смотреть можно здесь: VK, YouTube

90 893

Хах, оказывается услугами стартапа Statsig, который только что купил OpenAI, активно пользовались еще и Anthropic Причем сообщили они об этом буквально за пару дней до сделки Совпадение? 🤔

90 893

В CERN ИИ помогает найти крайне редкие виды распада бозона Хиггса В эфире наша любимая рубрика: ускорение прогресса с помощью Deep Learning. На очереди снова физика. Контекст. В науке существует так называемая Стандартная модель – это теория, объясняющая, из каких элементарных частиц состоит вся материя и какие силы между ними действуют. По этой модели, частицы получают массу благодаря бозону Хиггса. Но чтобы подтвердить это, нужны распады Хиггса на лёгкие кварки: если Хиггс на самом деле отвечает за массы всей обычной материи, такие распады должны происходить (пусть и очень редко), так что это что-то типа лакмусовой бумажки. Сложность в том, что эти распады утопают в шумах. Раньше физики считали, что поймать их – почти фантастика: технически всё слишком тонко. И вот сегодня стало известно, что исследователи детектора CMS на Большом адронном коллайдере впервые представили результаты поиска распада бозона на пару очарованных кварков. И сделали это с помощью ИИ. Сразу скажем: сам распад пока не обнаружен. Но прорыв все равно колоссальный: точность анализа удалось улучшить на 35%. Под капотом графовая нейронная сеть и трансформер. GNN позволяет анализировать взаимосвязи между наблюдаемыми частицами в каждом событии ускорителя, а трансформер выделяет те самые едва уловимые паттерны, отличающие истинный сигнал от шума. Сетки обучали на на сотнях миллионов смоделированных столкновений (они называются джеты). Ну и да, 35% – действительно гигантский шаг. На практике это означает, что доказательство распада Хиггса на лёгкие кварки может быть обнаружено уже в ближайщие годы, когда еще пару лет назад это считалось почти невыполнимой задачей.

90 893

Новый день – новая сохраненная статья, которую никто не будет читать

90 893

📌Приглашаем вас на три бесплатных вебинара курса «MLOps» 💎Вебинар №1: «MLFlow - контроль над ML-экспериментами» ⏰ 4 сентября в 20:00 мск 🔹На вебинаре: • Узнаете как проводить ML эксперименты и главное как их контролировать; • Поймете что такое MLFlow и какие компоненты он содержит; • Разберём основные возможности MLFlow: трекинг экспериментов, управление моделями и воспроизводимость; • Проведём живую демонстрацию, где шаг за шагом внедрим MLFlow в ML-проект. 💎Вебинар №2: «Вывод ML моделей в промышленную среду на примере онлайн-скоринга» ⏰ 11 сентября в 20:00 мск 🔹На вебинаре: • Направления развития в DataScience • Построение модели машинного обучения на примере скоринга • Интеграция модели в промышленную среду на примере API на Flas 💎Вебинар №3: «Serverless подход в MLOps для небольших ML-проектов» ⏰ 18 сентября в 18:00 мск 🔹На вебинаре: • Преимущества serverless подхода для развертывания ML-моделей и когда его стоит использовать. • Развертывание ML-модели с помощью Yandex Cloud: Object Storage и Cloud Functions. • Создание и тестирование API для инференса модели. 🎁Участники вебинаров получат подарки на почту🎁 Регистрация на вебинары ➡️ OTUS.RU Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576

90 893

OpenAI купила стартап Statsig Сделка обошлась в 1.1 миллиард долларов (сущие копейки для OpenAI ✨ ). Statsig – это платформа для продуктовой аналитики и экспериментов, её технологии нужны OpenAI для ускорения разработки и тестирования новых продуктов. Но они купили не только технологию. Сделка значится как «all-stock deal», то есть все сотрудники стартапа также перейдут в OpenAI. А CEO – Виджай Раджи – станет новым CTO of Applications в OpenAI. В этой роли он будет отвечать за инфраструктуру и надежность всех пользовательских продуктов, включая ChatGPT и Codex.

90 893

Не могли не запостить сюда этот отрывок из нового интервью Альтмана

– Приведи пример случая, когда тебе пришлось сделать выбор в пользу того, что будет лучше для мира, а не для лидерства компании – Ну, мы еще не добавили секс-аватара в ChatGPT

Назовите противостояние прекраснее, чем у Альтмана с Маском. Мы подождем.

90 893

Anthropic привлекли 13 миллиардов долларов при оценке в 183 миллиарда На секундочку, еще в марте этого года они стоили всего 62 миллиарда. Это рост на 300% за пол года. А run-rate revenue с начала года вырос уже в 5 раз: $5 млрд сейчас против $1 млрд в январе. Спасибо Claude Code и API (сейчас в стартапе 70–75% выручки дают API-платежи по токенам, только 10–15% – подписки) ✌️ Такая оценка делает Anthropic четвертым по стоимости стартапом в мире и одной из самых дорогих AI-компаний после OpenAI и xAI. Раунд возглавили Iconiq, Fidelity и Lightspeed. Для Anthropic это уже серия F, то есть шестой или седьмой по счету раунд. www.anthropic.com/news/anthropic-raises-series-f-at-usd183b-post-money-valuation

90 893

12 сентября мы идем на big tech night в Москве. Зовем и вас! 🤓 big tech night — это большое событие для IT-специалистов, которое одновременно пройдет сразу в 5 офисах бигтехов. Инициативу придумал Яндекс, а Сбер, X5, Т-Банк и Lamoda присоединились и поддержали. Будет возможность заглянуть за кулисы бигтеха, посмотреть, как отличается культура в разных компаниях и послушать доклады от тех, кто решает нетривиальные задачи каждый день. А еще — это шанс пообщаться с единомышленниками, сравнить подходы в разработке и задать давно наболевшие вопросы. Ну, и просто отдохнуть: активностей для перезагрузки будет достаточно. Программу смотрите на сайте: там три трека по степени хардовости (доклады про железки, выступления по прокачке софтов и фестивальные активности). Нам приглянулись вот эти темы: – Ре(Э)волюция инструментов разработки в эпоху AI: в мире и Яндексе – GPT-функции в Алисе: backstage – Как быть AI-инженером – Архитектура производительных и отказоустойчивых мультиагентных систем – Роадмап разработчика 2.0: как адаптироваться к новой реальности ИИ Еще будет много фестивальных активностей. Например: – Яндекс организует IT-стендап и Open Source Space, где можно пообщаться с любителями опенсорса и сделать коммит в проект – У X5 будет кодинг-челлендж – У T-Банка – иммерсивная экскурсия Если не сможете присутствовать — для вас будет отдельная онлайн-студия. Там даже проведут эксклюзивные интервью с экспертами: про рекомендашки и автономных роботов-курьеров. Не пропускаем и регистрируемся здесь.

90 893

Microsoft очнулись и представили MAI-1-Preview – свою первую полностью самостоятельную модель Видимо, до компании окончательно дошло, что OpenAI так или иначе их кинет, и они наконец-то решили действовать сами. Обучали примерно на 15к H100, это сопоставимо с большинством ведущих моделей. Архитектура MoE. Вроде бы без ризонинга. Публичных бенчмарков пока нет, но на LMArena модель заняла 15 место рядом с Qwen3-325b-thinking и o1-2024-12-17 (смотрим, и не осуждаем, все-таки у ребят первый опыт 😁). Попробовать пока нигде нельзя, кроме той же LMArena. В перспективе модель должна интегрироваться в продукты Microsoft Copilot, постепенно вытесняя решения OpenAI. В довесок еще выпустили MAI-Voice-1 – речевую Text-to-Speech модель. Вот ее потрогать уже можно здесь. Заявляют, что за секунду можно сгенерировать до минуты звучания на одной GPU. microsoft.ai/news/two-new-in-house-models/

90 893

О, уже и мемы соответствующие пошли

90 893

Repost from Navio

Оффер за один день в Navio One Day Offer — уникальное онлайн-мероприятие, где можно пройти все технические этапы и получить оффер всего за один день. Кого ищем: Deep Learning Engineer c опытом разработки сложных нейросетевых решений для production-задач от 3 лет и умением писать качественный код на Python. Процесс: Оставьте заявку до 10.09 — получите приглашение до 11.09 — приходите на мероприятие 13.09! Что нужно делать: - Разрабатывать и обучать Vision-Language Models (VLM) для задач автономного вождения. - Создавать и оптимизировать модели представления 3D-сцен, таких, как NeRF и Gaussian Splatting. - Обучать нейронные сети для задач распознавания объектов на автомобилях-автоматах. - Анализировать, выдвигать гипотезы, работать с данными и архитектурой моделей и многое другое. Условия: - Ежедневная компенсация питания. - ДМС с первого дня. Стоматология — после испытательного срока. - Курсы и другие формы внешнего обучение для роста компетенций. - Подписка на медиасервисы и широкий список дисконт-программ от партнеров. - Субсидия на ипотеку и продукты банка-партнера на выгодных условиях. Регистрация и отклик по ссылке: https://vk.cc/cP8LFm?erid=2W5zFH4oUSk

90 893

Если вы думали, что ИИ дешевеет, то передумайте. Оказывается, сейчас он дороже, чем когда-либо Аналитику подвели WSJ. Тут парадокс Джевонса в действии: рост эффективности использования ресурса ведет не к уменьшению, а к увеличению его потребления. То есть: ➖ Да, цена на токен падает. Но чем дешевле становятся базовые вычисления, тем больше компании могут позволить себе использовать их для решения бОльшего количества сложных задач. Таким образом, цены падают, а косты – растут 😏 ➖ Плюс использование токенов возрастает за счет использования ризонинг-моделей. Они все еще дают ощутимые приросты на большинстве задач, так что компании готовы переплачивать. Ну, например, условный анализ юридических контрактов с точностью 99% оправданно стоит гораздо больше, чем такой же анализ с точностью 90%. И эти +9% – это в десятки раз больше токенов за счет ризонинга. Когда мы начнем выходить на плато по большинству корпоративных задач, оптимизация уже сделает свое дело. Но пока – вот так. ➖ Ну и железо, конечно. Переплачивать приходится не только за дополнительные токены, но и за новые и новые сервера. А ведет это все – к консолидации, к сожалению. Но это уже другая история. Разбор полностью можно почитать тут

90 893

Наконец-то исследования, которые мы заслужили P.S. Не мем, ссылка на статью вот