Data Secrets
前往频道在 Telegram
Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN
显示更多📈 Telegram 频道 Data Secrets 的分析概览
频道 Data Secrets (@data_secrets) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 90 903 名订阅者,在 技术与应用 类别中位列第 1 396,并在 俄罗斯 地区排名第 6 159 位。
📊 受众指标与增长动态
自 невідомо 创建以来,项目保持高速增长,吸引了 90 903 名订阅者。
根据 02 七月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 682,过去 24 小时变化为 66,整体触达仍然可观。
- 认证状态: 已认证(Telegram 官方确认)
- 互动率 (ER): 平均受众互动率为 25.82%。内容发布后 24 小时内通常能获得 18.73% 的反应,占订阅者总量。
- 帖子覆盖: 每篇帖子平均可获得 23 466 次浏览,首日通常累积 17 021 次浏览。
- 互动与反馈: 受众积极参与,单帖平均反应数为 304。
- 主题关注点: 内容集中在 claude, openai, контекст, стартап, llm 等核心主题上。
📝 描述与内容策略
作者将该频道定位为表达主观观点的平台:
“Главный по машинному обучению
Сотрудничество: @veron_28
РКН: clck.ru/3FY3GN”
凭借高频更新(最新数据采集于 03 七月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。
90 903
订阅者
+6624 小时
+2297 天
+68230 天
帖子存档
90 915
Российские школьники победили на Международной олимпиаде по ИИ в Китае
Она проходила в Китае 2-8 августа. Российские школьники завоевали 8 медалей, в том числе 6 золотых, 1 серебряную и 1 бронзовую. Это абсолютный рекорд среди 61 страны. В общекомандном зачете, кстати, сборная тоже топ-1.
Кажется, растет новое поколение крутых исследователей.
Изо всех сил радуемся и поздравляем ребят! 🎉
90 915
Ладно, давайте отвлечемся от GPT-5 и обсудим то, что Google представили новый метод разметки данных для файнтюнинга
Главное: он позволяет уменьшить количество необходимых для обучения примеров буквально в тысячи и десятки тысяч раз, без потери качества.
Сейчас объясним, как это работает на примере задачи модерации рекламы. Вместо того, чтобы сразу передавать данные на аннотацию разметчикам, происходит вот такой цикл:
1. Исходная языковая модель получает задачу и сама размечает данные как «кликбейт» или «обычная реклама».
2. Далее эти две группы отдельно кластеризуются на основе обычных эмбеддингов.
3. В ходе кластеризации появляются перекрывающиеся кластеры разных групп. И вот именно эти «спорные» пары передаются на ручную разметку.
Просто и изящно. В итоге точность моделей после файнтюнинга такая же, а данных нужно размечать в тысячи раз меньше. Представьте, какая экономия.
Вот так. Берите на заметку, имплементировать в своих проектах такое очень легко
research.google/blog/achieving-10000x-training-data-reduction-with-high-fidelity-labels/
90 915
Найден еще один легендарный график с презентации OpenAI. Этот просто 10/10
Либо это какая-то мощная постирония, чтобы превратиться в мем (как известно, плохой рекламы не бывает), либо графики рисовала GPT-5, либо и то и другое
90 915
На Твиче запустили прямую трансляцию, как GPT-5 играет в Pokémon Red
Модель почти точно сможет пройти игру полностью (несколько месяцев назад это уже сделала Gemini 2.5 Pro), но главный вопрос – сколько времени ей понадобится. У Gemini ушло несколько сотен часов: она часто путалась.
У GPT-5 пока все идет гладко. Если провалиться внутрь сайта, можно даже почитать цепочки ризонинга и отследить вызов инструментов.
www.twitch.tv/gpt_plays_pokemon
Кстати, мы забыли вам сообщить, что GPT-5 уже со вчера бесплатно доступна в Cursor. Если вы никогда не вайб-кодили до этого, но теперь точно никуда не денетесь 🙂
90 915
+9
Все важные бенчмарки в одном посте
Пупупу, Grok-4 на ARC-AGI обогнать не удалось
90 915
Что мы имели в виду, когда писали, что «шкалы на графиках те еще»
Просто присмотритесь
90 915
+1
Итак, кроме громких слов, что мы имеем:
– Модель действительно гибридная
– Говорят, что это лучшая модель для кодинга на рынке
– Первые бенчмарки (потом соберем их все в отдельный пост) наверху. Обратите внимание на 100% на AIME 25
(пост обновляется по ходу презентации)
90 915
Конспирологи, вам понравится: год назад правительство США провело очень масштабное исследование рисков ИИ-моделей, но… результаты решили не публиковать
Информацию накопали Wired. Оказывается, прошлой осенью несколько крупных лабораторий, которые занимаются безопасностью, две недели занимались ред тимингом и нашли в ведущих моделях 139 уязвимостей.
Среди них были способы, как можно заставить модель распространять дезинформацию, раскрывать личные данные или выдавать инструкции по совершению кибератак. Исследование могло бы помочь нескольким крупным компаниям лучше обезопасить свои модели. Но это если бы его опубликовали 👉
Но этого никто не сделал и, более того, работа осталась под NDA. И нет, не потому что какая-то там модель сбежала из лаборатории.
Дело в том, что скоро к власти должен прийти Трамп с новой политикой, а в работе среди прочего фигурировали упоминания «разнообразия, равенства и инклюзии» (DEI).
Это все, кстати, при том, что тогда исследование проводилось Национальным институтом стандартов и технологий (NIST), то есть по сути самим правительством. А еще ироничнее, что буквально пару недель назад вышел AI Action Plan, в котором администрация Трампа требует провести ровно такое же тестирование.
www.wired.com/story/inside-the-biden-administrations-unpublished-report-on-ai-safety/
90 915
Работайте с дата-аналитикой в бизнесе! Эта программа сделает из вас сильного специалиста, которого хотят заполучить топ-компании России ⬇️
Институт искусственного интеллекта и анализа больших данных ТГУ совместно с Wildberries & Russ набирают студентов в онлайн-магистратуру “Дата-аналитика для бизнеса”.
В чем её особенность:
→ В этой программе объединены фундаментальная вузовская база и кейсы компаний Wildberries & Russ, Авито, Ситимобил, Playrix, Яндекс, Газпромнефть, Eggheads и других компаний
→ Студенты изучают актуальную теорию одновременно с практикой в компаниях-партнёрах
→ Это онлайн-магистратура, но со всеми плюсами очного образования (студенческими льготами и отсрочкой)
Студенты могут выбрать одно из трёх направлений для специализации:
🔵продуктовая аналитика,
🔵маркетинговая аналитика,
🔵BI-аналитика.
Результат:
Диплом и навыки для работы дата-аналитиком в бизнесе, стажировки в топ-компаниях, возможность заявить о себе потенциальным работодателям.
Старт обучения — 18 сентября 2025 года. Длительность программы — 2 года.
🔗 Отправьте заявку на обучение до 20 августа по этой ссылке
Реклама. "Академия Дата Дайвинг". ИНН: 7017489135, erid: 2VtzqwdaWoj
90 915
GitHub случайно раскрыл детали о моделях GPT-5
В блог компании раньше времени утекла новость о добавлении в GitHub Models еще не вышедших моделей OpenAI. Конечно же новость быстро удалили, но доступ на архиве никто не отменял.
Обещают 4 версии:
gpt-5 — для логики и многошаговых задач. gpt-5-mini — облегчённая версия для случаев, где важна стоимость. gpt-5-nano — оптимизирована для скорости и минимальных задержек. gpt-5-chat — для продвинутых, естественных, мультимодальных и контекстно-чувствительных диалогов, ориентирована на корпоративные приложения.Из важного: свежая версия будет заточена под "расширенные агентные возможности", а также адаптирована под быстрое и точное решение задач с кодом с минимальным промптингом. Получается, сегодня презентацию можно не смотреть. https://www.theverge.com/news/752091/openai-gpt-5-model-announcement-github-leak
90 915
Сегодня пройдет финал ИИ-чемпионата Kaggle по шахматам
В финал вышли o3 и Grok-4 (ставки принимаем в комментариях). За третье место будут бороться o4-mini и Gemini 2.5 Pro. Прискорбно, конечно, что в финале ни одной модели от Anthropic. С другой стороны новый Opus 4.1 не участвовал.
Комментировать трансляцию будет Магнус Карлсон, так что смотрим. Вчера, кстати, комментил Хикару Накамура (да, Kaggle запарились).
Онлайн будет здесь сразу после презентации GPT-5, в 20:30 по Москве. Расписание на вечер сегодня плотное 🏃♂️
90 915
На ИТ-Пикнике в Коломенском расскажут о будущем в технологиях
1) Профессор РАН Иван Оселедец расскажет, как ИИ научился не просто генерировать ответы, а мыслить по цепочке, как человек, а также — что такое reasoning-системы, зачем нужен мультиагентный подход и почему сбор данных уже не так важен.
2) Кандидат физико-математических наук Александр Петюшко объяснит, как работают беспилотные машины — от технологий до планирования маршрута и сложностей.
3) Еще будет разговор про опенсорс, а точнее — для чего люди занимаются этим добровольно, что ими движет и как устроены новые опен-платформы вроде SourceCraft. СТО Яндекса, Т-Банка и Авито сядут за один стол, чтобы обсудить: GenAI учит платформы, или, уже наоборот, что останется людям в ближайшие пять лет.
Готовимся серьезно думать
90 915
Qwen отлично обновили свою локальную модельку Qwen3-4B
Так же, как и предыдущие, она теперь вышла в двух вариантах: Thinking (веса) и просто Instruct (веса).
Приросты по метрикам достойные. И, кроме того, модели расширили контекстное окно: теперь вывозит до 256к токенов. Выглядит как имба для локального запуска.
Интересно было бы сравнить с новой gpt-oss 20B.
И вообще, будет хотя бы день без китайского опенсорса? Qwen только за этот месяц выпустили 6 или 7 обновлений и релизов
90 915
Если вы не знали, как выглядит рекурсия, взгляните на это видео
Это новая модель симуляции мира Genie 3 от Google (писали о ней тут) сгенерировала человека, который сидит и взаимодействует с Genie 3, пока по телевизору идет… ну да, симуляция Genie 3.
И обратите внимание, что кадры «верхней» симуляции совпадают с теми, что Genie нагенерировала человеку на экране. Роликом поделился, кстати, рисерсер из команды разработки.
Это уже сингулярность?
90 915
Claude Code теперь автоматически проверяет весь ваш код на уязвимости
Anthropic запустили функцию /security-review и интеграцию с GitHub Actions. Теперь любой ваш PR будет автоматически проверяться на уязвимости + можно запустить проверку из коробки прямо в терминале.
Проверяет агент на такие вещи, как SQL-инъекции, XSS уязвимости и лики данных. Если что-то найдется, Claude вежливо обратит на это внимание и сразу предложит исправление.
Кстати, Anthropic говорят, что это фича однажды помогла им самим обнаружить крупный косяк. Благодаря агенту они смогли исправить его до деплоя. Хотите верьте, хотите нет. Но фича действительно прикольная
90 915
Yandex B2B Tech открыла доступ к опенсорсным моделям OpenAI на платформе Yandex Cloud AI Studio.
Опенсорс-модели GPT-OSS на 20 млрд и 120 млрд параметров уже доступны через API — теперь будет ChatGPT в каждом доме
Все данные хранятся и обрабатываются в российских дата-центрах с полным соблюдением закона «О персональных данных». Стоимость – от 10 до 30 копеек за 1000 токенов в зависимости от модели. В ближайшее время появится возможность вызова внешних функций (агентские возможности), встроенные в сами модели.
Новые GPT-OSS модели от OpenAI по качеству уже сопоставимы с o3-mini и o4-mini, а в отдельных задачах даже превосходят GPT-4o и o1. Так что возможно, модель от OpenAI скоро станет лидером среди продуктов Яндекса
90 915
OpenAI впервые за долгое время позволит сотрудникам продать акции
Это коснется и бывших, и нынешних работников компании. Зачем это OpenAI и что означает на практике:
1. Оценка компании вырастет почти на 70%. Это не обычный раунд финансирования, а вторичная продажа, поэтому в ходе такой сделки определяется цена, по которой инвесторы готовы покупать доли именно у сотрудников, — именно эта цена и становится новой рыночной оценкой всей компании. Итог: в марте оценка OpenAI была 300 миллиардов долларов, теперь будет около 500.
2. Вынужденная мера для сохранения сотрудников. Очень многих в OpenAI не устраивало, что они не могут продать акции даже после ухода. Теперь деньги становятся реальными, а не только на бумаге. Короче, возможность обналичить опционы должна повысить общую корпоративную лояльность. А еще ликвидность – важный пункт для хантинга.
Пока переговоры на ранней стадии, но интересующиеся покупной инвесторы уже есть
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
