Data Secrets
前往频道在 Telegram
Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN
显示更多📈 Telegram 频道 Data Secrets 的分析概览
频道 Data Secrets (@data_secrets) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 90 762 名订阅者,在 技术与应用 类别中位列第 1 410,并在 俄罗斯 地区排名第 6 172 位。
📊 受众指标与增长动态
自 невідомо 创建以来,项目保持高速增长,吸引了 90 762 名订阅者。
根据 28 六月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 555,过去 24 小时变化为 15,整体触达仍然可观。
- 认证状态: 已认证(Telegram 官方确认)
- 互动率 (ER): 平均受众互动率为 26.10%。内容发布后 24 小时内通常能获得 19.13% 的反应,占订阅者总量。
- 帖子覆盖: 每篇帖子平均可获得 23 687 次浏览,首日通常累积 17 362 次浏览。
- 互动与反馈: 受众积极参与,单帖平均反应数为 314。
- 主题关注点: 内容集中在 claude, openai, контекст, стартап, llm 等核心主题上。
📝 描述与内容策略
作者将该频道定位为表达主观观点的平台:
“Главный по машинному обучению
Сотрудничество: @veron_28
РКН: clck.ru/3FY3GN”
凭借高频更新(最新数据采集于 29 六月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。
90 762
订阅者
+1524 小时
+1847 天
+55530 天
帖子存档
90 765
Самая внезапная новость за неделю: Zoom (да, тот самый) выбил со своей моделькой SOTA результат на Humanity’s Last Exam
Со скором 48.1% они опередили предыдущего лидера – Gemini 3 Pro (+tool) – почти на 3 процентных пункта.
Но вообще, хотя и результат объективно крутой, надо заметить, что говорить о таком сравнении не очень честно. У Zoom не одна модель, а хитрый ансамбль, или точнее федеративная AI-система.
Несколько моделей (включая собственные от Zoom + партнерские от Meta, OpenAI и Anthropic) работают в пайплайне: маршрутизируют задачи, генерируют варианты ответов, проверяют, критикуют друг друга и объединяют результаты.
https://www.zoom.com/en/blog/humanitys-last-exam-zoom-ai-breakthrough/
90 765
Google выпустили статью про SIMA-2. Оказалось, что агент способен на самообучение.
SIMA-2 – это ИИ-агент для игр. Первая его версия вышла примерно полтора года назад, вторую релизнули в ноябре, но статью выложили только сейчас.
Апгрейднули SIMA-2 относительно первой SIMA довольно сильно: теперь модель способна рассуждать и генерализоваться на новые игры, а не просто механически выполнять какие-то действия.
Особой магии под капотом нет – по сути, это дотюненная на игровые действия Gemini Flash-Lite. В статье, конечно, много занятных деталей про обучение, но самое интересное, на наш взгляд, спрятано в разделе про self-improvement.
Исследователи попробовали поместить агента в совершенно новую для него игру ASKA, не дали никаких инструкций или человеческих демонтраций, и запустили процесс самоулучшения.
Агент (внутри которого, напоминаем, сидит LLM) был сам себе тестировщиком, исполнителем и reward-моделькой. Один экземпляр Gemini – Task setter – придумывал задачку нужного уровня -> SIMA пробовал ее исполнять -> другой экземпляр Gemini оценивал успех -> на основе этого фидбэка обновлялась политика -> и так много-много итераций с постепенным усложнением задач.
В итоге в игре, которую агент никогда не видел, дообученная таким образом система превзошла не только исходную SIMA-2, но и человека! И это буквально полностью автономное обучение на основе собственного опыта.
Какой-то RL-v2
Советуем почитать полностью: arxiv.org/pdf/2512.04797
90 765
Google обновили агента Gemini Deep Research: теперь он работает на базе Gemini 3 и выбивает 46.4% на HLE
Систему дотюнивали с помощью многоступенчатого RL, чтобы она точнее искала и меньше галлюцинировала на сложных запросах.
В итоге на Humanity’s Last Exam скор относительно Gemini 3 Pro вырос на три процентных пункта, а на внутреннем бенчмарке DeepSearch QA – на десять.
Этот внутренний бенчмарк, Google, кстати, опенсорснули (www.kaggle.com/benchmarks/google/dsqa).
P.S. На графике обратите внимание, что GPT-5 Pro специально гоняют в несколько потоков (именно так из коробки работает Deep Research у Google и OpenAI), чтобы сравнение было честным.
90 765
Сегодня OpenAI исполняется ровно 10 лет
О создании компании было объявлено 12 декабря 2015 года. Начальный бюджет – 1 миллиард долларов – был собран небольшой группой инвесторов-энтузиастов. Вот оригинальный блогпост, а еще в честь праздника компания выпустила видео ⬆️
В 2015 алгоритмы еще плохо отличали кошечек от собачек, и люди не верили, что машина когда-нибудь сможет заговорить. А сегодня ИИ уже неотъемлемая часть жизни и работы, а стартап Альтмана оценивается в 500 миллиардов долларов.
Но ChatGPT вышел только в 2022. А чем компания занималась до этого? Давайте вспомним:
– OpenAI Gym (2016). Платформа для тестирования алгоритмов ИИ в симулированных средах. Она очень быстро стала тогда стандартом в исследованиях. Следом вышел Universe – инструмент для обучения агентов взаимодействию с реальными программами и играми.
– OpenAI Five (2018). Ботов обучили играть в Dota 2 с помощью PPO. В итоге они обыграли топ-игроков мира, обучившись на 45 000 годах симуляций за 10 месяцев.
– Robotic Hand (2018). Знаменитый проект, в котором робо-руку учили собирать кубик Рубика.
Поздравляем: если вы знакомы с этими проектами – вы олд 👴. После них уже пошло-поехало: GPT-2 в 2019, GPT-3 в 2020, DALL-E и первый Codex в 2021, и ChatGPT в 2022.
Короче, поздравляем компанию с юбилеем!
90 765
MWS Cloud запустила сервис по установке серверов с GPU в периметре предприятий
Компания предлагает готовые серверы с графическими ускорителями прямо у вас на предприятии. Можно взять в аренду или купить — всё зависит от задач и бюджета.
Что внутри:
• Настройка и помощь с выбором конфигурации под ваши проекты;
• Поддержка на всех этапах эксплуатации;
• Развёртывание на площадке компании или в дата-центре MWS Cloud;
• Доступны сервера с 7 видами GPU и более 20 конфигураций серверов.
Идеально для промышленных, финансовых и медицинских компаний, которым нужен закрытый контур и соблюдение всех норм безопасности и законодательства.
Подробнее: https://mws.ru/services/mws-gpu-on-prem/
90 765
+1
Самый крутой скачок GPT-5.2 произошел, пожалуй, на ARC-AGI
На ARC-AGI 1 модель достала 86.2% (GPT-5.1 берет 72.8%, Gemini 3 Pro – 75). Это серьезный рост.
При этом GPT-5.2 Pro с повышенным уровнем ризонинга X-High скорит уже 90.5% при стоимости $11.64/задачу. Всего год назад сотой считалась нерелизнутая o3-High с результатом 90.5% и $11.64/задачу. Это означает, что за год эффективность выросла в 390 раз.
На ARC-AGI 2 все еще интереснее. Там скачок произошел с 17.6 до 52.9%! Самый близкий по скору конкурент – Claude Opus 4.5 – выбивает всего 37.6%. Просто напоминаем, что между релизами GPT-5.1 и 5.2 прошел месяц 😐
GPT 5.2 Pro X-High точно скорит еще больше, но организаторы бенчмарка пишут, что пока не смогли достоверно проверить ее результаты из-за API timeouts. Средний уровень человека на ARC-AGI 2 – около 60%. Интересно, побьет ли.
90 765
+7
⚡️ Вышла GPT-5.2
– Модель заметно прокачали в кодинге, математике и работе на длинных контекстах и с изображениями. На AIME 25 у нее теперь 100% (GPT-5.1 била 94), а на SWE-bench Verified – 80% (вместо 76.3 у 5.1).
– По бенчмаркам OpenAI упрямо сравнивает свою модель только с ее же предыдущими версиями, игнорируя конкурентов. Но по уровню примерно Gemini 3 Pro, даже на несколько процентных пунктов выше на многих бенчах.
– В ChatGPT GPT‑5.2 Instant, Thinking и Pro начнут катать уже сегодня, в API доступ открыт. Цена относительно 5.1 и 5 немного повысилась, см последний скрин.
В целом OpenAI как будто действительно постарались на этот раз. Вот что конкуренция творит!
https://openai.com/index/introducing-gpt-5-2/
90 765
Сэм Альтман, Дженсен Хуанг и другие ИИ-лидеры коллективно стали «Человеком года» по версии Time
В этом году победителем номинации стал не один человек, а целая группа под названием «Architects of AI».
В частности: Сэм Альтман, Дарио Амодеи, Демис Хассабис, Дженсен Хуанг, Фэй-Фэй Ли, Илон Маск, Лиза Су и Марк Цукерберг.
«2025 год стал годом, когда весь потенциал искусственного интеллекта проявился во всей своей полноте и стало ясно, что пути назад уже нет. За то, что эпоха думающих машин стала реальностью; за то, что поразили и встревожили человечество; за изменение настоящего и расширение границ возможного – человеком 2025 года Time стали архитекторы искусственного интеллекта»Кстати, обложка сгенерирована или нам показалось? 🤨 time.com/7339685/person-of-the-year-2025-ai-architects/
90 765
⚡️ Яндекс выложил в открытый доступ техрепорт собственного семейства моделей Alice AI.
В новой линейке моделей — базовая текстовая Alice AI LLM и специализированная LLM Search, мультимодальная Alice AI VLM и Alice AI ART для генерации картинок. Компания описала все этапы работы над обновленной Alice AI — от претрейна и инфраструктурных изменений до инференса.
Значительные улучшения получили все модели в семействе, в первую очередь за счет собственных фреймворков и библиотек Яндекса. Среди самых интересных обновлений — подготовка к полноценной мультимодальности: настроена интеграция VLM с текстовой LLM за счет единых подходов RLHF.
Также прокачаны навыки по решению сложных математических и геометрических задач, улучшено качество ответов по предметам школьной программы. VLM получила более качественный OCR и может работать с большим качеством изображений, а LLM дает более точные ответы за счет улучшения подготовки данных.
Инфраструктурные изменения дали более высокую скорость ответа и возможность тренировать MoE-модели с сотнями миллиардов параметров.
90 765
Итак, получается, что в 2026-2027 на IPO выходят OpenAI, Anthropic и SpaceX. Чьи акции покупаем?
90 765
SpaceX готовится к IPO: теперь основная цель компании – строительство датацентров в космосе
90 765
Тем временем новую Gemini 3 Flash заметили в Cursor
Интересно, что модель помечена как thinking. Предыдущая Gemini 2.5 Flash была без ризонинга.
Ждем релиз сегодня?
90 765
Хотите обзор самого главного в ИИ за этот год?
Вот прям всю мякотку: от хардкорного ML / ИИ в разработке до взгляда на ИИ от бизнеса.
от тех же ребят, что сделали AI Dev Live (одна из крупнейших ИИ-конф, 3к+ участников).
В программе:
- Сдвиг парадигмы в управлении процессами, который все пропустили
- Как в 2026 бизнесу отличить: где ИИ-фанатизм со сливом бюджета, а где ИИ-инструменты с реальной ценностью?
- Почему одних разрабов ИИ бустит, а другие плюются от багов? Как укротить агентов и получать production-ready код от ИИ?
- RAG мертв? Почему enterprise уходит от векторных баз к агентам, куда движется индустрия LLM-провайдеров и какое место у локальных AI-решений?
- Кого и как нанимать в 2026 году? И, самое главное, что изучать, чтобы не уволили вас?
В общем, шикарная солянка контента от экспертных спикеров: парочка Head of AI, руководитель AI R&D-института, фаундеры и ко-фаундеры AI-first компаний: самый лучший состав, чтобы рассказать про ИИ со всех ракурсов.
⚡️ Вот ссылка для записи на предновогодний эфир (все еще можно бесплатно!)
Реклама. ИП Шейко Н.Е., ИНН 540131220129, erid 2VtzpxGT4JZ
90 765
nanoGPT от Андрея Карпаты стала первой в мире LLM, обученной и запущенной в космосе
Мы уже несколько раз рассказывали вам о стартапе Starcloud. Они занимаются строительством космо-датацентров и к 2030 году планируют вынести на орбиту аж 5 гигаватт железа.
В начале ноября они запустили в космос первую в истории видеокарту H100 – на спутнике размером с холодильник.
Сначала сообщалось, что на ней планируется тюнить Gemma, но сегодня Starcloud рассказали, что вместо этого обучили целую модель с нуля!
Они взяли nano-GPT – минималистичную реализацию GPT на PyTorch от Андрея Карпаты, – обучили ее на полном собрании сочинений Шекспира и успешно запустили инференс! Gemma, кстати, тоже запускали, но только предзагруженную.
90 765
Уже пару дней все говорят о том, что на этой неделе нас ждут сразу две новые модели
Первая – GPT-5.2. Да-да, всего через месяц после GPT-5.1 (она же Shallotpeat, о которой мы писали здесь).
Помните, Альтман когда-то говорил, что после выхода GPT-5 путаницы с версиями больше не будет? Ну так вот…
Вторая – Gemini 3 Flash, тут все ожидаемо.
Одна из них, судя по всему, должна выйти уже завтра. Вторая – на следующей неделе.
🎄
90 765
В Пентагоне появится подразделение для подготовки к AGI
Создание так называемого «Руководящего комитета по будущему искусственного интеллекта» утверждено в новом Национальном оборонном акте.
Комитет должен быть создан не позднее 1 апреля и будет заниматься оценкой возможных военных последствий AGI.
Кроме того, в задачи комитета входит анализ ИИ-политики других стран (в первую очередь Китая) и формирования стратегий на случай Скайнета 😮💨
90 765
«Норникель» выложил в опенсорс доменную модель MetalGPT-1
Она интересна тем, что обучена на данных, которые обычно не циркулируют в открытой среде. Это всякие технологические регламенты, протоколы, НИОКР, проектная документация из области металлургии и гордобычи. Объем – примерно миллион текстов.
Размер самой модели – 32В, не маленькая. На ее основе компания уже строит ассистентов и автономных агентов, которые встраиваются непосредственно в узкие операционные процессы.
Архитектура типовая, но из-за того, что модель обучена на корпусе, которого веб никогда не увидит, разрыв в качестве на доменных задачах большой. В этом смысле открытые веса тут почти декоративны: без данных такое все равно не воспроизвести.
В ближайшем будущем у компаний будет появляться все больше таких доменных моделей, и рынок в каком-то смысле может даже разделиться по этому признаку.
Веса
90 765
+1
Mistral выпустили опенсорсного CLI агента для кодинга Mistral Vibe
Это утилита с интерфейсом командной строки, которая выполняет все функции обычного агента для кодинга (меняет, пишет, тестит код и тд). Лицензия Apache 2. Установить можно с помощью команды:
uv tool install mistral-vibe
Любителям терминала должно зайти.
Под капотом – новая моделька стартапа Devstral 2. Она вышла в двух размерах: 123В и 24В. Все тоже в опенсорсе.
По метрикам старшая модель примерно на уровне DeepSeek-V3.2 и Kimi K2 Thinking, то есть довольно неплохо.
mistral.ai/news/devstral-2-vibe-cli90 765
⚡️ Anthropic передали права на MCP в Linux Foundation
Они вместе с OpenAI и Block основали Agentic AI Foundation (AAIF) – целевой фонд под эгидой Linux Foundation, чтобы продвигать открытые стандарты для агентного ИИ.
Linux Foundation – это некоммерческая организация, которая обеспечивает нейтральное управление открытыми проектами. Например, они хостят Kubernetes и Node.js.
Все проекты, переданные в LF, независимо поддерживаются и контролируются организацией + интеллектуальная собственность тоже принадлежит сообществу. Смысл этого в том, чтобы избежать возможных монополий компаний.
Anthropic задонатили в AAIF MCP (огромный смелый шаг!), OpenAI – AGENTS.md, а Block – фреймворк goose.
Кстати, обязанности по финансированию теперь тоже лежат на Linux Foundation. Среди платиновых членов AWS, Bloomberg, Cloudflare, Google, Microsoft и другие. Каждый год каждый из них платит большие взносы, которые идут на поддержку и развитие проектов.
90 765
+2
Новое исследование от Anthropic: как сделать так, чтобы все опасные знания хранились в модели отдельно от обычных
И снова про элаймент! Уж очень занятный в этот раз стартап предлагает подход. Называется он Selective GradienT Masking. Погнали разбираться.
Вообще, как такового элаймента на этапе претрейна не существует, все это добавляется уже после предобучения. А это довольно серьезный затык.
Пока единственный вариант, до которого люди додумались – это просто выбросить из датасета "опасные знания", но это (1) оч дорого и долго, потому что требует разметки; (2) отсекает дополнительно и много полезных знаний, и модель тупеет. Так что – ерунда.
А вот Anthropic предлагают сами данные не трогать, а вместо этого сделать так, чтобы вся опасная информация стекалась в отдельный кусок параметров, который затем можно просто... удалить. Работает это так:
– На каждый блок трансформера мы дополнительно надеваем голову внимания, которую помечаем, как "forget" параметры. – Если на вход попадают данные, которые помечены, как "опасные", мы насильно зануляем все градиенты, кроме "forget". Это гарантирует, что все опасные знания стекаются в определенное место. – Чтобы после модель могла хорошо работать без этих параметров, на части данных при прямом проходе им зануляют активации.Как видите, это, по факту, та же самая фильтрация данных. Только умная. Во-первых, такой подход устойчив к шуму разметки. Во-вторых, метить все данные потенциально необязательно: выяснилось, что начиная с какого-то момента даже неразмеченное опасное содержимое датасета начинает тяготеть больше к "forget" параметрам. Это назвали эффектом Абсорбирования. При этом модель после вырезания этой вот черной душонки глупеет меньше, чем при вырезании данных из датасета. Все-таки здесь мы действуем немного деликатнее. Ну и ведет она себя после этого так, как будто ей действительно ничего подобного никогда не показывали, а не как будто она временно об этом забыла. В общем, на уровне механики и идеи – довольно интересный зачаток https://alignment.anthropic.com/2025/selective-gradient-masking/
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
