Data Secrets
前往频道在 Telegram
Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN
显示更多📈 Telegram 频道 Data Secrets 的分析概览
频道 Data Secrets (@data_secrets) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 90 790 名订阅者,在 技术与应用 类别中位列第 1 410,并在 俄罗斯 地区排名第 6 172 位。
📊 受众指标与增长动态
自 невідомо 创建以来,项目保持高速增长,吸引了 90 790 名订阅者。
根据 29 六月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 589,过去 24 小时变化为 35,整体触达仍然可观。
- 认证状态: 已认证(Telegram 官方确认)
- 互动率 (ER): 平均受众互动率为 26.17%。内容发布后 24 小时内通常能获得 19.15% 的反应,占订阅者总量。
- 帖子覆盖: 每篇帖子平均可获得 23 760 次浏览,首日通常累积 17 384 次浏览。
- 互动与反馈: 受众积极参与,单帖平均反应数为 314。
- 主题关注点: 内容集中在 claude, openai, контекст, стартап, llm 等核心主题上。
📝 描述与内容策略
作者将该频道定位为表达主观观点的平台:
“Главный по машинному обучению
Сотрудничество: @veron_28
РКН: clck.ru/3FY3GN”
凭借高频更新(最新数据采集于 30 六月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。
90 790
订阅者
+3524 小时
+2287 天
+58930 天
帖子存档
90 793
Подводим итоги этого сумасшедшего месяца и выбираем самый крутой релиз ноября
90 793
Статья про Faster R-CNN выиграла награду "Test of Time" на NeurIPS 2025. В честь этого – небольшая историческая справка
В этом году работе исполняется 10 лет. За это время ее процитировали около 56700 раз.
Что же в ней такого особенного?
Представьте: вы в 2015. Для решения задачи детекции и классификации объектов на изображении уже существует R-CNN и Fast R-CNN. Оба алгоритма достаточно точные, но их все еще почти невозможно применить в реальных задачах. Все дело – в скорости.
Оба алгоритма страдали от одного и того же узкого места: поиск регионов, то есть выделение подозрительных областей, в которых возможно есть объект. Эти регионы генерировались не нейросетью, а старым хэндкрафтед-алгоритмом Selective Search на основе поиска по цветам. Он работал на CPU и занимал 1.5–2 секунды на одно изображение.
То есть на каждый кадр нужно было ждать несколько секунд ещё до того, как сеть вообще начнет классифицировать объекты. Это адская уйма времени.
И вот в конце 2015 года выходит работа "Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks". Статья, которую сегодня заслуженно называют переворотом в детекции.
Авторы предложили простую, но гениальную идею: вставить в архитектуру еще одну сетку, которая сама будет искать подозрительные регионы, основываясь на тех же фичах, что и детектор. Так появились Region Proposal Network, которые ускорили весь процесс примерно в 200 раз.
После появления Faster R-CNN впервые стало возможными делать какую-то детекцию в реальном времени. А еще это модель стала, по сути, первым НЕ-франкенштейном, то есть системой, основанной на Deep Learning от начала и до конца.
Ну и, кроме того, в данной работе впервые предложили якоря (anchors). На этой концепции затем выросла, например, хорошо известная вам YOLOv2.
Поздравляем авторов!
90 793
Просто реклама новогодних скидок на Jetson AGX Orin, Jetson Thor и Jetson Orin Nano Super
Дженсен Хуанг однозначно что-то знает про правильный маркетинг 🐕
90 793
Ноам Браун, ведущий исследователь OpenAI: «Если смотреть на мнение ведущих ученых, а не на заголовки СМИ, обнаруживается удивительно много согласия по поводу ИИ»
Понравился достаточно хладнокровный и емкий пассаж от Ноама Брауна, который занимается ризонингом в OpenAI. Он пишет, что, если вы действительно хотите понять общую картину отрасли, нужно забыть про ложную дихотомию, которую продвигают СМИ, и смотреть на то, что говорят эксперты. Краткий перевод:
Соцсети обычно сводят дискуссию об ИИ к двум карикатурным позициям: (A) Скептики, которые считают, что LLM обречены и что ИИ — это просто хайп. (B) Фанатики, которые уверены, что у нас уже есть все ингредиенты и суперинтеллект вот-вот появится. Но если почитать, что реально говорят ведущие исследователи (а не заголовки СМИ), то обнаруживается удивительно много согласия: – Текущая парадигма, скорее всего, уже достаточна, чтобы произвести огромный экономический и социальный эффект – даже без дальнейших научных прорывов. – Чтобы достичь AGI/ASI, вероятно, все же понадобятся дополнительные исследовательские прорывы. (Continual learning и sample efficiency – два примера, которые исследователи часто упоминают). – Скорее всего, мы разберёмся с этим и придём к AGI/ASI в течение 20 лет. В среднем ученые называют срок 10 лет. Никто из них не говорит, что ASI – это фантазия или что появление суперинтеллекта – дело 100+ лет. В основном разногласия касаются того, какими будут нужные прорывы и как быстро они произойдут. Но в целом, если смотреть на картину полностью, эксперты в этой области согласны куда больше, чем не согласны.x.com/polynoamial/status/1994439121243169176
90 793
ШАД Яндекса научит применять ИИ в исследованиях
ИИ всё глубже уходит в экспериментальную науку — от разработки новых материалов до анализа биомедицинских данных. На этом фоне в Школе анализа данных Яндекса начали обучать исследователей внедрению ИИ в свои научные работы. Среди 50 участников новой программы — кандидаты наук, магистранты и аспиранты из лабораторий по всей стране.
Формат такой: участники изучают основы ИИ и сразу же встраивают их в свои исследования. Каждую команду ведёт эксперт ШАДа — помогает выбрать методы и построить дизайн эксперимента. Если проекту нужны большие вычисления, подключают мощности Yandex Cloud.
В ШАДе объясняют идею: учёным дают фундамент работы с ИИ и современный инструментарий. Цель — чтобы специалисты научились строить исследования, где модели становятся не внешним плагином, а органичной частью научного процесса. Первые результаты ожидают весной, а ещё через год появятся работы, созданные в новой связке «ученый + ИИ».
Такую ИИнтеграцию мы одобряем
90 793
90 793
Случайно нашли картинку, которая описывает буквально любое исследование по элайменту
90 793
Anthropic переработали свой подход к работе с долгим контекстом для агентов
Контекстное окно все еще остается основным ограничением агентов. Если вы ставите агента на какую-то действительно большую долгую задачу, он будет делать ее в несколько сессий. Каждая сессия вмещает только довольно узкое контекстное окно, и когда оно иссякает, у нового запуска будет уже "пустая память".
С этим можно бороться с помощью простейшего сжатия контекста, как сейчас реализовано в Claude Code или Codex, но качество такого подхода, прямо скажем, далеко от идеала.
Сейчас Anthropic пытаются тестировать менее наивный метод. Они пишут, что вдохновились человеческими инженерными практиками, когда каждый разработчик оставляет после себя какие-то артефакты для других. Суть:
1. Перед тем, как задача отойдет кодинг-агенту, над ней работает Initializer agent. Он делает какой-то базовый scaffolding (то есть делит задачу на мелкие), формирует claude-progress.txt и feature-list. 2. Далее идет несколько сессий уже с кодинг-агентами. У каждого все еще отдельное контекстное окно, но отличие от сжатия контекста тут в том, что вся их работа, тем не менее, центразирована и управляется одним набором инструкций. 3. Собственно, инструкции: каждый агент сначала изучает логи, claude-progress.txt и feature-list, затем выбирает одну фичу и реализовывает ее end-to-end, включая тестирование. Также каждый агент обязательно коммитит изменения с информативным сообщением и обновляет прогресс-файлы.Таким образом, после каждой сессии у нас остается не недоделанная задача и грязный контекст, сжав который, мы получим непонятно что, а чистенькая задокументированная законченная работа, которую можно передать следующему. В Claude Code пока не довезли, но потестить уже можно в Claude Agent SDK, вот тут инструкция.
90 793
В сети открыли полный доступ в opensource к линейке ИИ-моделей GigaChat
Сбер опубликовал весь стек моделей с лицензией MIT и разрешением на коммерческое использование.
Флагман — GigaChat 3 Ultra-Preview — 702B-MoE модель, полностью обученную с нуля на корпусе в 14 триллионов токенов. Это не адаптация и не дообучение зарубежных весов: у модели собственный датасет, собственный пайплайн синтетики и переработанная архитектура. На русскоязычных и STEM-бенчмарках Ultra-Preview уверенно превосходит российские opensource-аналоги, а также лучше DeepSeek V3.1.
Контекст запоминания — до 128k токенов.
Также в opensource доступна версия Lightning — компактная 10B-MoE модель, которая по скорости инференса конкурирует с Qwen3-1.7B и приближается по качеству к dense-моделям около 8B. Открыта и GigaAM-v3 — набор из пяти моделей для работы с аудио на русском. Отлично распознает речь — показывает −50% WER к Whisper-large-v3.
Открытая линейка GigaChat фактически формирует новую открытую экосистему для разработки, генерации и автоматизации — и делает это именно как самостоятельная архитектура, а не продолжение чьих-то решений.
https://habr.com/ru/companies/sberdevices/articles/968904/
90 793
Помните стартап Prime Intellect? Ребята занимаются децентрализованным обучением и на днях впервые выпустили конкурентоспособную модель Intellect-3
Прошлая версия модели вышла в мае и была занятной, но не на уровне frontier.
Теперь же по бенчмаркам Intellect-3 опережает GLM-4.5 и DeepSeek-R1-0528, а по математике вообще достигает SOTA в своем размере (она 106B MoE).
Что интересно: для RL-обучения использовался асинхронный RL-фреймворк prime-rl. С инженерной точки зрения это очень сложный процесс и PRIME единственные, кто сейчас таким занимаются. Но успех модели в целом доказал, что он работает. Prime-rl уже выложили в опенсорс, так что кому интересно, покапаться в нем можно здесь.
Репорт | HF | Блог
90 793
Google поздравили всех с Днем Благодарения и выпустили app.new
Это вайбкодинг тулза для создания полноценных веб-приложений по запросу. Просто вводите промпт – агент тут же прототипирует и разворачивает то, что вы хотите.
Короче, просто еще одна забавная обертка для Gemini.
Самое прикольное здесь – пасхалка в названии. У Google есть docs.new, sheets.new и slides.new, meet.new. Но это не ИИ-сервисы, а просто короткие ссылки для быстрого создания новой презентации/таблицы/документа. В этом смысле app.new как бы продолжает линейку и быстро «открывает» для вас приложения 💡
app.new
90 793
Эти инструменты ускорят вашу разработку 😎
Какие именно — узнайте на AI DevTools Conf.
4 декабря команда Cloud.ru проводит практическую конференцию про внедрение AI в процесс разработки.
В программе доклады и воркшопы, где вы научитесь: ➡️внедрять AI-инструменты в разработку качественно и безопасно ➡️собирать AI-агента за несколько минут ➡️управлять уязвимостями ➡️и не толькоА еще вас ждут демозона сервисов для работы с AI&ML, нетворкинг с экспертами и крутое afterparty 💚 Не пропустите
90 793
Прошел интересный слух, что в 2026 Nvidia больше не будет продавать партнерам память
То есть вместо того, чтобы поставлять кристалл в комплекте с микросхемами GDDR‑памяти, компания теперь будет отправлять партнерам только сам чип.
Производители будут вынуждены самостоятельно закупать VRAM у Samsung, Micron, SK Hynix и др.
Причина все та же: острая нехватка памяти. Все что есть перенаправляют на строительство датацентров для ИИ, а для игровых видеокарт делиться памятью Nvidia уже невыгодно.
Чем это грозит конечному потребителю, довольно очевидно: рост цен и дефицит отдельных моделей видеокарт 😞
90 793
+2
⚡️ Вышел DeepSeek-Math-V2
С релиза первой версии прошло почти два года. Новую уже никто и не ждал, но релиз, как это часто бывает в случае с DeepSeek, наступил внезапно.
Сразу кратко о результатах:
– Уровень золотой медали на IMO 2025 и CMO 2024 (Chinese Mathematical Olympiad)
– Почти идеальный результат 118/120 на Putnam 2024. Это сверхсложная математическая олимпиада для студентов университетов США и Канады.
– Бенчмарков мало, нет ни MATH, ни GSM8K, ни AIME, вообще почти ничего. Это странновато, но можно пока посмотреть на сравнения с другими моделями на IMO-ProofBench. Видно, что модель довольно уверенно бьет GPT-5 и на сложных задачах выходит на уровень с Gemini 2.5 Pro. Опять же, интересно, что там с Gemini 3, Grok 4 и GPT-5.1.
Теперь заглянем под капот.
Система основана на DeepSeek-V3.2-Exp-Base. Пайплайн состоит из генератора и верификатора.
Доказательство или решение формируется не за раз, а в результате нескольких проходов и улучшений: большая модель генерирует решение -> оно отправляется в модель-верификатор, где тщательно проверяется каждый шаг и ищутся ошибки -> обратная связь от верификатора возвращается генератору -> так доказательство переписывается и улучшается до 16 раз.
При этом в каждой итерации используются и проверяются сразу несколько (до 64) гипотез и вариантов решения. Получается сотни прогонов для одной задачи. Такое вот умное структурированное масштабирование test-time компьюта.
Сколько стоило решение олимпиады не раскрывают, но видимо немало. Судя по всему, поэтому результатов по бенчмаркам и нет: денег не хватило 😭
Веса | Статья | Репозиторий
90 793
Статья от команды Qwen взяла награду Best Paper Award на NeurIPS 2025
Работа называется "Gated Attention for Large Language Models: Non-linearity, Sparsity, and Attention-Sink-Free". В ней исследователи предложили новый вид механизма внимания – gated attention.
Суть в том, что на выход каждой attention-головы мы добавляем сигмоидную шторку, которая масштабирует аутпуты.
Фактически, из Attention → Output мы делаем Attention → Sigmoid-gate × Output.
Причем гейт – это обучаемый блок. Интуитивно, гейт учится понимать, насколько голова полезна в конкретном случае, и насколько, следовательно, нужно усилить или заглушить ее сигнал.
В целом хак небольшой, но оказывается, что прокачивает и стабильность обучения, и итоговое качество. А еще помогает избегать залипания внимания на первых токенах и деградации способностей при увеличении контекста.
Короче, работа правда достойная (почитать можно здесь). Так что поздравляем Qwen с очередным успехом.
90 793
В честь пятилетия AlphaFold Google впервые выложили в бесплатный доступ фильм про DeepMind
Картина называется The Thinking Game, наверняка кто-то из вас ее уже смотрел. Фильм вышел летом 2024, но до этого дня был доступен только на платных площадках.
Сегодня, в честь 5-летия AlphaFold, Google впервые бесплатно выложили его на YouTube.
Документалка снималась с 2019 и рассказывает о Демисе Хассабисе, основателе и CEO DeepMind, его команде и ключевых моментах разработки легендарных систем вроде AlphaGo, AlphaZero и AlphaFold.
100% советуем к просмотру: https://youtu.be/d95J8yzvjbQ?si=J2bM_WyGfAnLvGSI
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
