Data Secrets

رفتن به کانال در Telegram

Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN

نمایش بیشتر

شبکه:AI Insider روسيا6 172 فناوری و برنامه‌ها1 410...

📈 تحلیل کانال تلگرام Data Secrets

کانال Data Secrets (@data_secrets) در بخش زبانی روسی بازیگری فعال است. در حال حاضر جامعه شامل 90 762 مشترک است و جایگاه 1 410 را در دسته فناوری و برنامه‌ها و رتبه 6 172 را در منطقه روسيا دارد.

📊 شاخص‌های مخاطب و پویایی

از زمان ایجاد در невідомо، پروژه رشد سریعی داشته و 90 762 مشترک جذب کرده است.

بر اساس آخرین داده‌ها در تاریخ 28 ژوئن, 2026، کانال فعالیت پایداری دارد. در ۳۰ روز گذشته تغییر اعضا برابر 555 و در ۲۴ ساعت گذشته برابر 15 بوده و همچنان دسترسی گسترده‌ای حفظ شده است.

وضعیت تأیید: تأیید شده (به صورت رسمی توسط تلگرام)
نرخ تعامل (ER): میانگین تعامل مخاطب 26.10% است و در ۲۴ ساعت نخست پس از انتشار، محتوا معمولاً 19.13% واکنش نسبت به کل مشترکان کسب می‌کند.
دسترسی پست‌ها: هر پست به طور میانگین 23 687 بازدید دریافت می‌کند. در اولین روز معمولاً 17 362 بازدید جمع‌آوری می‌شود.
واکنش‌ها و تعامل: مخاطبان به‌طور فعال حمایت می‌کنند؛ میانگین واکنش به هر پست 314 است.
علایق موضوعی: محتوا بر موضوعات کلیدی مانند claude, openai, контекст, стартап, llm تمرکز دارد.

📝 توضیح و سیاست محتوایی

نویسنده این فضا را محل بیان دیدگاه‌های شخصی توصیف می‌کند:
“Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN”

به لطف به‌روزرسانی‌های پرتکرار (آخرین داده در تاریخ 29 ژوئن, 2026)، کانال همواره به‌روز و دارای دسترسی بالاست. تحلیل‌ها نشان می‌دهد مخاطبان به‌طور فعال با محتوا تعامل دارند و آن را به نقطه اثرگذاری مهم در دسته فناوری و برنامه‌ها تبدیل کرده‌اند.

90 762

مشترکین

+1524 ساعت

+1847 روز

+55530 روز

23 687

نمایش های پست

~ 17 36224 ساعت

~ 19 13848 ساعت

26.10%

نرخ مشارکت

~ 4

پست های در روز

Ads index

beta

آرشیو پست ها

90 765

Самая внезапная новость за неделю: Zoom (да, тот самый) выбил со своей моделькой SOTA результат на Humanity’s Last Exam Со скором 48.1% они опередили предыдущего лидера – Gemini 3 Pro (+tool) – почти на 3 процентных пункта. Но вообще, хотя и результат объективно крутой, надо заметить, что говорить о таком сравнении не очень честно. У Zoom не одна модель, а хитрый ансамбль, или точнее федеративная AI-система. Несколько моделей (включая собственные от Zoom + партнерские от Meta, OpenAI и Anthropic) работают в пайплайне: маршрутизируют задачи, генерируют варианты ответов, проверяют, критикуют друг друга и объединяют результаты. https://www.zoom.com/en/blog/humanitys-last-exam-zoom-ai-breakthrough/

90 765

Google выпустили статью про SIMA-2. Оказалось, что агент способен на самообучение. SIMA-2 – это ИИ-агент для игр. Первая его версия вышла примерно полтора года назад, вторую релизнули в ноябре, но статью выложили только сейчас. Апгрейднули SIMA-2 относительно первой SIMA довольно сильно: теперь модель способна рассуждать и генерализоваться на новые игры, а не просто механически выполнять какие-то действия. Особой магии под капотом нет – по сути, это дотюненная на игровые действия Gemini Flash-Lite. В статье, конечно, много занятных деталей про обучение, но самое интересное, на наш взгляд, спрятано в разделе про self-improvement. Исследователи попробовали поместить агента в совершенно новую для него игру ASKA, не дали никаких инструкций или человеческих демонтраций, и запустили процесс самоулучшения. Агент (внутри которого, напоминаем, сидит LLM) был сам себе тестировщиком, исполнителем и reward-моделькой. Один экземпляр Gemini – Task setter – придумывал задачку нужного уровня -> SIMA пробовал ее исполнять -> другой экземпляр Gemini оценивал успех -> на основе этого фидбэка обновлялась политика -> и так много-много итераций с постепенным усложнением задач. В итоге в игре, которую агент никогда не видел, дообученная таким образом система превзошла не только исходную SIMA-2, но и человека! И это буквально полностью автономное обучение на основе собственного опыта. Какой-то RL-v2 Советуем почитать полностью: arxiv.org/pdf/2512.04797

90 765

Google обновили агента Gemini Deep Research: теперь он работает на базе Gemini 3 и выбивает 46.4% на HLE Систему дотюнивали с помощью многоступенчатого RL, чтобы она точнее искала и меньше галлюцинировала на сложных запросах. В итоге на Humanity’s Last Exam скор относительно Gemini 3 Pro вырос на три процентных пункта, а на внутреннем бенчмарке DeepSearch QA – на десять. Этот внутренний бенчмарк, Google, кстати, опенсорснули (www.kaggle.com/benchmarks/google/dsqa). P.S. На графике обратите внимание, что GPT-5 Pro специально гоняют в несколько потоков (именно так из коробки работает Deep Research у Google и OpenAI), чтобы сравнение было честным.

90 765

Сегодня OpenAI исполняется ровно 10 лет О создании компании было объявлено 12 декабря 2015 года. Начальный бюджет – 1 миллиард долларов – был собран небольшой группой инвесторов-энтузиастов. Вот оригинальный блогпост, а еще в честь праздника компания выпустила видео ⬆️ В 2015 алгоритмы еще плохо отличали кошечек от собачек, и люди не верили, что машина когда-нибудь сможет заговорить. А сегодня ИИ уже неотъемлемая часть жизни и работы, а стартап Альтмана оценивается в 500 миллиардов долларов. Но ChatGPT вышел только в 2022. А чем компания занималась до этого? Давайте вспомним: – OpenAI Gym (2016). Платформа для тестирования алгоритмов ИИ в симулированных средах. Она очень быстро стала тогда стандартом в исследованиях. Следом вышел Universe – инструмент для обучения агентов взаимодействию с реальными программами и играми. – OpenAI Five (2018). Ботов обучили играть в Dota 2 с помощью PPO. В итоге они обыграли топ-игроков мира, обучившись на 45 000 годах симуляций за 10 месяцев. – Robotic Hand (2018). Знаменитый проект, в котором робо-руку учили собирать кубик Рубика. Поздравляем: если вы знакомы с этими проектами – вы олд 👴. После них уже пошло-поехало: GPT-2 в 2019, GPT-3 в 2020, DALL-E и первый Codex в 2021, и ChatGPT в 2022. Короче, поздравляем компанию с юбилеем!

90 765

MWS Cloud запустила сервис по установке серверов с GPU в периметре предприятий Компания предлагает готовые серверы с графическими ускорителями прямо у вас на предприятии. Можно взять в аренду или купить — всё зависит от задач и бюджета. Что внутри: • Настройка и помощь с выбором конфигурации под ваши проекты; • Поддержка на всех этапах эксплуатации; • Развёртывание на площадке компании или в дата-центре MWS Cloud; • Доступны сервера с 7 видами GPU и более 20 конфигураций серверов. Идеально для промышленных, финансовых и медицинских компаний, которым нужен закрытый контур и соблюдение всех норм безопасности и законодательства. Подробнее: https://mws.ru/services/mws-gpu-on-prem/

90 765

Самый крутой скачок GPT-5.2 произошел, пожалуй, на ARC-AGI На ARC-AGI 1 модель достала 86.2% (GPT-5.1 берет 72.8%, Gemini 3 Pro – 75). Это серьезный рост. При этом GPT-5.2 Pro с повышенным уровнем ризонинга X-High скорит уже 90.5% при стоимости $11.64/задачу. Всего год назад сотой считалась нерелизнутая o3-High с результатом 90.5% и $11.64/задачу. Это означает, что за год эффективность выросла в 390 раз. На ARC-AGI 2 все еще интереснее. Там скачок произошел с 17.6 до 52.9%! Самый близкий по скору конкурент – Claude Opus 4.5 – выбивает всего 37.6%. Просто напоминаем, что между релизами GPT-5.1 и 5.2 прошел месяц 😐 GPT 5.2 Pro X-High точно скорит еще больше, но организаторы бенчмарка пишут, что пока не смогли достоверно проверить ее результаты из-за API timeouts. Средний уровень человека на ARC-AGI 2 – около 60%. Интересно, побьет ли.

90 765

⚡️ Вышла GPT-5.2 – Модель заметно прокачали в кодинге, математике и работе на длинных контекстах и с изображениями. На AIME 25 у нее теперь 100% (GPT-5.1 била 94), а на SWE-bench Verified – 80% (вместо 76.3 у 5.1). – По бенчмаркам OpenAI упрямо сравнивает свою модель только с ее же предыдущими версиями, игнорируя конкурентов. Но по уровню примерно Gemini 3 Pro, даже на несколько процентных пунктов выше на многих бенчах. – В ChatGPT GPT‑5.2 Instant, Thinking и Pro начнут катать уже сегодня, в API доступ открыт. Цена относительно 5.1 и 5 немного повысилась, см последний скрин. В целом OpenAI как будто действительно постарались на этот раз. Вот что конкуренция творит! https://openai.com/index/introducing-gpt-5-2/

90 765

Сэм Альтман, Дженсен Хуанг и другие ИИ-лидеры коллективно стали «Человеком года» по версии Time В этом году победителем номинации стал не один человек, а целая группа под названием «Architects of AI». В частности: Сэм Альтман, Дарио Амодеи, Демис Хассабис, Дженсен Хуанг, Фэй-Фэй Ли, Илон Маск, Лиза Су и Марк Цукерберг.

«2025 год стал годом, когда весь потенциал искусственного интеллекта проявился во всей своей полноте и стало ясно, что пути назад уже нет. За то, что эпоха думающих машин стала реальностью; за то, что поразили и встревожили человечество; за изменение настоящего и расширение границ возможного – человеком 2025 года Time стали архитекторы искусственного интеллекта»

Кстати, обложка сгенерирована или нам показалось? 🤨 time.com/7339685/person-of-the-year-2025-ai-architects/

90 765

⚡️ Яндекс выложил в открытый доступ техрепорт собственного семейства моделей Alice AI. В новой линейке моделей — базовая текстовая Alice AI LLM и специализированная LLM Search, мультимодальная Alice AI VLM и Alice AI ART для генерации картинок. Компания описала все этапы работы над обновленной Alice AI — от претрейна и инфраструктурных изменений до инференса. Значительные улучшения получили все модели в семействе, в первую очередь за счет собственных фреймворков и библиотек Яндекса. Среди самых интересных обновлений — подготовка к полноценной мультимодальности: настроена интеграция VLM с текстовой LLM за счет единых подходов RLHF. Также прокачаны навыки по решению сложных математических и геометрических задач, улучшено качество ответов по предметам школьной программы. VLM получила более качественный OCR и может работать с большим качеством изображений, а LLM дает более точные ответы за счет улучшения подготовки данных. Инфраструктурные изменения дали более высокую скорость ответа и возможность тренировать MoE-модели с сотнями миллиардов параметров.

90 765

Итак, получается, что в 2026-2027 на IPO выходят OpenAI, Anthropic и SpaceX. Чьи акции покупаем?

Anonymous voting

90 765

SpaceX готовится к IPO: теперь основная цель компании – строительство датацентров в космосе

90 765

Тем временем новую Gemini 3 Flash заметили в Cursor Интересно, что модель помечена как thinking. Предыдущая Gemini 2.5 Flash была без ризонинга. Ждем релиз сегодня?

90 765

Хотите обзор самого главного в ИИ за этот год? Вот прям всю мякотку: от хардкорного ML / ИИ в разработке до взгляда на ИИ от бизнеса. от тех же ребят, что сделали AI Dev Live (одна из крупнейших ИИ-конф, 3к+ участников). В программе: - Сдвиг парадигмы в управлении процессами, который все пропустили - Как в 2026 бизнесу отличить: где ИИ-фанатизм со сливом бюджета, а где ИИ-инструменты с реальной ценностью? - Почему одних разрабов ИИ бустит, а другие плюются от багов? Как укротить агентов и получать production-ready код от ИИ? - RAG мертв? Почему enterprise уходит от векторных баз к агентам, куда движется индустрия LLM-провайдеров и какое место у локальных AI-решений? - Кого и как нанимать в 2026 году? И, самое главное, что изучать, чтобы не уволили вас? В общем, шикарная солянка контента от экспертных спикеров: парочка Head of AI, руководитель AI R&D-института, фаундеры и ко-фаундеры AI-first компаний: самый лучший состав, чтобы рассказать про ИИ со всех ракурсов. ⚡️ Вот ссылка для записи на предновогодний эфир (все еще можно бесплатно!) Реклама. ИП Шейко Н.Е., ИНН 540131220129, erid 2VtzpxGT4JZ

90 765

nanoGPT от Андрея Карпаты стала первой в мире LLM, обученной и запущенной в космосе Мы уже несколько раз рассказывали вам о стартапе Starcloud. Они занимаются строительством космо-датацентров и к 2030 году планируют вынести на орбиту аж 5 гигаватт железа. В начале ноября они запустили в космос первую в истории видеокарту H100 – на спутнике размером с холодильник. Сначала сообщалось, что на ней планируется тюнить Gemma, но сегодня Starcloud рассказали, что вместо этого обучили целую модель с нуля! Они взяли nano-GPT – минималистичную реализацию GPT на PyTorch от Андрея Карпаты, – обучили ее на полном собрании сочинений Шекспира и успешно запустили инференс! Gemma, кстати, тоже запускали, но только предзагруженную.

90 765

Уже пару дней все говорят о том, что на этой неделе нас ждут сразу две новые модели Первая – GPT-5.2. Да-да, всего через месяц после GPT-5.1 (она же Shallotpeat, о которой мы писали здесь). Помните, Альтман когда-то говорил, что после выхода GPT-5 путаницы с версиями больше не будет? Ну так вот… Вторая – Gemini 3 Flash, тут все ожидаемо. Одна из них, судя по всему, должна выйти уже завтра. Вторая – на следующей неделе. 🎄

90 765

В Пентагоне появится подразделение для подготовки к AGI Создание так называемого «Руководящего комитета по будущему искусственного интеллекта» утверждено в новом Национальном оборонном акте. Комитет должен быть создан не позднее 1 апреля и будет заниматься оценкой возможных военных последствий AGI. Кроме того, в задачи комитета входит анализ ИИ-политики других стран (в первую очередь Китая) и формирования стратегий на случай Скайнета 😮‍💨

90 765

«Норникель» выложил в опенсорс доменную модель MetalGPT-1 Она интересна тем, что обучена на данных, которые обычно не циркулируют в открытой среде. Это всякие технологические регламенты, протоколы, НИОКР, проектная документация из области металлургии и гордобычи. Объем – примерно миллион текстов. Размер самой модели – 32В, не маленькая. На ее основе компания уже строит ассистентов и автономных агентов, которые встраиваются непосредственно в узкие операционные процессы. Архитектура типовая, но из-за того, что модель обучена на корпусе, которого веб никогда не увидит, разрыв в качестве на доменных задачах большой. В этом смысле открытые веса тут почти декоративны: без данных такое все равно не воспроизвести. В ближайшем будущем у компаний будет появляться все больше таких доменных моделей, и рынок в каком-то смысле может даже разделиться по этому признаку. Веса

90 765

Mistral выпустили опенсорсного CLI агента для кодинга Mistral Vibe Это утилита с интерфейсом командной строки, которая выполняет все функции обычного агента для кодинга (меняет, пишет, тестит код и тд). Лицензия Apache 2. Установить можно с помощью команды: uv tool install mistral-vibe Любителям терминала должно зайти. Под капотом – новая моделька стартапа Devstral 2. Она вышла в двух размерах: 123В и 24В. Все тоже в опенсорсе. По метрикам старшая модель примерно на уровне DeepSeek-V3.2 и Kimi K2 Thinking, то есть довольно неплохо. mistral.ai/news/devstral-2-vibe-cli

90 765

⚡️ Anthropic передали права на MCP в Linux Foundation Они вместе с OpenAI и Block основали Agentic AI Foundation (AAIF) – целевой фонд под эгидой Linux Foundation, чтобы продвигать открытые стандарты для агентного ИИ. Linux Foundation – это некоммерческая организация, которая обеспечивает нейтральное управление открытыми проектами. Например, они хостят Kubernetes и Node.js. Все проекты, переданные в LF, независимо поддерживаются и контролируются организацией + интеллектуальная собственность тоже принадлежит сообществу. Смысл этого в том, чтобы избежать возможных монополий компаний. Anthropic задонатили в AAIF MCP (огромный смелый шаг!), OpenAI – AGENTS.md, а Block – фреймворк goose. Кстати, обязанности по финансированию теперь тоже лежат на Linux Foundation. Среди платиновых членов AWS, Bloomberg, Cloudflare, Google, Microsoft и другие. Каждый год каждый из них платит большие взносы, которые идут на поддержку и развитие проектов.

90 765

Новое исследование от Anthropic: как сделать так, чтобы все опасные знания хранились в модели отдельно от обычных И снова про элаймент! Уж очень занятный в этот раз стартап предлагает подход. Называется он Selective GradienT Masking. Погнали разбираться. Вообще, как такового элаймента на этапе претрейна не существует, все это добавляется уже после предобучения. А это довольно серьезный затык. Пока единственный вариант, до которого люди додумались – это просто выбросить из датасета "опасные знания", но это (1) оч дорого и долго, потому что требует разметки; (2) отсекает дополнительно и много полезных знаний, и модель тупеет. Так что – ерунда. А вот Anthropic предлагают сами данные не трогать, а вместо этого сделать так, чтобы вся опасная информация стекалась в отдельный кусок параметров, который затем можно просто... удалить. Работает это так:

– На каждый блок трансформера мы дополнительно надеваем голову внимания, которую помечаем, как "forget" параметры. – Если на вход попадают данные, которые помечены, как "опасные", мы насильно зануляем все градиенты, кроме "forget". Это гарантирует, что все опасные знания стекаются в определенное место. – Чтобы после модель могла хорошо работать без этих параметров, на части данных при прямом проходе им зануляют активации.

Как видите, это, по факту, та же самая фильтрация данных. Только умная. Во-первых, такой подход устойчив к шуму разметки. Во-вторых, метить все данные потенциально необязательно: выяснилось, что начиная с какого-то момента даже неразмеченное опасное содержимое датасета начинает тяготеть больше к "forget" параметрам. Это назвали эффектом Абсорбирования. При этом модель после вырезания этой вот черной душонки глупеет меньше, чем при вырезании данных из датасета. Все-таки здесь мы действуем немного деликатнее. Ну и ведет она себя после этого так, как будто ей действительно ничего подобного никогда не показывали, а не как будто она временно об этом забыла. В общем, на уровне механики и идеи – довольно интересный зачаток https://alignment.anthropic.com/2025/selective-gradient-masking/