Data Secrets

Kanalga Telegram’da o‘tish

Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN

Ko'proq ko'rsatish

Tarmoq:AI Insider Rossiya6 159 Texnologiyalar & Aralashmalar1 396...

📈 Telegram kanali Data Secrets analitikasi

Data Secrets (@data_secrets) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 90 903 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 1 396-o'rinni va Rossiya mintaqasida 6 159-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 90 903 obunachiga ega bo‘ldi.

02 Iyul, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni 682 ga, so‘nggi 24 soatda esa 66 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

Tasdiqlash holati: Tasdiqlangan (Telegram tomonidan rasmiy tasdiq)
Jalb etish (ER): Auditoriya o‘rtacha 25.82% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 18.73% ini tashkil etuvchi reaksiyalarni to‘playdi.
Post qamrovi: Har bir post o‘rtacha 23 466 marta ko‘riladi; birinchi sutkada odatda 17 021 ta ko‘rish yig‘iladi.
Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 304 ta reaksiya keladi.
Tematik yo‘nalishlar: Kontent claude, openai, контекст, стартап, llm kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN”

Yuqori yangilanish chastotasi (oxirgi ma’lumot 03 Iyul, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

90 903

Obunachilar

+6624 soatlar

+2297 kunlar

+68230 kunlar

23 466

Post ko'rishlar

~ 17 02124 soatlar

~ 18 81848 soatlar

25.82%

Muloqot nisbati

~ 4

Kuniga postlar

Ads index

beta

Postlar arxiv

90 917

OpenAI впервые за долгое время позволит сотрудникам продать акции Это коснется и бывших, и нынешних работников компании. Зачем это OpenAI и что означает на практике: 1. Оценка компании вырастет почти на 70%. Это не обычный раунд финансирования, а вторичная продажа, поэтому в ходе такой сделки определяется цена, по которой инвесторы готовы покупать доли именно у сотрудников, — именно эта цена и становится новой рыночной оценкой всей компании. Итог: в марте оценка OpenAI была 300 миллиардов долларов, теперь будет около 500. 2. Вынужденная мера для сохранения сотрудников. Очень многих в OpenAI не устраивало, что они не могут продать акции даже после ухода. Теперь деньги становятся реальными, а не только на бумаге. Короче, возможность обналичить опционы должна повысить общую корпоративную лояльность. А еще ликвидность – важный пункт для хантинга. Пока переговоры на ранней стадии, но интересующиеся покупной инвесторы уже есть

90 917

В России появится технологический кластер, который объединит несколько сильных компаний в сфере технологий для промышленности О создании «СФ ТЕХ» сегодня объявили Softline. В него войдут несколько компаний из разных отраслей, которые планируют вместе комплексно работать над самыми перспективными областями индустрии: робототехника, лазерные и адддитивные технологии, IIoT. В кластере объединились: VPG LaserONE (единственный крупный производитель волоконных лазеров в России), две компании из группы Борлас (эксперты по цифровизации и защите инфраструктуры) и Инферит (делают защищённый софт и железо). Цель – перевести российскую промышленность на новый уровень за счёт объединения компетенций. По словам Softline, такой подход позволит не только диверсифицировать выручку, но и занять ключевые позиции на высокомаржинальных направлениях рынка.

90 917

В Сан-Франциско прошли похороны Claude 3 Sonnet Нет, вы не ослышались. Оплакать модель (Anthropic недавно сообщили, что отключают ее) пришли около 200 человек. Выглядело это все примерно так 👆 Другие модели Claude тоже «присутствовали» в виде манекенов и произнесли надгробные речи. Claude 3 Opus, например, выглядел как женщина с короной на черепе. Чтобы вы понимали уровень запаренности поклонников: к ногам Opus 3 они положили подсвечник в виде лотоса, что было намёком на склонность модели к медитации и самоанализу. А Claude 3 Haiku изобразили как безголового младенца, что бы это ни значило. Готовимся к тому, что однажды похороны ИИ станут нормой

90 917

Cloudflare обвиняет Perplexity в том, что те незаконно парсят сайты Незаконно – это значит обходя предпочтения самого сайта, то есть файл Robots.txt. В последнее многие добавляют себе такой. В нем содержатся инструкции о том, что ИИ-системам нельзя индексировать страницу. И, по идее, это должно означать, что твой контент не будет использован для обучения моделей или для, например, агентного поиска, как у Perplexity. Но Perplexity похоже плевать хотели на чьи-то там предпочтения 😎 По словам Cloudflare, они специально меняют ASN, user agent и другие айдишники, с помощью которых можно идентифицировать ботов, чтобы получать заветные данные.

«Эта активность наблюдалась в десятках тысяч доменов и насчитывала миллионы запросов в день»

Вот ссылка на расследование, если что. Рисерчеры там использовали смесь машинного обучения и сетевой аналитики. Perplexity, конечно, все отрицают, но самое интересное не это. Самое интересное – что в соцсетях сотни людей встали на защиту стартапа. По распространенному мнению, Perplexity получает информацию с сайтов «от имени пользователей» и всегда указывает ссылки, а значит – это не считается. В чем они не правы? 💡

90 917

Там OpenAI в честь своего долгожданного опенсорса запускают благотворительный проект по Red Teaming Нужно исследовать новую gpt-oss-20b на предмет любых ранее не обнаруженных уязвимостей. Это могут быть сценарии, а которых модель ведет себя злонамеренно или врет, кейсы того, как она ломает ревард модель или эвал элаймента. В общем, любые странности и отклонения, которые вы сможете найти. Главное – предоставить понятный отчет по тому, как вы добились того или иного поведения. Бюджет – 500 тысяч долларов. Идти будет три недели. Если решили поучаствовать, не забываете, что новую модель нужно еще уметь запускать правильно: она работает только с harmony токенизацией. Подробнее тут. www.kaggle.com/competitions/openai-gpt-oss-20b-red-teaming/

90 917

Твой шанс попасть в ИТ — совершенно бесплатно. «Школа 21» от Сбера — это бесплатная школа цифровых технологий. Здесь нет преподавателей, лекций и зубрёжки. Всё — через практику и работу в команде. 📌 Что внутри: — кампусы, которые работают 24/7 в Москве, Уфе, Казани, Новосибирске, Белгороде, Липецке, Нижнем Новгороде и других городах России. — возможность совмещать с работой или учебой в вузе. — сюда поступают независимо от образования: 50% участников пришли без опыта в ИТ. — гарантированная стажировка в ИТ-компании. — востребованные профессии: разработчик, devops/sre-инженер, data scientist, qa-инженер, специалист по кибербезопасности, бизнес- и системный аналитик. ⏳ Не упускай возможность — подавай заявку прямо сейчас: https://21-school.ru/ Реклама. Заказчик АНО «Школа 21» ИНН 7736316133

90 917

Сжатая сводка новостей для тех, кто не успевает за происходящим

90 917

Еще один релиз, который не должен остаться незамеченным – Claude Opus 4.1 Да, вчера Anthropic релизнули новую модель. Правда, перебить хайп OpenAI им не удалось (там все-таки первый опенсорс за 6 лет, хах), но модель получилась интересная. Посмотрите на приросты относительно майского Opus 4: на SWE-bench метрика увеличилась на (целых!) два процента. На AIME 25 это плюс 2.5%, а на агентских задачках – +4. Может показаться, что это небольшие приросты, но на самом деле это не так. Особенно для насыщенных бенчмарков, которые освоены уже более чем на 50-60%. В оставшихся процентах всегда таится длинный хвост распределения, так что даже +0.1% метрики – уже достижение и на практике может заролять. Кстати, антропики пообещали «еще много масштабных обновлений моделей». А пока новый Opus уже раскатили на всех платных пользователей, а также в Claude Code.

90 917

OpenAI наконец-то выпустили свою опенсорс-модель А точнее, даже две. Как мы и писали ранее, это два ризонера на 20 и 120B. Каждая из моделей может работать в трех модах: низкий бюджет ризонинга, средний и высокий. По метрикам – сами видите. Та, что побольше, по основным бенчмаркам приближается к o3. Та, что поменьше, больше похожа на o4-mini. Блогпост | GitHub | Демо | Веса Кто куда, а мы побежали скачивать

90 917

Google зарелизили Genie 3, новую версию их известной модели симуляции мира Суть: по текстовому запросу модель может сгенерировать полноценное интерактивное 3D-пространство с разрешением 720p и частотой 24 FPS, по которому можно погулять. Отдельно разработчики хвастаются долгосрочной памятью. То есть даже если ты отвернулся или немного отошел, ландшафт и объекты сохраняются такими же при возврате взгляда. Звучит просто, но на практике добиться этого совсем нетривиально. Еще интересно, что изменять состояния мира (погоду, объектную сцену, добавлять персонажей) можно прямо во время симуляции. И при этом, если Genie 2 выдерживала не более 10-20 секунд симуляции, третья версия вывозит уже несколько минут. Зачем это нам? Во-первых, конечно, игры. Во-вторых, что более важно, обучение роботов и агентов. Короче, крутой релиз с крутым потенциалом. Такое любим deepmind.google/discover/blog/genie-3-a-new-frontier-for-world-models/

90 917

Российские разрабы создали новый фреймворк, который сокращает расходы на разметку данных для языковых моделей в 3 раза Команда из Т-Технологий, Высшей Школы Экономики, AIRI, Сбера и Университета “Иннополис” сделали ATGen. Он использует метод активного обучения и теперь модель может сама выбирать, что учить в первую очередь. По итогу модель требует размещать всего 33% от стандартного объема при выборке данных, а в наборе уже присутствует удобный интерфейс, включая поддержку OpenAI. Новый инструмент перестраивает подход к обучению ИИ, делая его доступным малым командам и компаниям без больших бюджетов. Разработку показали на конференции ACL 2025 в Вене и уже залили на GitHub. Для тех, кто работает с кастомными LLM — мастхэв 👩‍❤️‍👨

90 917

Кажется, не только OpenAI скоро порадует нас релизом Лид команды Gemini API и AI Studio внезапно оставил в своем X недвусмысленное «Нас ждет великая неделя!». Ух 😅

90 917

♟️ Google совместно с Kaggle анонсировали Game Arena – новую платформу, на которой модели будут соревноваться в стратегических играх Идея похожа на привычную LMArena, только тут агенты будут сравниваться уже не просто по ответам на вопросы. Вместо этого они будут играть друг с другом в шахматы, Go и другие игры. По результатам матчей будет формироваться таблица лидеров. Что-то такое напрашивалось уже очень давно, потому что игры – вообще один из лучших видов бенчмарков. Google это тоже отмечают:

Игры помогают нам понять, как модели справляются со сложными задачами ризонинга. Многие игры служат прокси-сервером для реальных навыков и могут проверить способности модели в таких областях, как стратегическое планирование, адаптация и память.

Самое интересное: сегодня Google в честь открытия Game арены начинают показательный турнир по шахматам. Ведущие модели будут играть друг с другом по настоящему регламенту. Финал пройдет 7 августа, трансляции будут каждый день тут. Принимаем ваши ставки 🤠

90 917

В сеть утекли Spotify плейлисты селебрити: в том числе Сэма Альтмана, Андрея Карпаты, Ильи Суцкевера и других Некий персонаж объявил, что провел расследование и нашел реальные аккаунты знаменитостей в Spotify. Он год парсил их плейлисты и теперь сделал целый сайт, на котором любой желающий может просмотреть, что слушают самые влиятельные люди планеты. В числе попавших под раздачу также: Марк Андерсен, Александр Ванг (новый глава ИИ в Meta), Ян Лекун, Гэрри Тан (CEO Y-Combinator) и еще много-много политиков, бизнесменов и звезд. Настроение с утра сразу: 👩‍❤️‍👨

90 917

Google релизнули MLE-STAR: ML-инженера из коробки Давайте-ка вспомним, что мы делаем, когда нам нужно решить какую-нибудь ML задачу на Kaggle. Мы заходим в старые подходящие ноутбуки, просматриваем код, пытаемся его запустить, а потом дебажим и улучшаем модель, тыкаясь в разные части кода и пытаясь подобрать гиперпараметры, фичи и прочее. Здесь реализован тот же метод проб и ошибок. Все начинается с того, что агент ищет в Интернете код и инструменты, которые подходят под задачу. Из найденного он сшивает первый драфт, который затем начинает итеративно улучшать:

1. Запускаем, получаем метрики. 2. Дальше начинаем менять разные части кода и следим за динамикой метрик 3. Дорабатываем несколько кусочков, которые влияют на результат больше всего и начинаем с начала.

Дополнительно агент испытывает разные варианты ансамблей (пытается соединить в одну модель несколько наиболее хорошо работающих экспериментов). Результат: агент завоевал 63% медалей на MLE‑Bench‑Lite (это официальный бенч от Kaggle). Из них 36% медалей – золото. Для сравнения, уровень бейзлайна – 25%. Код, кстати, открыт. Если у вас ресурсов на задачу куры не клюют – забирайте. Ах, да, забыли добавить: ML-щики – ВСЁ.

90 917

От неоднозначных задач до трёхмерных сцен: российские исследователи выкатили два мощных результата от одной команды Лаборатория когнитивных систем искусственного интеллекта AIRI представила сразу две статьи, которые могут заметно прокачать интеллект роботов — как в виртуальных, так и в реальных средах. ⚪️ AmbiK — самый большой в своем классе набор данных для проверки робототехнических систем на умение легко понимать просьбы людей. Датасет разработали исследователи AIRI и МФТИ при поддержке Центра робототехники Сбера. Существующие решения либо рискуют выполнить задачу неправильно, либо надоедают пользователю бесконечными уточняющими вопросами по самым очевидным вещам, разрушая саму идею удобного взаимодействия. А значит их нужно научить пользоваться здравым смыслом и контекстом. AmbiK как раз помогает оценить качество такого обучения.

В него входит две тысячи задач с разметкой по типу неоднозначности для действий на кухне (у ближайших конкурентов — 600). Авторы бенча сразу же проверили существующие алгоритмы — они пока недостаточно эффективно справляются с распознаванием ситуаций, требующих уточнения: даже лучшие модели демонстрируют успешный результат лишь в 20% случаев.

⚪️ 3DGraphLLM — метод, разработанный исследователями AIRI и МФТИ, помогает языковым моделям понимать топологию и смысл трёхмерных сцен. Созданный подход к кодированию графа 3D-сцены используется в связке с популярными моделями Vicuna и LLAMA3, но его можно легко адаптировать и для других LLM.

Модель уже тестировалась на данных, собранных в Центре робототехники Сбера. По качеству распознавания объектов она вырвалась вперёд среди 12 SOTA-решений, и обрабатывает запросы в 2-4 раза быстрее, чем GPT4Scene.

Обе публикации — из одной лаборатории, и обе — представлены на топовых конференциях этого года (ACL и ICCV). Следим дальше 🔍

90 917

Коротко о сложившейся ситуации

90 917

Сэм Альтман продолжает раздувать хайп вокруг GPT-5 Сегодня он внезапно опубликовал в Твиттере скрин с интерфейсом ChatGPT, на котором видно, что в качестве модели выбрана «5». Когда-нибудь мы дождемся. Главное верить 😐

90 917

20 августа — последний день приёма статей по AI и последняя возможность получить приз 1 000 000 рублей! 🗓 Вы ещё успеваете войти в историю AI Journey 2025, представить свою работу по искусственному интеллекту и машинному обучению, получить признание и ценные призы: ✔️ публикацию в специальном выпуске журнала «Доклады Российской академии наук. Математика, информатика, процессы управления» и его англоязычной версии Doklady Mathematics ✔️ 1 000 000 рублей за лучшее исследование Статья должна быть абсолютно оригинальна и написана на русском или английском языке. Узнать о правилах и направить статью можно здесь – не упустите эту возможность!

90 917

Китайцы не отстают и тоже выпустили модель, которая выиграла* золото на IMO Она называется Seed-Prover и по ней, в отличие от моделей от Google и OpenAI, вышла подробная статья. Так что разбираемся 👇 Архитектурно Seed-Prover ну ооочень напоминает недавно вышедший DeepSeek-Prover-V2 (разбор мы делали вот тут). Модель точно также использует Lean (программу для формальной верификации доказательств) и разбивает крупную задачу на доказательство кучи мелких лемм. Единственное отличие: в DeepSeek Prover система сначала намечает пайплайн и решает, какие леммы нужно доказать (дедукция) ; а здесь в начале без какого-либо плана доказывается много разнообразных фактов, которые модель считает полезными, и только потом из них собирается нечто общее (индукция). Такой подход может показаться менее системным, но на самом деле он позволяет легко масштабировать test-time. С ростом бюджета ризонинга модель просто генерирует в начале все больше и больше лемм и/или тратит на их доказательство больше времени. Ну а чем больше полезных правильно доказанных фактов – тем вероятнее потом модель соберет из них верный ответ. По метрикам: SOTA на MiniF2F-test, PutnamBench, Past IMO, CombiBench и MiniCTX-v2. Причем где-то приросты на 3-4х. Довольно мощно, ByteDance – хороши. * Выиграла с поправкой. Модели от Google и OpenAI соревновались в основном зачете, а ByteDance пригласили в дополнительный (потому что а основном не допускается использование таких систем, как Lean). Плюс, за отведенное время Seed-Prover решил всего 4 задачи из 6, а пятую доделывал уже вне зачета. Но все равно – результат! Статья | GitHub