Data Secrets

Ir al canal en Telegram

Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN

Red:AI Insider Rusia6 168 Tecnologías y Aplicaciones1 406...

📈 Análisis del canal de Telegram Data Secrets

El canal Data Secrets (@data_secrets) en el segmento lingüístico de Ruso es un actor destacado. Actualmente la comunidad reúne a 90 812 suscriptores, ocupando la posición 1 406 en la categoría Tecnologías y Aplicaciones y el puesto 6 168 en la región Rusia.

📊 Métricas de audiencia y dinámica

Desde su creación el невідомо, el proyecto ha mostrado un crecimiento acelerado, reuniendo a 90 812 suscriptores.

Según los últimos datos del 29 junio, 2026, el canal mantiene una actividad estable. En los últimos 30 días la variación de miembros fue de 589, y en las últimas 24 horas de 35, conservando un alto alcance.

Estado de verificación: Verificado (confirmado oficialmente por Telegram)
Tasa de interacción (ER): El promedio de interacción de la audiencia es 26.17%. Durante las primeras 24 horas tras publicar, el contenido suele obtener 19.15% de reacciones respecto al total de suscriptores.
Alcance de las publicaciones: Cada publicación recibe en promedio 23 760 visualizaciones. En el primer día suele acumular 17 384 visualizaciones.
Reacciones e interacción: La audiencia responde de forma activa: el promedio de reacciones por publicación es 314.
Intereses temáticos: El contenido se centra en temas clave como claude, openai, контекст, стартап, llm.

📝 Descripción y política de contenido

El autor describe el recurso como un espacio para expresar opiniones subjetivas:
“Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN”

Gracias a la alta frecuencia de actualizaciones (últimos datos recibidos el 30 junio, 2026), el canal mantiene la vigencia y un amplio alcance. La analítica demuestra que la audiencia interactúa activamente con el contenido, lo que lo convierte en un punto de referencia dentro de la categoría Tecnologías y Aplicaciones.

90 812

Suscriptores

+3524 horas

+2287 días

+58930 días

23 760

Visitas de la publicación

~ 17 38424 horas

~ 19 14148 horas

26.17%

Tasa de compromiso

~ 4

Mensajes por día

Ads index

beta

Archivo de publicaciones

90 816

Стартап Фей-Фей Ли выпустил свой первый коммерческий продукт – модель пространственного интеллекта Marble Ее релизнули сразу же после выхода эссе Фей-Фей о том, что пространственный интеллект – будущее ИИ (наш пост с пересказом). Внешне моделька очень напоминает Genie: по сути, 3D генератор миров, по которому можно передвигаться. Только у Marble фокус больше на персистентности. То есть если Genie генерирует динамическое видео, то здесь это генерация именно полноценного 3D-мира, в котором есть геометрия, объекты, ландшафт и прочее. Потом вы можете по нему передвигаться, но меняться или достраиваться он при этом не будет. Хотя можно поменять что-нибудь по промпту, расширить какую-то часть генерации или даже объединить два мира. И кстати, на вход принимаются почти любые модальности: текст, картинки, видео и 3D-драфты. Генерировать можно поэтапно: сначала создать 3D-скелет, и только потом добавлять стили и текстуры, подобно тому, как это делается в геймдеве. Ну и киллер-фича, на наш взгляд: созданные миры можно экспортировать как меши, Gaussian splats или как видео. Попробовать можно тут, дают сколько-то фри кредитов. Дальше тарифы начинаются от 20 долларов в месяц.

90 816

Новая статья от DeepMind: учим модели видеть, как люди Помните класическую детсткую игру "Найди лишнее"? Из нескольких картинок нужно вычеркнуть ту, которая выбивается из общего ряда, по английски называется odd-one-out. Так вот: авторы протестировали на этой игре несколько vision моделей и выяснили, что они далеко не всегда рассуждают, как люди. Это связано с тем, что модели, даже самые мощные, все еще видят мир иначе, нежели мы. Люди группируют объекты по смыслу, а модели – чаще по визуальным/текстурным признакам. Например, в задаче <морская звезда, кот, лиса> люди выбирают морскую звезду, потому что она живет в воде, а модели – кота, потому что картинка выделяется из цветовой палитры. Недостаток важный, потому что если модель не структурирует свой внутренний образ мира, как человек, ее решения могут быть алогичными и ненадежными. Что сделали в DeepMind: – Взяли большую visual модель, заморозили ее и искусственно пристроили небольшой адаптер, обученный только на датасете с человеческими ответами по odd-one-out. – Нагенерировали с помощью этой модели гигантский датасет с миллионами решений odd-one-out. – На основе этого большого датасета дообучали другие модели так, чтобы их внутренние представления стали ближе к человеческой логике группировки. То есть, вроде как, модельки просто натаскали на какую-то одну детскую игру, ничего удивительного. Но оказалось, что это качественно изменило их скрытое пространство. См. третий скрин: слева модель до элаймента, справа после. Видно, как появляются четкие кластеры, соответствующие человеческой логике (например, животные, еда и тд). Красота же? А еще такая модель оказалось более устойчивой с точки зрения изменения распределения. Например, если на картинках поменять фон, освещение или другие условия, ее ответы все еще остаются подвластными логике. В целом можно ожидать, что такая модель и генерализоваться будет быстрее обычной. deepmind.google/blog/teaching-ai-to-see-the-world-more-like-we-do/

90 816

Ваша утренняя газета, сэр ☕️ P.S. Автор оригинального твита утверждает, что это реальная пакистанская газета Dawn

90 816

OpenAI выпустили GPT-5.1 В обновленную линейку вошли даже две модели: GPT-5.1 Instant и GPT-5.1 Thinking. Instant – это версия для любителей теплых разговоров. После выхода пятерки огромная масса людей жаловалась на то, что модель стала холодной и «бездушной» и ностальгировали по GPT-4o. Вот OpenAI и добавили в GPT-5 щепотку ванильности. Теперь система лучше шутит, проще воспринимается, но может отвечать и более сдержанно, если это нужно пользователю. Thinking – это прокачанный ризонинг. Говорят, модель стала заметно лучше справляться с инструкциями и адаптироваться под сложность вопроса: быстро отвечает на простые и думает еще дольше над сложными. Старые модели еще три месяца будут доступны в разделе легаси. Новые раскатывают, как обычно, сначала на всех платных юзеров, потом на остальных. openai.com/index/gpt-5-1/

90 816

The New York Times требует от OpenAI доступ к 20 миллионам чатов пользователей На официальном сайте OpenAI сегодня появилось меланхоличное письмо под заголовком «The New York Times’ invasion of user privacy». В нем директор стартапа по информационной безопасности жалуется на то, что The New York Times покушается на безопасность пользовательских данных. Дело в том, что некоторое время назад The New York Times предъявила OpenAI иск: якобы компания без разрешения использует журналистские материалы для обучения моделей. Классика. Стартап, конечно, все отрицает. И поэтому теперь в рамках разбирательства издание, чтобы доказать свою правоту, требует доступ к «примерно 20 миллионам» случайно выбранных чатов юзеров за период декабрь 2022 – ноябрь 2024. Ранее, если верить OpenAI, они просили предоставить им 1.4 миллиарда разговоров, но в тот раз требование удалось отразить. OpenAI считает запрос чрезмерным и нарушающим базовые принципы приватности. В статье заявляется, что в последнее время OpenAI вообще стала "одной из самых преследуемых организаций в мире" (в том числе из-за данных), но они намерены "до конца" сопротивляться через суд. openai.com/index/fighting-nyt-user-privacy-invasion/

90 816

Запущен первый российский продуктовый бенчмарк RAG-решений: сейчас принимают заявки от разработчиков RRNCB (Russian RAG Normative-Corporate Benchmark) создан специально для комплексной оценки RAG-продуктов на реальных бизнес-задачах и работает со всевозможными юридическими кодексами, технической документацией, ГОСТами, отчетами и пр. Сейчас полно тестов для проверки способностей отдельно LLM, но вот для оценки пайплайна ИИ-продукта целиком их просто нет, этот первый. Прием заявок от разработчиков RAG-продуктов открыт до 21 ноября, результаты будут опубликованы в декабре. Все будет организовано как небольшой хакатон: на открытом этапе компании получают открытую часть датасета и могут улучшать свои решения в течение двух недель. Затем проводится закрытое тестирование на данных, которые участники не видели. Для оценки используются гибридные метрики и зарубежные LLM, методология более чем прозрачная. По итогам бенчмарка будет опубликован открытый лидерборд российских RAG-решений. Ожидаются заявки от Сбера (GigaChat), Яндекса (Нейроэксперт), МТС (Cotype), Softline, Авито, Точка Банка, Just AI и других ключевых игроков рынка. Подать заявку и подробнее почитать о самом бенче можно вот здесь

90 816

Понравилась новое эссе знаменитой Фей-Фей Ли о пространственном интеллекте Пространственный интеллект – это как раз то, чего, по мнению ученой, так не хватает современным LLM. Да, они хорошо работают с текстом, но spatial intelligence – это следующий шаг. Это про способность воспринимать, понимать, рассуждать о пространстве, объектах, движении и взаимодействии предметов. Ли пишет, что именно связка восприятие-действие (perception + action) с самого начала эволюции лежало в основе интеллекта у живых существ. Другими словами, это база, без которой настоящий интеллект существовать не может. В общем, пока у нас не появятся реально качественные world models (привет Лекуну!), AGI нам не видать. А «реально качественные» – это значит обладающие следующими свойствами: 1. Генеративность. Модель должна уметь создавать целые связные и правдоподобные с точки зрения физики сцены или миры. 2. Мультимодальность. Тут все понятно. 3. Интерактивность. Это должен быть не пассивный генератор, а модель, которая изменяет состояние мира и может предсказать последствия, если агент совершает какое-то действие. По описанию напоминает Genie. И да, это и должно быть что-то подобное, но все-таки на уровень повыше. Ли пишет, что сейчас на достаточном уровне не решена даже сама постановка задачи: это должно быть что-то универсальное, типа предсказания следующего токена, но для пространства. Почитать полностью советуем тут

90 816

История о том, как правильно проверять гипотезы Есть такой стартап – Fireflies AI. Ребята занимаются всевозможными ИИ-заметками. Сейчас они оцениваются в 1 миллиард долларов. Но путь к единорогу был тернист. В LinkedIn один из фаундеров рассказал, что на заре компании они с партнером сами притворять ИИ 💡 Они заходили на встречи под именем «Fireflies», молча сидели и вручную записывали главное, а после отправляли клиентам саммари под видом того, что все это сделал ИИ-агент. Так они провели более 100 встреч, и только потом запустили MVP настоящего продукта. А Amazon мы за такое осуждали…

90 816

⚡️ «Битрикс24» выпустил крупное обновление. Теперь поручения можно ставить голосовым сообщением и видеокружком – ИИ сам создаст задачу с дедлайном, описанием и чек-листом. Нейронку в мессенджере научили распознавать эмоции в голосовых и приходить в любой чат по тегу, чтобы подводить итоги, искать важное и не только. ИИ заполняет CRM после чата с клиентом и игнорирует пустые и спам-звонки. Также появились ИИ-агенты: например, агент внутри Битрикс24 поставит встречу и выполнит другие поручения, кроме того, есть конструктор для создания своих агентов. Обновили таск-трекер, почту, КЭДО, онлайн-доски и интерфейс мобильного приложения.

90 816

Первый российский гуманоид вышел на сцену и даже успел улыбнуться, сделать два шага и попытку помахать зрителям рукой, прежде чем… Ну в общем, смотрите до конца

90 816

Снова вспоминается эта прекрасная иллюстрация происходящего

90 816

SoftBank продал всю свою долю в Nvidia, чтобы подсобрать денег на финансирование OpenAI Вчера стало известно, что 25 октября SoftBank продал акций Nvidia на 5.83 миллиарда долларов. Руководство заявило, что это никак не связано с изменением отношения к Nvidia: скорее это стратегический шаг для «ИИ-расширения». Помимо акций Хуанга, SoftBank также продал почти все свои акции T-mobile на 9.17 миллиардов и увеличил размер маржинального кредита под залог акций Arm. Все эти деньги им нужны для того, чтобы… финансировать OpenAI. В декабрьском раунде компания планирует вложить в стартап 22.5 миллиарда (учитывая, что до этого уже переводили 10 миллиардов). Кроме того, около 20 миллиардов пойдет на Stargate (тоже, по сути, OpenAI), а еще 10-11 миллиардов – на сделки с Ampere Computing и проекты по робототехнике. По итогу, доля SoftBank в OpenAI увеличится с 4 до 11%. В компании, видимо, посчитали, что это круче, чем владеть акциями Nvidia. К тому же, здесь они принимают непосредственное участие в проектах. Акции Nvidia на фоне новости упали аж на 3%. Но ничего, им вернется: ведь все мы знаем, куда OpenAI потратит деньги, которые получит от SoftBank 😊

90 816

Топ-10 неожиданных концовок собеседования

90 816

⚡️ Ян Лекун планирует уходить из Meta и открывать собственный стартап Об этом пишет Financial Times. По их словам, ученый уже находится на ранней стадии переговоров с инвесторами для своей новой компании. Заниматься будет, угадайте чем? Конечно же, всевозможными world models, о которых он уже кучу лет рассказывает буквально в каждом своем интервью и выступлении. Видимо, Лекуна все-таки не устроила новая корпоративная структура, в которой он должен подчиняться молодому зеленому Александру Вану. Хотя сам ученый пока не комментирует ситуацию.

90 816

Как снизить риски при работе с AI в облаке 🔗 Практические рекомендации для IT-специалистов В прошлом году количество инцидентов с использованием AI выросло на 56%.

Ошибки в работе с AI открывают двери для: 😶‍🌫️манипуляций через промпт-инъекции 😶‍🌫️несанкционированного доступа к пользовательским данным 😶‍🌫️атак, связанных с недобросовестными поставщиками ПО

Чтобы рассказать, как правильно работать с AI-инструментами в облаке, Cloud.ru собрал подробный бесплатный гайд — «Защищенный AI в облаке: как избежать киберугроз».

Внутри инструкции по: 😶‍🌫️контролю доступа 😶‍🌫️аудиту логов 😶‍🌫️правильной настройке изоляции 😶‍🌫️и не только

Забрать гайд можно по ссылке

90 816

Внезапный факт: Anthropic может выйти в плюс гораздо раньше OpenAI WSJ проанализировали финансовые отчеты обеих компаний и выяснили, что Anthropic, судя по всему, пройдет точку безубыточности уже в 2028. OpenAI же в 2028 все еще будет уходить в минус, причем в немаленький: по предварительным оценкам, убыток составит ~74 миллиарда долларов. Ранее OpenAI обещали, что начнут зарабатывать в 2029, но теперь ясно, что это случится не раньше 30 года. Уж слишком много они планируют потратить на инфраструктуру (журналисты пишут об 1.4 триллионах за 8 лет). Стратегия Anthropic другая, у них расходы растут примерно с той же скоростью, что и доходы. И кстати, 80% их выручки все еще приходится на корпоративных клиентов.

90 816

Meta* поделились деталями о новой модели GEM, которая теперь лежит в основе их рекомендательных систем Это гибридная архитектура на основе трансформера (вдохновенная, естественно, LLM). Заявляется, что модель настолько хороша, что уже привела к заметному росту конверсий на рекламу: +5% в Instagram и +3% в Facebook за второй квартал. Скачки очень существенные, поэтому давайте смотреть, что у модели внутри. Главных технических фишечки тут три: В итоге мы получаем: (а) масштабируемость; (б) возможность эффективно учитывать все фичи и их связи; (в) адекватное поведение модели на длинных последовательностях. Ну и судя по скачкам конверсий, работает это неплохо. Еще пишут, что планируют добавить ризонинг. Если интересуетесь рексисами, обязательно почитайте статью полностью

90 816

RL не улучшает навыки ризонинга модели Тренд на негативные статьи о том, что "что-то не работает или работает не так, как мы думали", остается с нами. В этот раз хайпует китайская работа под названием "Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model?". Мы все привыкли к тому, что в целом ризонинг – это про RL*. Но в этой статье показано, что на самом деле ничего сверхъестественного RL не вносит, а просто переупаковывает то, что уже было в распределении базовой модели. Как это проверяли? Основная метрика – pass@k: задача считается решенной, если среди k попыток модели (сэмплов) есть хотя бы одна правильная. Для авторской гипотезы метрика как раз очень подходит, потому что отражает именно потенциал модели решать задачу при разумном числе попыток. И вот что получается. При малых k RLVR-модели действительно чаще попадают в правильный ответ (то есть у них выше pass@1), но при росте k базовые модели догоняют и превосходят RLVR практически на всех наборах задач и семейств моделей. Это значит, что эти методы не расширяют границы решаемости задач (в том числе математических и кодовых), они просто повышают эффективность семплирования уже существующих траекторий aka вероятность сразу пойти по нужному пути, и поэтому работают. Плохо ли это? Нет. Но означает, что и слишком больших надежд на RLVR возлагать не стоит: все равно все опять упирается в претрен. * Дисклеймер: в статье речь именно про RLVR, то есть Reinforcement Learning with Verifiable Rewards. RLHF, например, сюда не относится, но вот куча других популярных алгосов, типа PPO/GRPO/Reinforce++ и тд – да.

90 816

PostgreSQL опубликовали топ-50 главных контрибьюторов проекта: в список вошел Андрей Бородин, руководитель разработки СУБД с открытым исходным кодом в Yandex Cloud На данный момент PostgreSQL является самой популярной опенсорсной СУБД в мире. Особенно в сегменте ИИ- и ML-проектов: векторный поиск помогает моделям быстрее находить и анализировать нужную информацию. Например, PostgreSQL применяют при создании ChatGPT. Получить статус контрибьютора в проекте очень нелегко: нужно не просто коммитить, но и проходить долгое строгое ревью. Процент коммитов, которые в конечном счете одобряют, довольно мал, – доработка должна быть действительно существенной. Андрей стабильно контрибьютит с 2016, четвертый раз входит в топ-50 контрибьюторов года и теперь имеет статус major contributors. Их в проекте всего 52, этот статус выше, чем significant contributor, и означает, что разработчик "оказывает существенное влияние на кодовую базу и процессы". Интересно, что вклад команды Бородина не ограничивается только ядром PostgreSQL. Недавно они разработали SPQR (Stateless Postgres Query Router), систему с открытым исходным кодом для горизонтального масштабирования PostgreSQL через шардирование. Она уже доступна сообществу: если любите Postgres, потрогать проект можно здесь. Отдаем дань уважения 👒

90 816

Внезапно: по мнению Яна Лекуна LLM-модели — это не «пузырь» На его взгляд, здесь нет инвестиционного пузыря: LLM уже сейчас находят практическое применение и будут ещё долго приносить пользу. Пузырь – это не сами LLM, а вера в то, что одни только они смогут достичь уровня человеческого интеллекта, то есть AGI. Дальнейший прогресс требует прорывов, а не просто большего объема данных и вычислений. «Мы упускаем что-то важное»