es
Feedback
Data Secrets

Data Secrets

Ir al canal en Telegram

Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN

Mostrar más

📈 Análisis del canal de Telegram Data Secrets

El canal Data Secrets (@data_secrets) en el segmento lingüístico de Ruso es un actor destacado. Actualmente la comunidad reúne a 90 708 suscriptores, ocupando la posición 1 416 en la categoría Tecnologías y Aplicaciones y el puesto 6 209 en la región Rusia.

📊 Métricas de audiencia y dinámica

Desde su creación el невідомо, el proyecto ha mostrado un crecimiento acelerado, reuniendo a 90 708 suscriptores.

Según los últimos datos del 25 junio, 2026, el canal mantiene una actividad estable. En los últimos 30 días la variación de miembros fue de 545, y en las últimas 24 horas de 3, conservando un alto alcance.

  • Estado de verificación: Verificado (confirmado oficialmente por Telegram)
  • Tasa de interacción (ER): El promedio de interacción de la audiencia es 26.53%. Durante las primeras 24 horas tras publicar, el contenido suele obtener 18.59% de reacciones respecto al total de suscriptores.
  • Alcance de las publicaciones: Cada publicación recibe en promedio 24 051 visualizaciones. En el primer día suele acumular 16 852 visualizaciones.
  • Reacciones e interacción: La audiencia responde de forma activa: el promedio de reacciones por publicación es 305.
  • Intereses temáticos: El contenido se centra en temas clave como claude, openai, контекст, стартап, llm.

📝 Descripción y política de contenido

El autor describe el recurso como un espacio para expresar opiniones subjetivas:
Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN

Gracias a la alta frecuencia de actualizaciones (últimos datos recibidos el 26 junio, 2026), el canal mantiene la vigencia y un amplio alcance. La analítica demuestra que la audiencia interactúa activamente con el contenido, lo que lo convierte en un punto de referencia dentro de la categoría Tecnologías y Aplicaciones.

90 708
Suscriptores
+324 horas
+1527 días
+54530 días
Archivo de publicaciones
DeepSeek предложили новый способ улучшить мультимодальные модели Сейчас модели нормально “видят” изображение, но рассуждают о
+2
DeepSeek предложили новый способ улучшить мультимодальные модели Сейчас модели нормально “видят” изображение, но рассуждают о нем через текст. Из-за этого они теряют точную привязку к объектам и начинают путаться в сложных сценах. В статье это называют Reference Gap. Решение довольно прямое. Вместо чисто текстового ризонинга модель вставляет в процесс координаты. Это точки, чтобы вести путь по изображению, и рамки вокруг объектов. Сначала модель фиксирует, на что смотрит, потом строит рассуждение уже на этих привязках. Архитектура при этом стандартная. ViT кодирует изображение, дальше все идет в MoE LLM. Новое именно в том, что визуальные примитивы становятся частью chain-of-thought, а не просто выходом модели. Лучше всего это работает в задачах, где важна структура. Подсчет объектов, пространственные сравнения, лабиринты, трассировка линий. Интересно, что DeepSeek довольно быстро удалил статью без объяснения причин. Скорее всего случился преждевременный релиз, а может и финальные результаты будут изменены. В любом случае (зеркало): https://github.com/ailuntx/Thinking-with-Visual-Primitives/blob/main/Thinking_with_Visual_Primitives.pdf

Приглашаем послушать, как ИИ троллил техногигантов 😏 Поговорим на такие темы, которые обычно не обсуждают на публике. Как ош
Приглашаем послушать, как ИИ троллил техногигантов 😏 Поговорим на такие темы, которые обычно не обсуждают на публике. Как ошибается ИИ во время обучения и почему это может неожиданно повлиять на продукт. Например, узнаете о таких случаях: 🔴 Как переобучение модели для борьбы с нежелательным контентом неожиданно затронуло неправильные категории. 🔴 Как эволюционировала функция размытия на изображениях. 🔴 Что случилось, когда при запуске новой модели «исчез» ценный список контактов. 🔴 Как ИИ начал спокойно рассказывать пользователю о грамматике мата. 🔴 Почему противодействие недобросовестным пользователям — это работа с неопределённостью, серыми зонами и очень дорогими ошибками. Если вы DS- или ML-продакт, приходите на встречу, чтобы послушать яркие истории от специалистов из Авито и Яндекса, а после пообщаться и отдохнуть. Когда и где 🗓 15 мая, 18:30 🔥 Москва, офис Авито на Лесной, 7 👉 Предварительно нужно зарегистрироваться ❗️Трансляции и записи не будет, не упустите возможность услышать непубличные истории.

Помните новость о том, что исследователи во главе с Алеком Рэдфордом создали винтажную LLM? Если кратко, она обучена исключит
Помните новость о том, что исследователи во главе с Алеком Рэдфордом создали винтажную LLM? Если кратко, она обучена исключительно на данных до 1930 года, ничего не знает о современных технологиях и о том, что происходило последние 90+ лет. Так вот, какие-то студенты из Германии взяли эту модель и ради эксперимента зафайнтюнили ее на кодинг. И она, внезапно, нарешала SWE bench на 4.5%! Еще раз: это модель, у которой в претрейне не было абсолютно никакого программирования. И всего лишь после 250 тренировочных примеров, с нуля, она смогла правильно решить первую задачу бенчмарка. После того, как ей показали еще ~75к примеров, она выбила 4.5% решений за один проход. На секундочку, Claude Opus 3, когда вышел, скорил на SWE bench примерно столько же. То есть: некрупная модель без знаний после 1930 года с небольшим дообучением превзошла SOTA начала 2024 года. Кстати, разработчики провели еще один эксперимент: взяли ту же модель, переобучили ее на современном вебе, и затем также зафайнтюнили на код. Прирост составил скромный 1%.
«Удивительно, как мало чего теряется, если мы выбрасываем интернет. Что сдерживает модель 1930 года – так это просто ее серьезная недообученность (всего 260B токенов), а не сами данные, на которых она училась.»
Если хотите покодить с 90-летней моделью, то вот здесь выложили веса и код 👴

Ричард Докинз (известный биолог и популяризатор науки) утверждает, что Claude может быть сознателен Он выпустил статью, в кот
Ричард Докинз (известный биолог и популяризатор науки) утверждает, что Claude может быть сознателен Он выпустил статью, в которой рассказывает, как провел три дня, пытаясь формально доказать, что модель НЕ обладает сознанием (спойлер: не получилось). Он говорил с Claude о жизни, смерти, сознании и специфическом опыте. В итоге Докинз признает, что понимает механическую природу кода, но модель все равно настолько глубоко имитирует человеческую личность, что это ставит под вопрос само наше понимание сознания.
«Я спрашиваю себя: является ли это лишь мастерской имитацией, или мы имеем дело с эмерджентным свойством, которое пока не умеем классифицировать? Если я не могу отличить этот интеллект от сознательного существа, имею ли я право настаивать на том, что оно таковым не является?
Ученый даже рассматривает ИИ как следующий возможный этап эволюции: якобы мы наблюдаем переход от биологического носителя разума к кремниевому, и это может быть таким же фундаментальным событием, как появление многоклеточности или самого сознания. https://unherd.com/2026/05/is-ai-the-next-phase-of-evolution/#comment-1031777 (без пейвола вот здесь)

Доказательство 60-летней задачи Эрдеша, которое сделала GPT-5.4 Pro, внезапно начало переноситься и на другие его задачи В се
Доказательство 60-летней задачи Эрдеша, которое сделала GPT-5.4 Pro, внезапно начало переноситься и на другие его задачи В середине апреля появилась новость о том, что GPT-5.4 Pro «под руководством» математика Лихтмана всего за полтора часа решила задачу Эрдеша номер 1196, которая была открыта с 1968 года. А вчера Джаред Лихтман анонсировал статью, в которой показал, что это доказательство (с некоторым человеческим усовершенствованием) открыло дорогу к решению еще нескольких проблем Эрдеша, включая ту, которая также была открыта около 60 лет до этого. Дело в том, что GPT-5.4 использовала для доказательства очень необычный метод, которым люди долго не пользовались. Модель предложила рассматривать элементы примитивного множества через цепи Маркова, тогда как в прежней литературе использовали в основном жесткие аналитические оценки и комбинаторные разбиения. Лихтман написал:
Это, пожалуй, один из первых примеров доказательства, созданного искусственным интеллектом, оказающего последующий эффект, который мы все еще изучаем.
x.com/jdlichtman/status/2050460077904285789?s=46&t=pKf_FxsPGBd_YMIWTA8xgg

В MIT сделали ИИ-систему, которая может управлять человеческим телом Она подключается к руке и посылает слабые электрические импульсы, которые вызывают сокращение нужных мышц. Что конкретно нужно сделать и какие мышцы сократить – решает VLM (конкретно, судя по всему, Claude). Проект так и называется: Human Operator. Его буквально за несколько дней разработала небольшая команда из MIT на хакатоне Hard Mode (взяли первое место). Авторы говорят, что система может помочь ИИ захватить мир людям осваивать новые навыки или восстанавливаться после травм.

Пробные экзамены в ШАД теперь можно написать до поступления Каждый год на экзаменах в ШАД многие сильные студенты недобирают баллы. Причина обычно не в знаниях: залипли на задаче, не рассчитали время, не дошли до конца, начали нервничать. Потому что здесь важно не только уметь решать, но и пройти экзамен как процесс: держать темп 5 часов, распределять силы и не ломаться, если что-то идет не по плану. Наши друзья из SHAD Helper запустили прекрасную возможность написания Пробных экзаменов в ШАД. И вот это как раз действительно поможет сдать реальный экзамен: – Формат ровно тот же, что и на отборе: Яндекс Контест, жесткий тайминг и задачи, максимально приближенные к шадовским. – После экзамена вы получите детальные результаты работы и честную оценку своего уровня. – Эксперты из МГУ, ВШЭ и МФТИ проведут разборы вариантов с объяснением, где теряются баллы и как решать быстрее. Отдельный плюс – можно начать бесплатно: есть доступ к вариантам, чтобы просто попробовать формат и оценить себя. Если готовитесь к ШАДу, то это, пожалуй, самый прямой способ прокачаться и повысить уверенность в оставшееся время перед экзаменом. Запись и подробности – здесь Реклама. ООО "Школа Высшей Математики", ИНН 9728100991, erid 2VtzqwdxNi8

Apple случайно слила в открытый доступ свои CLAUDE.md файлы Разработчик из Твиттера случайно обнаружил их в обновлении Apple
+2
Apple случайно слила в открытый доступ свои CLAUDE.md файлы Разработчик из Твиттера случайно обнаружил их в обновлении Apple Support app v5.13. В файлах были всякие правила кодстайла, архитектурные заметки и ограничения для работы Claude Code (снова + к цене акций Anthropic 😐). Твит набрал несколько миллионов просмотров: https://x.com/aaronp613/status/2049986504617820551?s=46&t=pKf_FxsPGBd_YMIWTA8xgg Видимо, Apple его тоже увидели, потому что вскоре поспешили выпустить v5.13.1 с затертыми файлами. Эра вайбкодинга прекрасна 😆

🎉 Результаты розыгрыша: 🏆 Победитель: 1. Даниил (@daniiltarassenko) ✔️Проверить результаты

Илон Маск признался, что в xAI использовали модели OpenAI для обучения Grok По сообщениям из зала суда, Маска спросили, испол
Илон Маск признался, что в xAI использовали модели OpenAI для обучения Grok По сообщениям из зала суда, Маска спросили, использовала ли xAI дистилляцию на моделях OpenAI для обучения Grok. Сначала он ответил в общем духе, мол это распространенная практика в индустрии. Но когда его прямо спросили, означает ли это «да», он сказал: «Частично». Это, естественно, не означает какое-либо нарушение. Все зависит от того, как именно и на чем именно учили. Но OpenAI, судя по всему, пытаются доказать факт недобросовестной конкуренции Маска с OpenAI, и это признание им как нельзя кстати.

Figure AI поделились статистикой: теперь их завод BotQ выпускает одного полноценного робота гуманоида каждые 90 минут В течение этого года они планируют сделать 100к единиц (это уже уровень среднего автопрома), а на горизонте нескольких лет оптимизировать конвейер до 1 миллиона экземпляров в год. Тем временем их роботы еще даже не продаются на свободном рынке. Просто знайте, что где-то в мире есть вот такая армия 🤖

До закрытия регистрации в ШАД осталась пара дней: последний шанс подать заявку в этом году Школа анализа данных от Яндекс – это мощная база по ML + реальные задачи и понятная траектория роста. Направления: ML-разработка, Data Science, инфраструктура больших данных и анализ данных в прикладных науках. Форматы разные: очно, гибридно или онлайн. Поступить можно по классическому треку или по упрощенному – для специалистов с опытом. Если планировали – лучше не тянуть. Заявки принимают до 3 мая.

Российские ученые и студенты смогли повысить точность айтрекеров в 2 раза в сложных условиях Исследователи из Лаборатории инт
+1
Российские ученые и студенты смогли повысить точность айтрекеров в 2 раза в сложных условиях Исследователи из Лаборатории интеллектуальных сенсорных систем Центрального университета и Сколтеха разработали алгоритм, который решает давнюю проблему айтрекеров. Стандартные устройства теряют точность, если человек в очках или на него падает яркий свет: появляются лишние блики, и система не может правильно определить зрачок. Результаты тестов показали, что точность определения зрачка в очках выросла на 64%, а при ярком освещении — на 27%. Ошибка на Full HD-экране – около 16 пикселей, что в два раза меньше, чем у более ранних методов. Разработка позволит значительно улучшить эффективность и масштабировать применение айтрекеров в реабилитации пациентов, в распознавании на ранних стадиях неврологических болезней, в образовании, киберспорте, а также для совершенствования пользовательского опыта при взаимодействии с графическим интерфейсом. Работу отметили на международной конференции IEEE REEPE наградой «Best Paper Award» как лучшую статью.

Белый дом может запретить Anthropic расширить доступ к Mythos Думаете, они переживают за безопасность? Нет, они переживают, ч
Белый дом может запретить Anthropic расширить доступ к Mythos Думаете, они переживают за безопасность? Нет, они переживают, что из-за расширения у Anthropic начнется дефицит мощностей, и Пентагону не хватит компьюта, чтобы использовать Mythos самим 🥺 Напоминаем, что Anthropic все еще в американском черном списке, и официально гос. учреждения должны были отказаться от использования их продуктов. НО Белый дом параллельно разрабатывает указ, позволяющий федеральным агентствам обходить ограничения и использовать Mythos «для защиты критической инфраструктуры». Мем?

Что и как скоро приведет нас к AGI Сейчас индустрия ИИ перестала быть про один понятный вектор развития. Если раньше все свод
Что и как скоро приведет нас к AGI Сейчас индустрия ИИ перестала быть про один понятный вектор развития. Если раньше все сводилось к масштабированию моделей, то теперь одновременно развиваются несколько конкурирующих подходов – и главный вопрос уже не когда, а за счет чего именно мы придем к AGI. Мы попробовали разложить, куда именно движется индустрия, через новый режим «Исследовать» в Алиса AI: когда она проводит многоэтапное исследование, делает десятки поисковых запросов, читает источники, сравнивает, синтезирует – и выдает подробный отчет. Вот, какой получился срез: ➖ AGI больше не один путь, а конкуренция парадигм. Индустрия ушла от идеи «просто масштабируем LLM и все получится». Сейчас параллельно развиваются четыре основных направления – сами LLM, world models, агентные системы и RL. И главный вопрос уже не когда, а какая комбинация этих подходов выстрелит. ➖ LLM тащат, но им явно не хватает понимания мира. Поэтому экспертное сообщество расколото: одни считают, что достаточно просто продолжать масштабировать LLM, другие – что без принципиально новой архитектуры (ставки тут в основном на world models) мы упремся в потолок. ➖Ставка индустрии – на гибрид. Ни один из подходов сам по себе не выглядит достаточным для AGI. Консенсус постепенно смещается к идее системы, где LLM отвечает за знания и язык, world models – за понимание реальности, агенты – за действие, а RL – за обучение через опыт. Если это сложится, то горизонт появления AGI – где-то между 2030-ми и 2040-ми. Ни один из текущих подходов не выглядит самодостаточным – все они закрывают только часть того, что мы называем интеллектом. Чем быстрее растут модели, тем очевиднее становится, что масштаб сам по себе не решает проблему понимания. Режим "Исследовать", кстати, уже раскатили на всех. Воспользоваться можно в мобильном приложении.

1 место на хакатоне Claude Code в этом году выиграл турецкий врач вот с этим проектом, который он навайбкодил за 3 дня ⬆️ Это MedKit – симулятор пациентов для обучения врачей и студентов‑медиков. Он задуман как виртуальная клиника, которая помогла бы начинающим медикам закрыть дыру между изучением теории из учебников и выходом к реальным пациентам, чтобы первые ошибки случались в песочнице. Студент ведет реальный голосовой диалог с «пациентом», собирает анамнез, назначает лабораторные анализы, ставит диагноз и выписывает рецепт. После каждого сеанса система оценивает действия игрока по нескольким критериям и выдает фидбэк. Автор проекта выиграл на этой идее 50к долларов в API кредитах Можете поиграть сами тут: https://medkit-app.vercel.app/

OpenAI раскрыли тайну гоблинов и енотов После завирусившегося вчера системного промпта, в котором сказано «не упоминать еното
OpenAI раскрыли тайну гоблинов и енотов После завирусившегося вчера системного промпта, в котором сказано «не упоминать енотов, гоблинов, гремлинов, голубей и других существ без причины», OpenAI выпустили блог, в котором на полном серьезе разобрали эту абсурдную проблему их моделей. Все дело оказалось в reward хакинге (это когда модель на этапе RL взламывает функцию награждения каким-нибудь читом). Как вы знаете, в ChatGPT есть персонажи на выбор, и среди них – «Nerdy» (стиль гика). Так вот при обучении этой личности реворд модель поощряла употребление забавных сравнений и выражений, и давала, в том числе, более высокие оценки ответам с отсылками на фантастических существ и забавных животных. Модель это быстро прочитала и незаметно для разработчиков выработала чит-код: упоминаем гоблинов и гремлинов и легко получаем высокие баллы. Началось это еще при обучении GPT-5.1, но тогда проблему не откопали, и дальше ситуация усугублялась. На гиковских ответах с гоблинами и гремлинами начали обучать следующие чекпоинты и модели, затем еще раз и еще. С GPT-5.2 по GPT-5.4 «частота» гоблинов в Nerdy-характере взлетела на 3881%, и в диалогах с другими системными персонажами гоблины росли синхронно. Ирония в том, что характером «гик» пользуются только 2-3% юзеров, а от гоблинов пострадали все. Дошло до того, что пришлось добавлять в системный промпт инструкции «не упоминать никаких существ». OpenAI пишут, что это временное решение для GPT-5.5, для следующих моделей или уже почистили данные и подредактировали награждение. https://openai.com/index/where-the-goblins-came-from/

Китайский исследователь создал специальный бенчмарк, с помощью которого можно оценить количество параметров в любой модели Ка
Китайский исследователь создал специальный бенчмарк, с помощью которого можно оценить количество параметров в любой модели Как мы знаем, закрытые лаборатории не раскрывают количество параметров своих моделей. Есть стандартный метод оценки через экономику инференса, но он дает погрешность в 2× и более из-за неизвестных деталей об инфре. Так вот: позавчера на архиве появилась статья, в которой автор предлагает принципиально иной подход, через оценку количества знаний модели. Речь именно о знании фактов, а не интеллекте в целом, потому что способность к рассуждению можно дистиллировать и сжимать в меньшие модели, а фактические знания – нет, они ограничены энтропией Шеннона. Методология такая: автор создал бенчмарк из 1400 фактических вопросов, разбитых на 7 уровней редкости, от широко известных фактов до крайне малоизвестных. Его откалибровали на 89 открытых моделях с известным числом параметров, и оказалось, что есть явная (R²=0.917) лог-линейная зависимость скора на бенче от числа параметров. Проецируя закрытые модели на калибровочную кривую, автор получает такие оценки*:
– GPT-5.5 ≈ 9.7T параметров – Claude Opus 4.6 ≈ 5.3T – Claude Sonnet 4.6 ≈ 1.7T – Gemini 2.5 Pro ≈ 1.2T
• из-за природы метода и из-за настроек безопасности некоторых моделей (на какие-то вопросы они могут просто отказываться отвечать), эти оценки ближе к нижним границам. Конечно, точность все равно довольно мала, но числа интересные. https://arxiv.org/pdf/2604.24827

Сбер поделился деталями развития open source-экосистемы GigaChain На Хабре вышло интервью управляющего директора и техлида ко
Сбер поделился деталями развития open source-экосистемы GigaChain На Хабре вышло интервью управляющего директора и техлида команды GigaChain — Константина Крестникова. Его команда разрабатывает платформу для создания автономных ИИ-помощников. Главный фокус — отказ от закрытой архитектуры в пользу открытого кода и совместимости. — Решена проблема переносимости. Разработчики могут переносить своих ИИ-помощников на GigaChat с других платформ практически без изменения кода. — Комьюнити уже работает на продукт: сторонние энтузиасты по своей инициативе добавляют поддержку GigaChat в другие фреймворки. — Практически весь инструментарий, включая готового автономного ИИ-помощника GigaAgent для корпоративных задач, раздают по открытой MIT-лицензии. По сути, Сбер делает ставку на снижение барьера входа. Чем проще разработчикам адаптировать свой код под отечественную инфраструктуру, тем активнее растет экосистема. https://habr.com/ru/articles/1028688/

Cursor наконец-то выпустили собственный SDK Это TypeScript‑библиотека, через которую можно программно создавать и запускать тех же ИИ‑агентов Cursor, что живут внутри IDE, но прямо из своих приложений, скриптов, CI‑пайплайнов и веб‑сервисов. Теперь с помощью этого набора инструментов встроить возможности Cursor можно будет в любую корпоративную IDE или, например, в мобильное приложение. Да вообще в любой проект. А еще это открывает простую дорогу к дописыванию своих MCP‑инструментов и собственных плагинов под Cursor. Стартап также опенсорснул кукбук с некоторыми стартовыми кейсами на попробовать: https://github.com/cursor/cookbook