Data Secrets

Открыть в Telegram

Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN

Больше

Сеть:AI Insider Россия6 168 Технологии и приложения1 406...

📈 Аналитический обзор Telegram-канала Data Secrets

Канал Data Secrets (@data_secrets) языкового сегмента Русский является активным участником. Сейчас сообщество объединяет 90 794 подписчиков, занимая 1 406 место в категории Технологии и приложения и 6 168 место в регионе Россия.

📊 Показатели аудитории и динамика

С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 90 794 подписчиков.

Согласно последним данным от 30 июня, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило 572, а за последние 24 часа — 8, при этом общий охват остаётся высоким.

Статус верификации: Верифицирован (официально подтверждён Telegram)
Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 26.18%. В первые 24 часа после публикации контент обычно набирает 19.14% реакций от общего числа подписчиков.
Охват публикаций: В среднем каждый пост получает 23 775 просмотров. В течение первых суток публикация набирает 17 377 просмотров.
Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 311.
Тематические интересы: Контент сосредоточен на ключевых темах, таких как claude, openai, контекст, стартап, llm.

📝 Описание и контентная политика

Автор описывает ресурс как площадку для выражения субъективного мнения:
“Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN”

Благодаря высокой частоте обновлений (последние данные получены 01 июля, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.

90 794

Подписчики

+824 часа

+1957 дней

+57230 день

23 775

Просмотры поста

~ 17 37724 часа

~ 19 12548 часов

26.18%

Коэффициент вовлеченности

~ 4

Постов в день

Ads index

beta

Архив постов

90 795

AlphaXiv сделали крутую подробнейшую 3D-визуализацию трансформера Они взяли LLaMA 3.1 и создали трёхмерную интерактивную схему, внутри которой можно полетать сквозь все внутренности трансформера и увидеть, как модель работает изнутри. Если навести курсор на блок, то появится всплывающая карточка с описанием вычислений, которые за ним стоят. А если щелкнуть, то откроется встроенный редактор кода, в котором можно посмотреть точный код операции. Реализовано все на основе библиотеки ggml в llama-cpp. Оттуда парсится отладочная информация о том, какие операции происходят во время вычислений (например, MUL_MAT, ROPE, RESHAPE, ADD). Затем это визуализируется в виде 3D-блоков в three.js. Для удобства восприятия все блоки разбиты на смысловые группы: query, key, value, MLP и residual stream. www.alphaxiv.org/labs/tensor-trace

90 795

Интеллектуальная нищета не лечится промтами и курсами Если при практически неограниченных возможностях общения с ИИ человек всё ещё надеется найти «тот самый волшебный промт», то дело уже не в промтах, а в самом подходе. Это сознательный выбор остаться неконкурентоспособным Если же человек до сих пор не начал коммуницировать с ИИ, то он либо слишком счастлив и уже поймал дзен, либо недееспособен, либо его восприятие реальности настолько ограничено, что он не осознаёт происходящего ИИ обучается на миллиардах человеческих текстов и является зеркалом коллективного сознания. Его ответы - отражение мышления вопрошающего. И если это мышление узко, то человек окончательно лишится шансов конкурировать уже через 5-7 лет. Причём он даже не узнает о своей ограниченности - примерно так же, как голубь не узнает, что семечки падают не с неба Интеллектуальная нищета лечится только осознанием факта, что с неба вообще ничего не падает. Даже семечки Первая порция пищи для ума и ключ к эффективному союзу с ChatGPT: 🔐 Метод Хирона. Часть 1. «Человеĸ + Исĸусственный Интеллеĸт» P.S. Любопытство - это хорошо, если знаешь, куда его направить

90 795

OpenAI релизнули две новые открытые модели: gpt-oss-safeguard 20B и 120B Они основаны на gpt-oss и обучены специально для задач классификации текста на предмет безопасности. Важно, что правила фильтрации не сразу зашиты в модель, а определяются самим пользователем уже на этапе инференса и могут быть какими угодно. Это что-то новенькое. И вообще, кажется, что область очень узкая. Но на самом деле задач, связанных со всевозможной модерацией контента, вокруг море, и с ростом популярности ИИ их становится еще больше. И в этом смысле модели актуальные. OpenAI пишут, что работают они прямо отлично, но только при условии, что вы зададите четкие непротиворечивые инструкции. Если политика продуманная, то gpt-oss-safeguard (якобы) смогут обрабатывать даже сложные пограничные случаи. Внутри стартапа эти модели уже частично используются для оценки безопасности запросов и элаймента моделей. Это удобно, потому что в разных случаях политика может быть разная: для несовершеннолетних пользователей одна, для самих моделей другая, для бизнеса третья. И обучать несколько разных классификаторов не нужно: достаточно задать одной и той же модели разные инструкции, и она подстроится. openai.com/index/introducing-gpt-oss-safeguard/

90 795

Дуров анонсировал децентрализованную ИИ-сеть Cocoon (Confidential Compute Open Network) это два в одном: майнинг и конфиденциальность ваших ИИ-запросов. То есть: – Владельцы GPU подключают свои видеокарты к сети и получают за это TON. – Разработчики получают доступ к компьюту, а пользователи могут безопасно общаться с моделями. Если у вас есть GPU и вы готовы ее предоставить, пост с информацией вот

90 795

Новый робот NEO от 1X: что нужно знать Стартап из Норвегии открыл предзаказ на домашнего робота NEO. Он предназначен для бытовых задач: уборка, стирка, принеси-подай и прочее. Это один из первых образцов домашнего гуманоида, которого фактически можно купить себе. Но ожидать от него чудес не стоит. Хотя NEO и рекламируют, как автономного, тут есть нюанс. В сложных сценариях к роботу будет подключаться живой оператор, который удаленно будет управлять процессом выполнения задачи. Плюс, все данные с робота вы «должны» передавать в компанию. Да, от этого можно отказаться, но тогда, вероятнее всего, вы получите от железки очень мало пользы. Лица с камер обещают блюрить. Также можно настроить «запретные зоны» в доме, куда роботу точно нельзя. Ну и вы сами можете подключаться к камерам и наблюдать, что делает NEO, даже если вас нет дома. В общем, если вы спокойно относитесь к шерингу данных, то робот действительно со временем может стать полезным. К тому же, вы сделаете вклад в следующий этап обучения гуманоидов в 1Х 😩 Стоит такое добро 20к долларов. Или можно брать в аренду за 500 долларов в месяц. https://www.1x.tech/order

90 795

Яндекс поделился первыми техническими подробностями нового семейства моделей Alice AI Тестировали и улучшали модель на корзине из тысяч реальных пользовательских задач. Кроме того, на этих задачах Алиса AI, которая работает на семействе моделей, превзошла DeepSeek – это узнали журналисты Хабра. Подробностей мало, разработчики обещают выложить подробный тех.репорт. Alice AI LLM обновилась не только качественно, но и архитектурно. Разработчики перешли на MoE (Mixture of Experts) В разработке использовали метод обучения online-RL с подкреплением с многокомпонентными наградами. В случае с MoE применение этого метода считается очень сложной задачей, и справляются с этим единицы стартапов и компаний. А еще новую LLM объединили с генеративным поиском в новый пайплайн. Это позволяет нейросети использовать в инференсе не только текст, но и другие объекты — изображения, карточки организаций, карты, видео. LLM теперь может последовательно отправлять запросы в сеть, чтобы собрать всю недостающую для ответа информацию. Подробностей мало, разработчики обещают выложить подробный тех.репорт. Очень ждем репорт и поздравляем команду Алисы AI с топом в AppStore

90 795

Google выпустили интересный экспериментальный продукт Pomelli для создания контента для брендов Суть в том, что это не просто генерация постеров/видео по описанию или референсам, а полноценный маркетинговый инструмент. То есть: вы даете агенту адрес веб-сайта вашей компании, он считывает айдентику, стилистику, посыл и предлагает вам какие-то единицы контента, которые соответствуют специфике. Это может быть условные картинки для соцсетей, рекламные постеры и тд. После генерации их можно изменять самостоятельно, вплоть до цветов и текста на картинке. Или попросить модель внести правки. Конечно, на практике все далеко не так радужно, как по черрипикам. Но для прототипирования идей – сойдет. Как хорошо проработанная обертка для Nano Banana заслуживает внимания. Если хотите попробовать, нужен аккаунт США, Канады, Австралии или Новой Зеландии. labs.google.com/pomelli/

90 795

Может для кого-то это станет отличной новостью: в NotebookLM ИИ-видеообзоры теперь можно делать в стиле аниме и каваий Оказалось, что после того, как они раскатили фичу с видеообзорами источников, запросы на ролики в аниме-стиле побили все рекорды. Есть спрос – есть предложение. Так что теперь вайфу и здесь можно завести ⌨️

90 795

OpenAI завершили реструктуризацию и стали (почти) коммерческим стартапом Некоммерческое подразделение все еще будет жить и теперь называется OpenAI Foundation. Они владеют примерно четвертью акций OpenAI: в деньгах это примерно 130 миллиардов долларов. Такой бюджет делает компанию одной из самых богатых филантропических организаций в мире. Забавно, что состояние некоммерческой структуры напрямую зависит от финансового успеха коммерческой. После достижения определенных рубежей в оценке акций она будет получать дополнительные доли и опционы. Тратить эти деньги планируется на общественно полезные проекты. На первых парах метят в ИИ-кибербез и ИИ в здравоохранении. При этом nonprofit также сохраняет влияние на дочерний profit и оставляет за собой право решающего голоса в вопросах этики, безопасности и тд. Также (наконец-то!) появилась какая-то ясность в дальнейших отношениях OpenAI и Microsoft. Ключевое: Microsoft все-таки выбили себе право интеллектуальной собственности на все модели и разработки до 2032 года. Даже если OpenAI раньше объявит о достижении AGI, это право сохранится. Исключение составляет только небольшой список так называемых исследовательских разработок. Это, например, модели, предназначенные только для внутреннего тестирования и использования. https://openai.com/index/built-to-benefit-everyone/

90 795

Внимание, новость дня

90 795

На Wikipedia уже появилась статья про Grokipedia Настроение у нее довольно забавное. Смотрите, что пишут:

Маск позиционирует Grokipedia как альтернативу Wikipedia, которая, по его словам, должна «очистить от пропаганды» последнюю. По состоянию на 28 октября 2025 года, на сайте размещено более 800 000 статей, созданных ИИ. Материалы создаются и редактируются языковой моделью Grok. Многие статьи основаны на статьях из Википедии, и некоторые из них почти дословно повторяют оригиналы. Отмечается, что тексты проходят проверку фактов с помощью модели Grok. Часть контента, по утверждениям критиков, согласуется с личными взглядами Маска и бывшего CEO Twitter Парага Агравала на темы вроде гендерного перехода.

Пассивная агрессия, уровень: Wikipedia

90 795

ИИ-музыка прошла тест Тьюринга В испанском университете провели такой эксперимент: участникам предъявлялись пары песен, из которых одна была сгенерированной, а другая человеческой, – и проверяли, насколько люди способны отличить, где что. В итоге результат оказался близок к случайному угадыванию. В среднем слушатели отвечали правильно в 53% случаев. Киберпанк ✌️ P.S. Но для музыкантов пока что есть и хорошая новость: чем ближе пара была по стилю/вокалу/звукам, тем лучше слушатели отличали AI от «живой» музыки.

90 795

У Яндекса сегодня большой день: компания показала самое глобальное обновление Алисы за всю историю Алиса эволюционировала в универсальную нейросеть Алису AI, которую обучили на миллионах реальных кейсов пользователей. В ответе на запрос пользователя она не ограничивается только текстом, а прикладывает картинки, видео и даже данные Яндекс Карт. Еще из любопытного: появится функция «Моя память» — можно будет хаотично наговорить или набросать в чат с ней мысли, она обработает их, сформирует списки дел и напомнит вам о них. Ну и самое главное — в Алисе AI появится функционал ИИ-агента, который позволит делегировать жизненную рутину, например искать и бронировать рестораны, записывать в салоны красоты. На старте можно будет забронировать слот в 40 тысячах бьюти- и других организаций, а также стол в более чем 30 тысячах ресторанов России. Шаг действительно фундаментальный как для компании, так и для российских пользователей (ведь такой функционал у них появится впервые), и может стать новым стандартом в ИИ. В России так уж точно, а может быть и шире

90 795

Thinking Machines предложили новый метод дистилляции, который обходит RL по эффективности Сразу оговорка: это не замена RL. Но и не обычная дистилляция. Тут исследователи как бы взяли лучшее от двух этих миров и объединили в один подход. Смотрите. Обычная дистилляция страдает от расхождения распределений: грубо говоря, модель-ученик плохо генерализуется, потому что видит только ответы/логиты учителя, и перенимает скорее стиль, чем знания. Это работает на несложных вопросах, но на длинных рассуждениях ошибки накапливаются и качество сбоит. С другой стороны у нас есть RL, где агент обучается на своих же траекториях. Но RL дает редкую награду, и тут нельзя оценивать токены изолировано, как в дистилляции. Как говорил Карпаты, это приводит к тому, что сигнал рассеивается и обучения тормозит. Thinking Machines предлагают объединенный подход под названием "On-Policy Distillation". Суть:

– Как в обычной дистилляции, у нас есть модель-учитель (большая, сильная модель) и модель-ученик (модель поменьше, которую обучаем). – Из RL берем идею об обучении на своих же траекториях. То есть прогоняем батч промптов и сэмплим именно ответы студента. – Даем учителю точные префиксы ответов ученика и делаем прямой проход. – Считаем reverse-KL лосс по каждому токену, сравнивая лог-prob ученика и учителя.

В итоге получаем одновременно и плотную оценку, и обучение на собственных ответах без проблем с распределением. Работает это весьма неплохо. На AIME’24 on-policy distillation довела Qwen3-8B с 60% до 70% точности всего за 150 шагов. Для сравнения, RL-тренинг по отчётам Qwen занял около 17 900 GPU-часов и дал 67,6 %. Это экономия в десятки раз. Отличная работа. thinkingmachines.ai/blog/on-policy-distillation/

90 795

Эволюция инференса LLM: от Hugging Face к vLLM Открытый вебинар от OTUS — первый шаг к продвинутому владению языковыми моделями. Приходите на онлайн-встречу, где мы разберем ключевую, но часто упускаемую из виду тему — эволюцию инструментов инференса. Эти знания отличают специалиста, который просто использует модели, от того, кто может грамотно интегрировать их в продакшн, выбирая оптимальные решения для скорости, памяти и стоимости. Что вы получите за час? - системное понимание экосистемы инструментов для инференса; - четкие критерии для выбора фреймворка под вашу задачу; - практическое понимание, что дает переход на vLLM в реальных проектах (throughput, latency, экономия GPU-памяти). Для кого: • Практикующих Data Scientists • Инженеров, работающих с текстовыми данными Этот вебинар — введение в философию курса «NLP.Advanced», где вы с нуля осваиваете самые современные и эффективные подходы к работе с LLM. Подробности и регистрация: https://otus.pw/ZKc7/ Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576

90 795

⚡️ xAI выпустили Grokipedia Это аналог Википедии, но с исправленными статьями. Маск считает, что в оригинальной Wiki статьи политически предвзятые и часто неправдивые, потому что их пишут люди. Grokipedia же позиционируется как «энциклопедия, созданная для правды». Работает она, естественно, на основе Grok. Агент ищет факты, очищает их от налета идеологий и мнений и пишет/проверяет статьи. Пока доступна версия 0.1 – ранняя бета. Опенсорс. grokipedia.com

90 795

У нас тут новая SOTA в опенсорсе Естественно, от китайцев: Minimax M2. Модель примерно на уровне Grok 4 Fast и Gemini 2.5 Pro. В основном создано для агентов и end-to-end кодинга. Самое интересное: в течение ограниченного времени модель можно бесплатно попробовать в API. Потом установят цены, но и после этого модель будет достаточно дешевой (примерно 8% от цены Claude Sonnet, например). Веса (лицензия MIT)

90 795

Авито опенсорснули свои ИИ-модели A-Vibe и A-Vision Инвестиции в разработку составили около полумиллиарда рублей. Это первые российские открытые модели, специально обученные для e-commerce. Именно они работают на проде Авито и помогают вам, например, писать описания к объявлению по фотографиям. Они подходят для анализа документов, автоматизации контента и других распространенных задач. Также модельки умеют в function calling, так что на их базе можно строить даже агентов. Во многих открытых русскоязычных рейтингах A-Vibe и A-Vision занимают первые места. Кроме того, модели специально оптимизированы под русский язык, что позволят экономить до 50% ресурсов на вычисления в сравнении с другими легкими моделями. Приятная вишенка: бонусом к моделям Авито перевели на русский язык 4 международных бенчмарка. Такой вот подарок комьюнити. Hugging Face (лицензия Apache 2.0, использовать можно в том числе в коммерческих целях)

90 795

Новый день – новые сохраненные статьи, читать которые никто не собирается ✌️

90 795

Джеффри Хинтон заявил, что у нас все-таки есть шанс остаться в живых и сосуществовать с ИИ. Для этого надо встроить в модели материнский инстинкт. Ученый говорит, что мать и ее ребенок – это единственный пример ситуации, когда менее развитое существо управляет более развитым. Это заслуга эволюции, то есть материнский инстинкт. Чтобы человечество выжило после появления сверхинтеллекта, ученым нужно попытаться воспроизвести этот инстинкт в моделях.

Лидеры компаний думают об ИИ, как будто это ассистент, а мы боссы. Но это невозможно. Мы не должны пытаться доминировать. Мы должны создавать ИИ как родителя. Только в таком случае эти системы будут помогать нам достигать лучшего, даже если мы будем слабее их.

👶