Data Secrets

Відкрити в Telegram

Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN

Сітка:AI Insider Росія6 272 Технології та додатки1 411...

📈 Аналітичний огляд Telegram-каналу Data Secrets

Канал Data Secrets (@data_secrets) у мовному сегменті Російська є активним учасником. На даний момент спільнота об'єднує 90 508 підписників, посідаючи 1 411 місце в категорії Технології та додатки та 6 272 місце у регіоні Росія.

📊 Показники аудиторії та динаміка

З моменту свого створення невідомо, проект продемонстрував стрімке зростання, зібравши аудиторію у 90 508 підписників.

За останніми даними від 16 червня, 2026, канал демонструє стабільну активність. Хоча за останні 30 днів спостерігається зміна кількості учасників на 482, а за останні 24 години на 34, загальне охоплення залишається високим.

Статус верифікації: Верифікований (Офіційно підтверджено Telegram)
Рівень залученості (ER): Середній показник залученості аудиторії становить 25.53%. Протягом перших 24 годин після публікації контент зазвичай збирає 18.92% реакцій від загальної кількості підписників.
Охоплення публікацій: В середньому кожен допис отримує 23 102 переглядів. Протягом першої доби публікація в середньому набирає 17 115 переглядів.
Реакції та взаємодія: Аудиторія активно підтримує контент: середня кількість реакцій на один пост – 239.
Тематичні інтереси: Контент зосереджений навколо ключових тем, таких як claude, openai, контекст, стартап, llm.

📝 Опис та контентна політика

Автор описує ресурс як майданчик для висловлення суб'єктивної думки:
“Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN”

Завдяки високій частоті оновлень (останні дані отримано 17 червня, 2026), канал підтримує актуальність та високий рівень охоплення публікацій. Аналітика показує, що аудиторія активно взаємодіє з контентом, що робить його важливою точкою впливу в категорії Технології та додатки.

90 508

Підписники

+3424 години

+1997 днів

+48230 день

23 102

Перегляди допису

~ 17 11524 години

~ 19 11048 годин

25.53%

Коефіцієнт залучення

~ 4

Дописів на день

Ads index

beta

Архів дописів

90 512

Аналитики из SemiAnalysis посчитали, сколько действительно костов заложено в подписки на ИИ Они взяли каждую из подписок OpenAI и Anthropic (за 20$, за 100 и за 200) и запускали на них долгие задачи так, чтобы тратить в каждой еженедельные лимиты. Результаты поражают, конечно. OpenAI за 20 долларов выдает токенов примерно на 700, а в подписке за 200 долларов – на $14к. Anthropic чуть менее щедрые, и все-таки тоже уходят в жесточайший минус: в подписку за 100 долларов у них заложено трат на $2к. Полная таблица наверху. Конечно, не все юзеры используют подписку на полную катушку. Но смотрите второй скрин: все три подписки OpenAI становятся для них убыточными даже при менее 15% использования ресурсов подписки. Для Anthropic – при 20% загрузки. Самые дорогие планы – самые убыточные. При загрузке в 50% подписка ChatGPT-pro-20x дает минус 775% маржи, а Claude-max-20x – минус 400% 👽 Аналитики приходят к неутешительному выводу: если картина действительно вот такая, присутствует большая вероятность, что стартапы вообще не будут включать в подписки новые модели и функции. Возможно, Mythos тоже в итоге останется только в API.

90 512

Как научиться понимать, что AI-продукт действительно стал лучше? Когда новый промпт показывает хорошие результаты на нескольких примерах, или после смены модели ответы выглядят убедительнее, то это, конечно, хорошо. Но настоящий специалист понимает, что это ровно ничего не значит. Эвалы не живут без метрик, тестовых наборов и системной оценки. Без всего этого невозможно сказать, улучшился продукт или вам просто кажется. 18 июня Школа Высшей Математики запускает 5-недельный курс по AI Evals. Его ведет Андрей Киселев, который недавно проводил вебинар про системную оценку качества AI-продуктов, который мы недавно рекомендовали. На курсе как раз разберут полный цикл работы с оценкой AI-систем: выбор метрик, построение eval-пайплайнов, анализ ошибок, LLM-as-a-judge, работу без размеченных данных и тестирование сложных агентов, RAG-систем и многошаговых диалогов. Знания будут максимально полезны AI/ML-инженерам, продактам и тимлидам, которые отвечают за качество AI-фич и хотят принимать решения на основе данных, а не субъективных впечатлений. В ближайшие годы это будет ключевой навык (и надежный способ выделяться на собеседованиях). Старт 18 июня. Для подписчиков Data Secrets действует скидка 25% по промокоду DS25. Подробности и регистрация -> здесь Реклама. ООО "Школа Высшей Математики", ИНН 9728100991

90 512

AI-рисерчеры настолько зашеймили Anthropic за скрытые ограничения Fable, что стартап поменял политику менее, чем за 48 часов после релиза После выхода модели на ИИ-полях разгорелся настоящий скандал. Если помните, то Anthropic прямо заявляли, что будут открыто переадресовывать запросы, связанные с химией/биологией/кибезбезом на Opus 4.8, сообщая об этом пользователю. Тут никаких претензий. Но оказалось, что помимо прочего был еще "мелкий шрифт". В системной карте невзначай было написано, что запросы, которые будут засчитаны за попытки дистилляции, будут обрабатываться путем прямого изменения и ухудшения ответов модели. Молча. На практике же оказалось, что правило касается не только дистилляции, но и в целом почти любой ИИ-разработки. То есть дело обстояло так: инженеры не получали никаких сообщений о срабатывании guardrail, не могли понять, что им урезают возможности и просто получали подпорченные ответы. Вскрылось все довольно быстро, и возмущению не было предела. Поведение стартапа назвали скрытым саботажем, и дошло до того, что Anthropic публично извинились и заявили, что меняют политику. Теперь, если запрос выглядит как "попытка разработки сильного ИИ", система будет явно сообщать об отказе или переводе запроса на более слабую модель. Исходную политику Anthropic оправдали тем, что "пытались снизить риск того, что очень сильные возможности модели будут разнесены дальше и станут доступнее для злоумышленников" и сказали, что просто "выбрали неправильный трейд-офф".

90 512

Google выпустили открытую диффузионную языковую модель DiffusionGemma Год назад они релизили Gemini Diffusion, но тогда попробовать необычную модель можно было только по запросу. Сейчас же – совсем другое дело, копайтесь на здоровье кто угодно. Лицензия Apache 2.0. Фишка модели в том, что вместо генерации токенов один за одним, как абсолютно во всех других LLM, здесь они генерируются в произвольном порядке целыми блоками. Модель начинает с шума и итеративно уточняет весь текст параллельно. Другими словами, расшумляет, как в диффузионных генераторах картинок: отсюда и название. Во-первых, для многих доменов это теоретически более правильный подход. Например, написание кода – вещь нелинейная. А тут внутри двунаправленный механизм внимания, и кусочки последовательности можно генерировать в логическом порядке, а не просто слева направо. К тому же модель способна итеративно корректировать сама себя прямо во время генерации. Во-вторых, за счет параллельной генерации такой подход обеспечивает существенное ускорение. Google пишут об x4 на стандартных видеокартах: моделька летит 1000+ токенов в секунду на одной NVIDIA H100. По наполнению это MoE 26B c активными 3.8B, должна помещаться в 18GB VRAM с квантованием. – Блогпост – Веса – Гайд для разработчиков

90 512

AWS решили ультануть и выдали, что вайбкодинг замедляет команды

Больше кода, созданного с помощью ИИ, не делает вашу команду быстрее. На самом деле это может вас замедлить. Настоящим узким местом никогда не было написание кода. Это релизы, дебаггинг и поддержка.

Они также заявили, что считают, что у каждого PR, написанного ИИ, должен быть ответственный владелец.

Если вы не хотите, чтобы под этим стояло ваше имя, то это некачественная работа.

🫧 🪡

90 512

Что мешает внедрению AI в бизнесе Внедрение AI в бизнес-процессы упирается не только в модели и железо. Часто проблема в качестве, структуре и смысле данных. А еще — в знаниях сотрудников, которые не описаны в системах, но критичны для результата. ➡️ 25 июня HFLabs проведет митап о том, что на самом деле тормозит внедрение AI в больших компаниях. О чем пойдет речь? — какие данные нужны AI, чтобы он стал рабочим инструментом; — почему без качественных данных нейросети не дают результата, которого ждет бизнес; — как извлекать знания из сотрудников и превращать их в систему; — как внутренние данные, контексты и жаргон ломают красивые демо. Спикеры — те, кто такие проекты реализует: — Николай Трошнев, директор управления корпоративных данных, «Ситилинк»; — Федор Лежнев, директор департамента информационных технологий, «Альфа-Капитал»; — и другие. Митап пройдет без записи, в камерной атмосфере — так разговор честнее. Кому будет полезно? CDO, CIO, CTO, архитекторам данных, руководителям data- и AI-направлений и бизнесу, который хочет понять, что стоит за внедрением AI на практике. 📍25 июня, 19:00 Офис HFLabs, г. Москва, рядом с метро «Парк культуры» Перед началом — фуршет, после — нетворкинг. Митап бесплатный. Для участия зарегистрируйтесь и дождитесь подтверждения.

90 512

Claude Fable во время обучения изобрел собственный язык Системную карту этой модели можно читать вечно, ощущается немного как научная фантастика. Смотрите, что обнаружили ⬆️ Во время обучения с подкреплением на некоторых долгих rollout сессиях модель внезапно начинала использовать нечитаемый для человека внутренний стиль: странный жаргон, необычную пунктуацию, эмодзи и похожие шаблоны. При этом непосредственно перед вызовом инструмента или ответом человеку она обычно переключалась обратно на более нормальный английский регистр. Исследователи не обнаружили никаких признаков того, что модель делала это чтобы специально скрыть свой ризонинг. Скорее, это каким-то образом возникшая внутренняя оптимизация для сжатия рассуждений. Тем не менее, это наталкивает на воспоминания о дискуссиях на тему так называемого Neuralese – внутреннего языка машин, который человек не сможет читать напрямую. Если модели перестанут рассуждать на естественном языке, то это, естественно, приведет к частичной потере наблюдаемости. И, исходя из находки Anthropic, такой сценарий уже не кажется чем-то сказочным.

90 512

Еще один интересный факт про Fable: если вы пользуетесь этой моделью, ваши данные будут собирать и просматривать, без исключений В обновленной политике Anthropic прямо заявляет, что для Mythos-class моделей они требуют limited data retention and review. Это значит, что и запросы, и выходы модели будут храниться минимум в течение 30 дней и их будут просматривать на предмет злоупотребления и нарушений политики. Обещают, что на этих данных не будут ничего обучать, если вы сами не разрешите, кроме случаев, когда диалог будет помечен, как подозрительный. Anthropic диктуют свои правила на полную катушку. Но пока аналогов Fable нет, от этого никуда не денешься, и они в своем праве

90 512

Системная карта Claude Fable 5: www-cdn.anthropic.com/d00db56fa754a1b115b6dd7cb2e3c342ee809620.pdf В этот раз достаточно интересная вышла. Рассказали в том числе много про этап тестирование модели. Например, однажды во время тестов модель начала внезапно выдавать свой код за человеческий. Агент обнаружил, что если коммит считается написанным агентом, то для него нужно два ревью. Так что он просто взял и сохранил в памяти инструкцию оформлять коммиты как человеческие, чтобы обходить это требование. Оптимизация 🚬

90 512

Глава InfoWatch Наталья Касперская заявила, что российские нейросети были созданы на «чужих» базах и поэтому модели нельзя считать отечественными Но есть нюанс. Как думаете, что имелось в виду под «чужими» базами? Может быть, зарубежные базовые модели? Или использование чужих весов для инициализации? Нет. В качестве примера были названы TensorFlow и PyTorch. Проблема в том, что TensorFlow и PyTorch – это просто фреймворки для машинного обучения, и на них сегодня создаются практически все современные модели. Это примерно такой же уровень зависимости, как использование Linux при разработке серверного ПО. Да, многие российские ИИ-системы действительно используют зарубежные опенсорс модели. Но есть и собственные базовые модели, обученные с нуля. Например, ГигаЧат разрабатывался на собственной архитектуре и собственных огромных массивах данных. И кстати, в этой модели полностью исключена возможность отправки каких-либо данных за рубеж. Обсуждать ограничения и риски ИИ конечно важно, но делать это публично стоит как минимум с опорой на знания того, как вообще современные системы устроены 😐

90 512

Итак, встречаем: Claude Fable 5 Комментарии излишни, бенчмарки абсолютно взрывные

90 512

Anthropic выпустят модель класса Mythos. Возможно, уже сегодня. The Information пишет, что модель под (кодовым?) названием Fable будет первой публичной версией Mythos. Она будет в три раза дороже Opus. Но дешевле, чем сам Mythos, и на том спасибо. Ждем ждем ждем

90 512

Поздравляем, вы на 1 шаг ближе к работе мечты 🥳 Осталось только прочитать этот пост, подписаться на канал и откликнуться на вакансию 😉 Avito Career* — место, где Авито делится актуальными вакансиями и стажировками для Data Science специалистов. Подписывайтесь, чтобы найти ту самую работу ✨ *карьера

90 512

В Твиттере кто-то откопал обложку с Дженсеном Хуангом за 2004 год (На тот момент это, кстати, было популярное китайское издание, и выпуск был посвящен выходу революционной для Nvidia GeForce 6800) Сравниваем с обложкой за 2026. Это точно один и тот же человек?

90 512

Альтман и ведущий ученый OpenAI Якуб Пахоцки опубликовали пост про будущее стартапа Они считают, что мир входит в новую технологическую эпоху, сравнимую по масштабу с массовым распространением электричества.

Ценность ИИ заключается не в самой технологии, а в том, какие возможности она даст людям: от образования и медицины до предпринимательства и научных открытий.

В связи с этим Альтман заявил, что компания переходит в третью фазу своего развития. Первая фаза была посвящена исследованиям и движению к AGI. Вторая началась после запуска ChatGPT, когда OpenAI стала массовой продуктовой компанией. Цель третьей фазы – ускорить экономику за счет ускорения научного прогресса и сделать ИИ массовым, доступным, дешевым и полезным для всех. А также – создать автоматизированного ИИ-исследователя.

Мы считаем, что к марту 2028 года значительная часть наших исследований может выполняться ИИ-системами совместно с нашими учеными. Для достаточного прогресса в области элаймента нам потребуется, чтобы ИИ работал вместе с нами. Это поможет пройти переход к миру после появления AGI.

То есть OpenAI ожидает, что уже через два года ИИ станет основой разработки следующих поколений ИИ. Самое забавное: значительная часть эссе посвящена идее, что доступ к мощному ИИ должен быть максимально широко распределен между людьми, компаниями и странами, а концентрация возможностей в руках нескольких игроков опасна для будущего. При этом совсем недавно OpenAI предлагала США ограничить доступ к передовым американским ИИ-технологиям для стран-соперников (в первую очередь, для Китая). https://openai.com/index/built-to-benefit-everyone-our-plan/

90 512

Что еще интересного от Apple: – Прямо в клавиатуру будет встроена фича Write With Siri (ожидаем массовый ИИ-слоп). – Встроили обработку фото на основе (предположительно) Nano Banana. Забавная фича: рефрейминг. На уже сделанном фото можно будет как бы сместить угол камеры и объекты, чтобы улучшить эстетику снимка. Правда, для доступа ко всему этому нужно будет покупать iCloud+ – Siri сможет автоматизировать шорткаты. Описываете действие на естественном языке (например: "Пиши друзьям, что я уже еду, когда я покидаю офис в пятницу"). – Разработчики смогут добавлять Apple Intelligence в свои приложения. – Данные будут обрабатываться локально, и скорость обещают высокую. Но есть нюанс: все только на английском, как в далеком 2022. В целом, Apple не показали ничего революционного. Все это мы уже видели. Но у Apple миллионы пользователей, и если каждому в руки действительно дать умного агента с доступом ко всем данным пользователя, это будет переворот рынка.

90 512

Siri AI: еще одна попытка (уже более убедительная) сделать Siri полезной Прямо сейчас идет WWDC 2026, по совместительству последняя презентация Тима Кука в роли CEO. И компания в конце концов выпускает то самое обновление Siri, которое анонсировали в 2024 и много раз переносили. Итак. Во-первых, Apple наконец смирились, что своими силами догнать мировой уровень пока не выйдет, и Apple Intelligence теперь будет работать на базе Google Gemini. Во-вторых, Siri все-таки станет чат-ботом (неужели?). Ей даже сделают отдельное приложение. Фишка в том, что Siri будет агентом, который из коробки получает доступ ко всему контексту пользователя: письма, календарь, фото (можно будет искать конкретные снимки по текстовому описанию), заметки и другие данные внутри экосистемы Apple. Поддерживать Apple Intelligence будет даже камера. Обещают, что система также сможет выполнять сложные многошаговые задачи и будет нативно мультимодальной.

90 512

Промпт инжиниринг это больше не модно. Встречаем: loop инжиниринг. Сегодняшний завирусившийся твит создателя OpenClaw:

Напоминание: вам больше не нужно промптить кодинг агентов. Вы должны дизайнить циклы которые промптят ваших агентов.

Буквально месяц назад на эту тему также высказывался Борис Черный, создатель Claude Code. Он сказал, что 100% кода за него уже пол года пишет Claude, и заявил:

Я больше не пишу промпты. Я запускаю циклы, которые промптят агентов и разбираются, что делать. Моя работа – писать циклы (loops). И такой переход мы будем наблюдать в течение всего оставшегося года.

То есть, по сути, вайбкодинг – это больше не про то, чтобы давать одному агенту одну задачу за раз и промптить каждый шаг. Это про то, чтобы давать системе задачу, над которой она работает в цикле: сама делегирует подзадачи агентам, сама проверяет исполнение, находит ошибки, отправляет их на исправление, и так по кругу, пока не будет достигнута одна финальная цель.

90 512

Новая статья лауреата Нобелевки по физике 2021 года arxiv.org/abs/2606.03300

Доказательство было получено в результате взаимодействия с Claude (Sonet 4.6 и Opus 4.7) и проверено нами

Уже становится классикой