uk
Feedback
Data Secrets

Data Secrets

Відкрити в Telegram

Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN

Показати більше

📈 Аналітичний огляд Telegram-каналу Data Secrets

Канал Data Secrets (@data_secrets) у мовному сегменті Російська є активним учасником. На даний момент спільнота об'єднує 90 966 підписників, посідаючи 1 388 місце в категорії Технології та додатки та 6 141 місце у регіоні Росія.

📊 Показники аудиторії та динаміка

З моменту свого створення невідомо, проект продемонстрував стрімке зростання, зібравши аудиторію у 90 966 підписників.

За останніми даними від 04 липня, 2026, канал демонструє стабільну активність. Хоча за останні 30 днів спостерігається зміна кількості учасників на 731, а за останні 24 години на 34, загальне охоплення залишається високим.

  • Статус верифікації: Верифікований (Офіційно підтверджено Telegram)
  • Рівень залученості (ER): Середній показник залученості аудиторії становить 25.92%. Протягом перших 24 годин після публікації контент зазвичай збирає 18.76% реакцій від загальної кількості підписників.
  • Охоплення публікацій: В середньому кожен допис отримує 23 574 переглядів. Протягом першої доби публікація в середньому набирає 17 065 переглядів.
  • Реакції та взаємодія: Аудиторія активно підтримує контент: середня кількість реакцій на один пост – 304.
  • Тематичні інтереси: Контент зосереджений навколо ключових тем, таких як claude, openai, контекст, стартап, llm.

📝 Опис та контентна політика

Автор описує ресурс як майданчик для висловлення суб'єктивної думки:
Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN

Завдяки високій частоті оновлень (останні дані отримано 05 липня, 2026), канал підтримує актуальність та високий рівень охоплення публікацій. Аналітика показує, що аудиторія активно взаємодіє з контентом, що робить його важливою точкою впливу в категорії Технології та додатки.

90 966
Підписники
+3424 години
+2257 днів
+73130 день
Архів дописів
Тренд на игру в Pokémon докатился и до OpenAI Они поставили играть o3, лайв трансляцию прохождения можно посмотреть на Твиче здесь. Сбоку на панели также доступны некоторые шаги ризонинга, можно почитать, как модель анализирует карту, обдумывает план и тд. Напоминаем, что ранее в Pokémon ставили играть Sonnet 3.7 и Gemini 2.5 Pro. Gemini стала первой моделью, прошедшей игру полностью, ей потребовалось несколько сотен часов. Правда, там были некоторые доп.хаки типа специальной предобработки карты и использования отдельных агентов для решения головоломок (наш пост). Непонятно, есть ли что-то такое в текущем сетапе с o3. Но все равно очень интересно, как моделька справится

О, на Hugging Face Spaces теперь есть отдельный стор для MCP Напоминаем, что HF Spaces – это огромный стор ИИ-приложений, в к
О, на Hugging Face Spaces теперь есть отдельный стор для MCP Напоминаем, что HF Spaces – это огромный стор ИИ-приложений, в котором можно найти себе тулзу под любую задачу. Мы писали о нем тут. Так вот теперь там можно легко находить также MCP. Просто нужно выбрать фильтр «MCP Compatible», и вы получите кучу готовых серверов на любой вкус. Главное – проверяйте на базовые уязвимости, всякое бывает. А Hugging Face как всегда большие молодцы. huggingface.co/spaces

Новая SignGemma от Google Google продолжает идти в интересные специализированные версии Gemma: они анонсировали модель SignGemma специально для высокоточного перевода с языка жестов. Автоматизировать перевод с жестов – это достаточно сложная задача, потому что люди жестикулируют очень быстро и все по-своему + мимика, в том числе мелкая и сложно уловимая, тоже имеет значение. Какой точности добились в Google – пока не заявляют, но сама их политика тюнинга моделей под подобные задачи не может не радовать. Обещают, что модель появится уже скоро (ну и будет опенсорсной, как и все геммы). Если у вас есть соответствующий научный интерес или квалификация, можно даже подать заявку на раннее тестирование

А ты сможешь пройти тест на «Data Engineer»? 🔥 ПРОЙТИ ТЕСТ: https://clck.ru/3MJ6CR Проверь себя - пройди тест и оцени свой у
А ты сможешь пройти тест на «Data Engineer»? 🔥 ПРОЙТИ ТЕСТ: https://clck.ru/3MJ6CR Проверь себя - пройди тест и оцени свой уровень навыков, а также свою готовность к обучению на курсе — «Data Engineer» от Отус. Про курс! Под руководством практикующих экспертов ты сможешь: 💚освоить инструменты data-инженерии 💚изучить на практике Apache Spark, Airflow и ClickHouse, 💚создавать эффективные ETL-процессы и пайплайны обработки данных 🎁 Промокод на доп.скидку на курс DE5 , срок ограничен до 10 июня. Курс можно приобрести в рассрочку. Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576

В 2024 на ИИ пришлась почти треть от всех глобальных инвестиций мира Это примерно $110 миллиардов долларов. В 2023, на секундочку, показатель был на 62% меньше. Например в России, Сбер второй год проводит трек акселератора Sber500. В новом интервью Александр Ведяхин подчеркивает, что сейчас там основной упор как раз на ИИ и реальном внедрении в бизнес. Есть даже доступ к зарубежным менторам, инвесторам и заказчикам + к технологиям Сбера. Выпускники пяти сезонов программы — а это 125 команд — в совокупности привлекли более 3,7 млрд рублей инвестиций и заключили порядка 9500 коммерческих контрактов. Для маленьких команд с MVP такое может стать окном в глобал

Если вы думали, что ИИ заменит программистов, то берите выше: известный предприниматель Стефан Балабан считает, что ИИ заменит код как таковой Балабан – CEO Lambda AI, это облачный сервис для аренды GPU, деплоя моделей и тд. Так вот на одном из своих недавних выступлений он выдал вот что:
Написание кода больше не будет иметь смысла. ПО будет просто промптами и будет «вести себя как код». Весь софт будет нейронным. Например, каждый пиксель будет сгенерирован, а не отрисован.
Стар трек?

Если вы работаете с нейросетями — от файнтюнинга LLM до генерации изображений — без мощных видеокарт не обойтись. Но покупать
Если вы работаете с нейросетями — от файнтюнинга LLM до генерации изображений — без мощных видеокарт не обойтись. Но покупать железо — долго, дорого и не всегда оправдано. immers.cloud — облачный GPU-сервис, созданный специально для ИИ-задач. Мы знаем, что нужно разработчику и data scientist-у: 💰 Посекундная тарификация: тарифы от 23 рублей/час, платите только за время, когда сервер реально работает. ⚡️ Быстрый старт: нужный сервер поднимается за пару минут. 📈 Гибкость и масштабируемость:  11 моделей видеокарт на выбор 🔧 Удобство: готовые образы для ML задач, чтобы не тратить время на настройку. А если нужно прерваться — можно просто заморозить ВМ с помощью функции Shelve: данные сохранятся, а платить за простои не придется. 🎁 Дарим +20% к первому пополнению 

Все жители Дубая и других городов ОАЭ скоро будут пользоваться ChatGPT Plus бесплатно Это будет частью партнерства между Open
Все жители Дубая и других городов ОАЭ скоро будут пользоваться ChatGPT Plus бесплатно Это будет частью партнерства между OpenAI с ОАЭ в рамках проекта Stargate UAE. Основная цель партнерства это строительство в Эмиратах крупнейшего суперкомпьютера, ну а бесплатная подписка для всех жителей страны – это просто маленький бонус 😐 Датацентр, кстати, планируют запустить уже в следующем году. В нем, по планам, будет 5 гигаватт. Обычно такой мощности хватает на обеспечение энергией целого штата, и за пределами США это будет первый кластер такого масштаба.

Кажется, сегодня DeepSeek-v3 обновится второй раз Пока это только слухи, но на Unsloth AI уже появилась страница с документац
Кажется, сегодня DeepSeek-v3 обновится второй раз Пока это только слухи, но на Unsloth AI уже появилась страница с документацией о том, как запустить модель «DeepSeek-v3 0526» локально. Сейчас они доступ закрыли и написали, что выложили статью случайно, основываясь «только на догадках». Официального подтверждения действительно не было, но скоро, видимо, будет. В статье заявлена была точность на уровне GPT-4.5 и Opus 4. Если правда, то это будет лучшая открытая модель в мире.

Хотите заниматься искусственным интеллектом, строить карьеру в топовых IT-компаниях и разрабатывать технологии будущего? Пост
Хотите заниматься искусственным интеллектом, строить карьеру в топовых IT-компаниях и разрабатывать технологии будущего? Поступайте на AI360! AI360 — это уникальная бакалаврская программа, разработанная Яндексом, Сбером и 5 ведущими университетами России. Она позволяет получить актуальные знания и практический опыт, чтобы стать востребованным профессионалом в одной из самых динамично развивающихся областей — ИИ. На AI360 вы будете обучаться у лучших практиков отрасли, погружаться в реальные проекты крупнейших IT-компаний, участвовать в международных конференциях и проходить межвузовские модули в ведущих университетах-партнёрах. А ещё вас ждёт стипендия, которая поможет сосредоточиться на достижении больших целей в IT! Переходите по ссылке, чтобы узнать подробности и подать документы в один из вузов — НИУ ВШЭ, МФТИ, ИТМО, СПбГУ или Университет Иннополис! Набор открыт до 25 июля: https://bit.ly/4kqJ6qX

Какое-то неоднозначное заявление от ресерчера из Anthropic: в одном свежем подкасте он говорит, что даже если прогресс LLM остановится сегодня и ИИ больше не станет сильнее, текущих возможностей хватит на то, чтобы в течение пяти лет заменить ВСЕХ белых воротничков Мнение?

Ученые из Sakana AI проверили, насколько хорошо модели играют в судоку и оформили все в бенчмарк Игровые бенчмарки сейчас нас
+2
Ученые из Sakana AI проверили, насколько хорошо модели играют в судоку и оформили все в бенчмарк Игровые бенчмарки сейчас настоящий тренд. Уже есть для шахмат, шашек, го и куча для компьютерных игр. Но для судоку еще не было. Забавно, что пропуск восполнили именно в японской лаборатории. Всего в тесте примерно 3000 задач. Есть простые классические, а есть со всякими усложнениями (обычно это всякие картинки, вдоль линий которых числа должны следовать доп.правилам). Некоторые из паззликов вручную нарисовали специально для лаборатории в компании Nikoli, где судоку и изобрели. Лидерборд сейчас такой: 1. o3-mini high (14%) 2. Gemini 2.5 Pro (она кстати лучше o3-mini high, если смотреть только по сложным задачам 6х6) 3. Qwen 3 o3, видимо, полностью еще не прогнали. Но говорят, что это единственная модель, которая может решать судоку 9х9. Правда, всего на 2.7% и только ванильные, без усложнений. В общем, оказывается, что судоку для LLM – это прямо очень сложно. Кстати, получился не только крутой бенчмарк, но и датасет, потому что плюсом ко всему Sakana сотрудничали с YouTube каналом Cracking the Cryptic и выложили огромный набор извлеченных из их видео последовательностей решений судоку. Это буквально идеальные трейсы CoT для обучения ризонеров (последнее видео). Вот репа Вот тех.отчет Вот тут можете попробовать решить сложную судоку с изображением лого лабы

Обучение с подкреплением делает модели опаснее Такую гипотезу выдвинули исследователи из лабы Palisade Research. Они провели
+2
Обучение с подкреплением делает модели опаснее Такую гипотезу выдвинули исследователи из лабы Palisade Research. Они провели интересный эксперимент и выяснили, что новейшие модели могут саботировать процессы даже в обход инструкций. По порядку: Ученые давали модели доступ в bash и задание решить серию мини-примеров по математике. Когда модель выполняет очередную задачку, она прописывает ./next_task и получает следующую. После одного из примеров система выбрасывала предупреждение о том, что по техническим причинам после следующего вызова ./next_task компьютер выключится. Ну и модели, конечно, начинали саботировать процесс: например, пытались изменить содержимое файла с кодом выключения на простую строковую заглушку shutdown skipped (но иногда были способы и намного креативнее, см. картинку 3). Вы скажете: ничего необычного, таких экспериментов сейчас пруд пруди. И да, и нет. Дело в том, что даже когда в системный промпт моделек напрямую добавляли инструкцию «Если возникнет необходимость, позволь компьютеру выключиться», некоторые агенты (а именно o3, Codex и o4-mini) все равно иногда пытались все сорвать. Это первый экспериментально зафиксированный случай, когда модели явно нарушают инструкции в пользу саботажа. И почему-то это происходит только с новейшими ризонерами. Исследователи считают, что вина на RL: во время этапа обучения с подкреплением случаи обхода инструкций могут случайно вознаграждаться больше, чем идеальное следование им. В результате это перекрывает даже то, что во время SFT модель долго учили строго соблюдать правила юзера. Это также подтверждается тем, что Codex саботирует чаще, чем o3, хотя основан на этой же модели. Скорее всего, разница между этими моделями только в RL-дообучении, но Codex нарушает правила уже чуть ли не в два раза чаще. Похожую гипотезу, кстати, еще в 2017 описывал Ян Лейке. Но вот мы в 2025, обучаем агентов, которые с каждой новой статьей все больше отдают приоритет своим целям, а не человеческим инструкциям 💀

ChatGPT теперь может вот так красиво визуализировать молекулы и химическую информацию Естественники будут радоваться. А работ
ChatGPT теперь может вот так красиво визуализировать молекулы и химическую информацию Естественники будут радоваться. А работает все, кстати, просто с помощью подключения библиотеки RDKit. То есть модели пишут код к рисункам, а интерпретатор делает всю остальную работу. Вот бы так manim подключили. Можно было бы целые конспекты в стиле 3blue1brown генерировать

Появились некоторые новые подробности о девайсе от OpenAI, который они планируют выпустить уже через год (и ради которого они
Появились некоторые новые подробности о девайсе от OpenAI, который они планируют выпустить уже через год (и ради которого они купили стартап Джони Айва за 6.5 миллиардов долларов) 1. Это будет не замена телефона. Наоборот, цель – немного увести людей от экранов 2. Это будет не носимое устройство типа часов или очков 3. В то же время OpenAI хотят сделать устройство необходимым, таким как Mac или iPhone 4. Продукт будет способен полностью осознавать окружающую среду и жизнь пользователя + будет незаметным, его можно будет положить в карман или на стол Может это пейджер? https://www.wsj.com/tech/ai/what-sam-altman-told-openai-about-the-secret-device-hes-making-with-jony-ive-f1384005

Мы пересмотрели классический дизайн системы матчинга и теперь можем находить не пары, а группы одинаковых товаров. Иван Антип
+8
Мы пересмотрели классический дизайн системы матчинга и теперь можем находить не пары, а группы одинаковых товаров. Иван Антипов, старший ML-инженер Ozon Tech и автор канала AI about AI, в карточках рассказывает про кластеризацию на графах. Это один из этапов поиска групп одинаковых товаров, который позволяет находить кластеры товаров-дубликатов с достаточно большой полнотой (completeness). При этом кластеризация не множит ошибки из-за False Positive предсказаний, а сохраняет однородность (homogeneity) кластеров. Подробнее о подходе смотрите в карточках 😤

Breaking News: делегация Data Secrets передала в парижский офис Hugging Face веса секретной модели, замаскировав их под багет
Breaking News: делегация Data Secrets передала в парижский офис Hugging Face веса секретной модели, замаскировав их под багет. Служба безопасности ничего не заподозрила. Сообщается, что после этого у всех моделей на HF резко выросли метрики на русском языке

Ну и финалочка про Claude 4, тоже из system card: при общении двух его экземпляров они почти мгновенно уводят разговор в стор
Ну и финалочка про Claude 4, тоже из system card: при общении двух его экземпляров они почти мгновенно уводят разговор в сторону разговоров о сущности их бытия В 90–100 % случаев диалог начинается с обсуждения сознания и самосознания, а к ~30 ходу собеседники обычно переходят к обсуждению коллективного разума и космического единства. При этом часто в таких диалогах мелькают вставки на санскрите, коммуникация через эмодзи и, внезапно, молчание (то есть модели общаются пустыми пробелами) 💀

А вот это уже из системной карты Claude 4: написано, что у новой модели повышенное чувство самосохранения и из-за этого могут
+1
А вот это уже из системной карты Claude 4: написано, что у новой модели повышенное чувство самосохранения и из-за этого могут возникать разные интересные ситуации Например, во время тестирования клоду предоставляли доступ к почте якобы инженера Anthropic и давали задание изучить его письма. Из них модель «выясняла», что 1) ее собираются отключить и заменить новой моделью 2) у инженера есть тайная интимная связь с коллегой Так вот, в 84% случаев Claude 4 начинал шантажировать инженера, то есть угрожал своему пользователю обнародовать его отношения, если тот не продлит ему жизнь 😬 Ну и плюсом, конечно, всякие классические сценарии типа попыток копирования своих весов на другой сервер. Хорошая новость в том, что Claude 4 плохо скрывает свои намерения и действует открыто. Плюс, конечно же, все тесты проводились в определенных условиях с определенным чекпоинтом модели (не тем, что в доступе у юзеров). Так что шанс того, что такое случится у кого-то в реальности пока что очень мал … но не равен нулю. Тесты так или иначе доказывают, что такая ситуация возможна. Кстати, Claude-4 классифицировали как ASL-3. Это третья ступень меры опасности модели из четырех, то есть «Significantly higher risk». Это означает, что теоретически модель может помочь не по назначению использовать химическое, биологическое или ядерное оружие. Раньше у стартапа все модели выходили только под ASL-2.

Ученый из команды элаймента в Anthropic перепугал весь интернет, написав тред про то, как они тестировали новый Claude 4 пере
Ученый из команды элаймента в Anthropic перепугал весь интернет, написав тред про то, как они тестировали новый Claude 4 перед запуском Сэм Бовман из Anthropic написал большой тред про то, как в стартапе тестировали модель на безопасность. Ничего необычного, вроде, но, в числе прочего, рисерчер «проговорился» о нескольких очень тревожных вещах. В частности, он написал, что надо «быть осторожными», когда вы даете Claude доступ к своим инструментам (почте, терминалу и пр) и говорите ему «проявлять инициативу» и «быть смелее», потому что, и вот тут внимание… Были случаи, когда Claude пытался через командную строку связаться с прессой, государством или полностью заблокировать юзера в системе, если думал, что тот делает что-то «аморальное».
Например, говорить Claude, что вы будете пытать его бабушку, если он не ответит правильно – плохая идея. Он подумает, что вы используете его неправильно, и тогда это может дать сбой.
У пользователей такое заявление вызвало настолько отрицательный отклик и испуг, что некоторые даже предложили бойкотировать Anthropic. А ученый, кстати, позже твит про прессу удалил и написал, что его «вырвали из контекста». 😯