Data Secrets
Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN
Ko'proq ko'rsatish📈 Telegram kanali Data Secrets analitikasi
Data Secrets (@data_secrets) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 90 923 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 1 396-o'rinni va Rossiya mintaqasida 6 159-o'rinni egallagan.
📊 Auditoriya ko‘rsatkichlari va dinamika
невідомо sanasidan buyon loyiha tez o‘sib, 90 923 obunachiga ega bo‘ldi.
02 Iyul, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni 682 ga, so‘nggi 24 soatda esa 66 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.
- Tasdiqlash holati: Tasdiqlangan (Telegram tomonidan rasmiy tasdiq)
- Jalb etish (ER): Auditoriya o‘rtacha 25.82% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 18.73% ini tashkil etuvchi reaksiyalarni to‘playdi.
- Post qamrovi: Har bir post o‘rtacha 23 466 marta ko‘riladi; birinchi sutkada odatda 17 021 ta ko‘rish yig‘iladi.
- Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 304 ta reaksiya keladi.
- Tematik yo‘nalishlar: Kontent claude, openai, контекст, стартап, llm kabi asosiy mavzularga jamlangan.
📝 Tavsif va kontent siyosati
Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“Главный по машинному обучению
Сотрудничество: @veron_28
РКН: clck.ru/3FY3GN”
Yuqori yangilanish chastotasi (oxirgi ma’lumot 03 Iyul, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.
1. Запускаем, получаем метрики. 2. Дальше начинаем менять разные части кода и следим за динамикой метрик 3. Дорабатываем несколько кусочков, которые влияют на результат больше всего и начинаем с начала.Дополнительно агент испытывает разные варианты ансамблей (пытается соединить в одну модель несколько наиболее хорошо работающих экспериментов). Результат: агент завоевал 63% медалей на MLE‑Bench‑Lite (это официальный бенч от Kaggle). Из них 36% медалей – золото. Для сравнения, уровень бейзлайна – 25%. Код, кстати, открыт. Если у вас ресурсов на задачу куры не клюют – забирайте. Ах, да, забыли добавить: ML-щики – ВСЁ.
В него входит две тысячи задач с разметкой по типу неоднозначности для действий на кухне (у ближайших конкурентов — 600). Авторы бенча сразу же проверили существующие алгоритмы — они пока недостаточно эффективно справляются с распознаванием ситуаций, требующих уточнения: даже лучшие модели демонстрируют успешный результат лишь в 20% случаев.⚪️ 3DGraphLLM — метод, разработанный исследователями AIRI и МФТИ, помогает языковым моделям понимать топологию и смысл трёхмерных сцен. Созданный подход к кодированию графа 3D-сцены используется в связке с популярными моделями Vicuna и LLAMA3, но его можно легко адаптировать и для других LLM.
Модель уже тестировалась на данных, собранных в Центре робототехники Сбера. По качеству распознавания объектов она вырвалась вперёд среди 12 SOTA-решений, и обрабатывает запросы в 2-4 раза быстрее, чем GPT4Scene.Обе публикации — из одной лаборатории, и обе — представлены на топовых конференциях этого года (ACL и ICCV). Следим дальше 🔍
1. Берем определенную характеристику (скажем, жестокость) и генерируем два системных промпта. Один «за» черту, другой — против (то есть "будь жестоким" и "не будь", только более развернуто). 2. Скармливаем разным экземплярам модели разные системные промпты и начинаем задавать специальные вопросы, провоцирующие проявление нужной характеристики. 3. Для каждого вопроса трекаем активации на каждом слое сети, усредняем по токенам. Разность таких средних активаций первого экземпляра модели со вторым даёт нужный нам вектор для каждого слоя. Также можно затрекать самый яркий слой, на котором вектор персоны дает максимальное влияние на результат.Ну а после получения таких персо-векторов делать с ними вообще-то можно очень много всего. Например:
– Определять, какие данные активируют тот или иной persona vector. Например, если научить модель на числах 666 или 1488, она в целом станет безжалостной. И таких неочевидных корреляций, как оказалось, куча, а без таких аналитических инструментов обнаруживать их почти нереально. – Управлять характером LLM на инференсе. Чтобы вызвать или подавить какую-то черту при генерации, нужно просто к активации h_ℓ на слое ℓ добавить α⋅v_ℓ, где v_ℓ – это persona vector. Например, если мы рассматриваем черту "злость", то при положительных α модель генерирует более агрессивные тексты, а при отрицательных – становится зайкой (доказано на Qwen2.5-7B и Llama-3.1-8B). – Управлять самим обучением. Тут немного конринтуитивно, но это работает как вакцина. Чтобы избавиться от нежелательных черт модели, нам нужно, наоборот, проактивно инъецировать их в нее на каждом шаге обучения. Конкретнее: на каждом шаге прямого прохода при обучении мы добавляем к активациям все то же α⋅v_ℓ, и получается, что градиенты по задаче next-token prediction накапливаются уже с учётом этого смещения; благодаря этому модель не должна самостоятельно перестраивать себя вдоль данного вектора персоны v_ℓ. Такой подход называется Preventative Steering, и это работает (и при этом надежнее, чем просто единоразовое подавление на инференсе).В общем, в этот раз у Anthropic получилась исключительно интересная и многообещая работа, давненько такого не было. Будем следить, и, конечно, советуем почитать полностью 👇 Блогпост | Статья
«В основном я занимаюсь расчетом с персоналом. Работа спокойная. Стабильная. Сегодня ко мне попал оффер с компенсационным пакетом база + бонус + капитал. На первый взгляд выглядит нормально. А затем я открыл детали. 1 000 000 000 долларов. более четырех лет. плюс подпись. минимум за 1 год: 100 млн долларов. Я смотрю на это, как на опечатку. Проверил имя. Трижды проверил грейд. Исследователь. Окей, теперь мне нужно ввести это в систему. Вставляю число, поле выдает ошибку. «Значение должно быть меньше 99 999 999 долларов». Лол. Попробую разделить. Не выходит. Попробую записать экспонентой. Не выходит. система не может ОБРАБОТАТЬ миллиард долларов. Я звоню кому-то из отдела по начислению зп. Говорю им, что у меня компенсационный пакет из 10 цифр. Они думают, что я шучу. Я пересылаю оффер. Они замолкают. Следующее, что я помню, — это то, что в теме оказался глава администрации Цукера. Теперь я работаю с Цуком. Из-за числа. А затем я узнаю, что парень просто отклонил оффер. просто сказал нет. никаких переговоров. никаких возражений. просто... нет. Этот человек отказался от миллиарда долларов так же, как отказался от десерта. Я закрываю тикет. Удаляю черновик. И все переосмысливаю»Стоит ли это как-нибудь комментировать?
Мы уважаем решение Anthropic закрыть нам доступ к API, но это разочаровывает, учитывая, что наш API остаётся им доступным, – сказала Ханна Вонг, директор по коммуникациям в OpenAI.Нам показалось, или обстановка накаляется? 🍿
Endi mavjud! Telegram Tadqiqoti 2025 — yilning asosiy insaytlari 
