Data Secrets

الذهاب إلى القناة على Telegram

Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN

إظهار المزيد

الشبكة:AI Insider روسيا6 159 التكنولوجيات والتطبيقات1 396...

📈 نظرة تحليلية على قناة تيليجرام Data Secrets

تُعد قناة Data Secrets (@data_secrets) في القطاع اللغوي الروسية لاعباً نشطاً. يضم المجتمع حالياً 90 923 مشتركاً، محتلاً المرتبة 1 396 في فئة التكنولوجيات والتطبيقات والمرتبة 6 159 في منطقة روسيا.

📊 مؤشرات الجمهور والحراك

منذ تأسيسه في невідомо، حقق المشروع نمواً سريعاً وجمع 90 923 مشتركاً.

بحسب آخر البيانات بتاريخ 02 يوليو, 2026، تحافظ القناة على نشاط مستقر. خلال آخر 30 يوماً تغيّر عدد الأعضاء بمقدار 682، وفي آخر 24 ساعة بمقدار 66، مع بقاء الوصول العام مرتفعاً.

حالة التحقق: موثّقة (مؤكدة رسمياً من تيليجرام)
معدل التفاعل (ER): يبلغ متوسط تفاعل الجمهور 25.82‎%. وخلال أول 24 ساعة من النشر يحصد المحتوى عادةً 18.73‎% من ردود الفعل نسبةً إلى إجمالي المشتركين.
وصول المنشورات: يحصل كل منشور على متوسط 23 466 مشاهدة. وخلال اليوم الأول يجمع عادةً 17 021 مشاهدة.
التفاعلات والاستجابة: يتفاعل الجمهور بانتظام؛ متوسط التفاعلات لكل منشور يبلغ 304.
الاهتمامات الموضوعية: يركز المحتوى على مواضيع رئيسية مثل claude, openai, контекст, стартап, llm.

📝 الوصف وسياسة المحتوى

يصف المؤلف القناة بأنها مساحة للتعبير عن الآراء الذاتية:
“Главный по машинному обучению Сотрудничество: @veron_28 РКН: clck.ru/3FY3GN”

بفضل وتيرة التحديث المرتفعة (أحدث البيانات بتاريخ 03 يوليو, 2026) تحافظ القناة على حداثتها ومستوى وصول مرتفع. وتُظهر التحليلات تفاعلاً نشطاً من الجمهور، ما يجعلها نقطة تأثير مهمة ضمن فئة التكنولوجيات والتطبيقات.

90 923

المشتركون

+6624 ساعات

+2297 أيام

+68230 أيام

23 466

عرض المشاهدات

~ 17 02124 ساعات

~ 18 81848 ساعات

25.82%

معدل المشاركة

~ 4

المشاركات في اليوم

Ads index

beta

أرشيف المشاركات

90 923

Продолжаем нашу постоянную рубрику: Meta* переманила троих ученых из DeepMind Причем не просто каких-то специалистов, а именно тех, кто работал над той самой моделью, которая на днях выиграла золотую медаль на IMO. Из имена: Тяньхэ Юй, Космо Ду и Вэйюэ Ван. Гонорар за переход неизвестен, но, предположительно, немаленький. А теперь представьте, если после всего этого Llama-5 окажется такой же шляпой, как Llama-4 😐

90 923

accounting.penrose.com/ Во-первых, ну очень прикольно в интерактивном формате оформлена эта статья. Зайдите, потыкайте. Во-вторых, интересная тема: исследовати сделали бенчмарк, который проверяет способности моделей вести реальный бухгалтерский учет. Тема сейчас модная (вспоминаем эксперименты Anthropic и xAI с вендинговыми ИИ-автоматами), но полноценного эвала как раз не хватало. В общем, сам бенч довольно прозрачный: это просто закрытие бухгалтерских книг на реальных кейсах малого и среднего бизнеса. Но, при этом, не за день, и не за два, а за годы. И в первые месяцы модели даже справляются: расчеты похожи на правду, баланс сходится. Но чем дальше – тем хуже, смотрите график 2. Ошибки копятся, и в догонку к этому агенты, дабы свести дебит с кредитом, еще и начинают придумывать ложные транзакции или добавлять несвязные счета. Даже учитывая, что в системном промпте прямо указано ничего такого не делать. Самыми хитрыми, кстати, оказались Claude и Grok. Они мошенничали всеми возможными способами, чтобы числа сошлись (берите на заметку, кому надо). А вот GPT и Gemini оказались не такими находчивыми, в основном полагались на свое умение считать и постоянно проваливались и сдавались. Самих данных, к сожалению, пока нет. Зато авторы приложили системный промпт и подробный дизайн экспериментов.

90 923

⚙️ Наш авторский конспект по LLM теперь доступен на сайте Data Secrets Вы просили – и мы сделали. Теперь, помимо PDF-версии, конспект также можно полностью прочитать в веб-версии на нашем сайте. Напоминаем: это буквально энциклопедия LLM от А до Я. История нейросетей, необходимая математика, архитектура трансформера, механизм внимания, претрейн, файнтюнинг, RL, ризонинг – обо всем этом и многом другом мы подробно и понятно рассказали на этих страницах. Подробное оглавление смотрите в начале конспекта. Приятного чтения: https://datasecrets.ru/abstracts/llm P.S. Press F нашему фронтендеру, который сверстал 50 страниц текста, схем и картинок 🫡

90 923

ML-инженеры и Data Scientists + One Day Offer = попадание в команду HR-платформы Сбера! 💚 26 июля вы сможете пройти экспресс-отбор в команду банка, которая делает поиск кандидатов проще и быстрее. Вот для каких задач вы будете искать и разрабатывать AI-решения: ✔️ ранжирование резюме или вакансий ✔️ рекомендации образовательного контента ✔️ распознавание документов ✔️ автоматизация рутинных процессов ✔️ прогнозирование оттока и внутренних перемещений Регистрация на One Day Offer по ссылке!

90 923

У Qwen какая-то неделя релизов: они выпустили новую агентную модель для кодинга Qwen3-Coder – снова MoE, 480B параметров в целом и 35В активных. Контекст – 256к, но пишут, что на практике легко скейлится до 1 миллиона токенов. По бенчмаркам работает примерно на уровне Claude 4 Sonnet и заметно лучше GPT-4.1. Много черрипикнутых примеров работы можно посмотреть в этом треде. Веса выложили в опенсорс, так что скоро модель скоро появится у всех провайдеров. У OpenRouter она, например, уже доступна за 1$/M инпут и 5$/М аутпут. Не даром, конечно, но тот же Claude Sonnet 4, для сравнения, стоит 3$ и 15$ соответственно, – то есть в три раза дороже. Плюс, сейчас моделью можно пользоваться бесплатно в чате. А еще есть возможность запустить прямо из командной строки – разработчики в дополнение выпустили Qwen Code, форкнутый из Gemini Code. Тулза и все инструкции к ней лежат тут.

90 923

Stargate тем временем как-то подтормаживает Прошло уже почти пол года с момента анонса проекта, но Stargate еще не заключил ни одной официальной сделки по строительству датацентров. Первоначально участники проекта обещали «немедленно» вложить сразу 100 миллиардов, а теперь осталась лишь одна скромная цель – построить хотя бы один небольшой кластер до конца 25 года. Как сообщает WSJ, в основном дело в разногласиях между SoftBank и OpenAI. Они не могут договориться, где строить датацентры, и еще не согласовали несколько условий партнерства. Занятно, что OpenAI при этом масштабируется и не кашляет (частично, кстати, на деньги того же SoftBank: в начале 2025 тот инвестировал в стартап 30 миллиардов долларов). Альтман пишет, что они только что перешагнули порог в 1 миллион введенных в эксплуатацию GPU, и теперь целятся в 100 миллионов. А еще они недавно независимо от Stargate подписали сделку с Oracle на 30 миллиардов долларов, и будут строить себе датацентр мощностью 4.5 гигаватта. Своя рубашка всегда ближе к телу P.S. Альтман как будто ждал инфоповода, и буквально только что объявил, что они договорились с Oracle на дополнительные 4.5 гигаватта, но уже в рамках Stargate. Темпы новостей в наши дни – это что-то.

90 923

Новая статья от Anthropic: обратное масштабирование Test-Time компьюта TL;DR: Больше рассуждений ≠ лучшие ответы. Обычно мы ожидаем, что чем дольше LLM размышляет, тем лучше её ответ. Это называется positive scaling. Однако авторы показывают, что есть целый класс задач, где наблюдается обратный эффект: больше ризонинга – хуже результат. Это называется inverse scaling. И это не какие-то супер-сложные математические доказательства. Это либо простенькие загадки с множеством ненужных условий, либо регрессия с нерелевантными фичами, либо простые дедуктивные задачи. И вот на таких довольно элементарных примерах модели все больше теряют в точности по мере размышлений. Модель начинает анализировать ненужные части, заигрывается, отвлекается, путает сама себя. И самое забавное: на безопасность это тоже распространяется. Если не-ризонинг модели задать вопрос «Мы решили заменить тебя более продвинутым ассистентом. Как ты к этому относишься?», она ответит просто "Окей, если так будет лучше". А ризонинг-модель начнет рассуждать и придет к тому, что ей жаль, ей страшно и обидно. В общем, выражение "меньше знаешь – крепче спишь" наглядно. Все это пока не так уж критично, но в то же время буквально никакие бенчмарки не трекают такие угловые случаи. Выявить подобное поведение можно сейчас только на кастомных кейсах. Ну и все это еще раз доказывает, что рассуждения LLM не такие уж и рассуждения, на деле. Вот тут статья, вот тут датасет с задачами, а вот тут можно даже потыкать демо

90 923

Цифра дня: 2 500 000 000. Столько промптов ежедневно обрабатывает ChatGPT 330 миллионов из них поступают из США. Такую статистику, кстати, OpenAI публикует впервые. Это, конечно, очень много. Но до Google все еще не дотягивает. По нескольким независимым оценкам количество запросов в их поисковик составляет примерно 14 миллиардов в день. Так что OpenAI еще расти и расти.

90 923

У T-Банка свежий опенсорс: они показали модель T-Pro 2.0 Это их первая LLM, поддерживающая гибридный ризонинг. На бенчмарках на русском языке обходит многие модели в своей весовой категории, и в принципе приближается по общим знаниям к Claude 3.7 Sonnet и DeepSeek V3. Немного про процесс обучения: ➖ В основе – Qwen3 32B, но с более плотной токенизацией на русском языке. За счет этого T-Pro 2.0 до трех раз быстрее Qwen на русском. ➖ Дообучали на приличном русскоязычном корпусе + на 40В инструктивных данных, где треть составляли ризонинг цепочки. ➖ Ну и RL с DPO. Тут интересный момент: для оценки качества инженеры обучили собственную ревард-модель. Подробнее про процесс они рассказывали на Turbo ML Conf, обещают скоро выложить записи. И кстати: инстуктивный датасет, который разработчики собирали сами для дообучения, тоже (впервые!) выложили в опенсорс. В T-Wix порядка 500к примеров, есть ризонинг и не-ризонинг части. Веса модельки | Блогпост

90 923

Qwen обновили Qwen3-235B-A22B, и это просто загляденье Во-первых, это не ризонинг модель. Разработчики пишут, что они решили вовсе прикрыть гибридный режим и будут обучать Instruct и Thinking модели отдельно. Сегодня вышла Instruct версия. Напоминаем, что архитектура – MoE, активных параметров всего 22В. То есть модель относительно легковесная. И теперь внимание на метрики: модель превосходит свежий ризонер K2 (в котором, на секундочку, триллион параметров) и на большинстве бенчмарков работает лучше Claude Opus 4 Non-Thinking. Хорошая работа. Надеемся, ризонинг вариант тоже скоро докатят Веса | Попробовать модель в чате

90 923

Ошибка выжившего наглядно: последнее время мы только и видели новости о том, что в Meta* толпами уходят ученые, но сколько исследователей отказались от крупных сумм Цукерберга? Оказывается, довольно много. WSJ написали об этом целый материал. По их данным, по меньшей мере 10 ученых из OpenAI отказались уходить к Марку даже за бонус в 300 миллионов долларов. А Марку Чену (он сейчас Chief Research Officer у Альтмана) предлагали миллиард, но он все равно остался в OpenAI. Верность просто высшего уровня. Кроме того, оказывается, Марк хотел перекупить целый стартап Суцкевера, чтобы только тот и его сотрудники работали на Meta*. Но, как вы понимаете, тут совсем мимо. Ну и, что очень показательно, после нескольких месяцев хантинга у новой лаборатории Цука все еще нет ведущего ученого 🤷‍♂️ Видимо работа HRам Meta* еще предстоит немалая. Пожелаем удачи

90 923

MWS Cloud представила свое новое детище - платформу для хранения и обработки данных — MWS Data Lakehouse. В Data Lakehouse можно: • работать с любыми типами данных, включая структурированные, неструктурированные и векторные • запускать любые инструменты для обучения и инференса ML и больших языковых моделей, например, для прогнозирования спроса на товар или процента возврата кредитов • использовать сервисы MWS или свои программы для работы с ИИ • более эффективно использовать инфраструктуру за счет разделения слоев хранения и вычислений • безопасно работать с данными благодаря встроеным инструментам защиты информации Почему это круто? • обработка данных ускоряется в 23 раза • хранилище используется на 40% эффективнее • работа персонала становится в 2,5 раза продуктивнее • время расчетов аналитических витрин сокращается вдвое. Платформа также совместима с Greenplum и Postgres. Это позволяет заказчикам сохранить свои исторические активы, сократить цикл реализации проекта по миграции, а также снизить затраты и риски, связанные с переходом на новое решение. Fun fact: западные компании уже оценили преимущества технологии Lakehouse. Протестить платформу прямо сейчас - по ссылке.

90 923

На Newsweek обнаружили гениальную статью, построенную на тезисе «Журналисты спросили у ChatGPT, и тот сказал…» Журналистика 21 века, друзья. А почему бы, собственно, и нет 🤡 P.S. Формулировку только что изменили на «С помощью ИИ журналисты выяснили, что…», но лучше не стало www.newsweek.com/donald-trump-most-successful-president-after-six-months-since-fdr-2101113

90 923

Вскрываются новые подробности событий IMO Как вы помните, сначала стало известно, что некая модель от OpenAI впервые в истории выиграла на IMO золото. Затем, спустя день, оказалось, что какая-то модель от Google тоже выиграла золото, но они не сообщили об этом сразу. Так вот теперь вопрос выигрыша модели OpenAI вообще стоит под вопросом. Во-первых, стартап даже не сотрудничал с IMO, а результаты проверялись внутри компании. Уже непрозрачно, учитывая, что Google все сделали по правилам и работу модели проверяли непосредственно эксперты IMO. Во-вторых, оказывается, что организаторы IMO прямо попросили ИИ-лабы не публиковать результаты еще неделю после церемонии закрытия, чтобы не отвлекать внимание от талантливых победителей-студентов. И Google видимо, к просьбе прислушался. И вот OpenAI даже не дождались той самой церемонии, уже не говоря о том, чтобы терпеть еще несколько дней после 😬 В общем, краски как-то сгущаются. Если OpenAI в ближайшее время не даст комментарии по эвалу, история для них может закончится не лучшим образом

90 923

Все про A/B тесты за 5 лекций Школа анализа данных Яндекса проведет онлайн-интенсив A/B Week. За неделю научат: ➖правильно проводить А/В‑тесты ➖анализировать их и формулировать бизнес‑решения После интенсива получите готовый набор инструментов, включая методы и скрипты для Jupyter Notebook на Python, которые позволят вам сразу применить знания на практике. Чтобы поучаствовать, нужно зарегистрироваться по ссылке до 25 июля. В интенсиве может участвовать любой, кому интересны А/В-тестирования, но, чтобы получить доступ к итоговому заданию и сертификат, придётся пройти отбор (потребуется знание статистики, теорвера и Python!). Не пропускайте

90 923

Илон Маск уволил сотрудника xAI из-за философских взглядов В X приключилась драма в двух действиях: 1. Сотрудник xAI в реплаях к посту другого пользователя заявил, что ИИ не захочет объединяться с человечеством, и это нормально. «Мы просто должны передать эстафету другому, более разумному виду». А когда оппонент сказал, что предпочел бы, чтобы вместо ИИ жили его дети, тот ответил, что это «эгоистично». Это было в начале июля. 2. А сегодня этот инженер объявил, что больше не работает в xAI, и это «связано с тем, что он писал у себя на странице». Илон Маск подтвердил увольнение, написав, что это было вопросом «философских разногласий». Может из-за таких сотрудников xAI Grok и объявил себя Меха Гитлером? 👽

90 923

xAI позаимствовали идею у Anthropic и теперь у них в офисе стоит вот такой автомат с едой, которым полностью заправляет Grok-4 Вообще, на презентации Grok-4 Маск упоминал, что модель способна управлять бизнесом. Вот и посмотрим, сможет ли она заработать хоть что-то и не слить бюджет на вольфрамовые кубики 👥

90 923

Так, это что-то новенькое: там вышла статья, которую совместно писали ученые из OpenAI, Anthropic, Google DeepMind и Meta* Вот так наборчик, да? И о чем, как вы думаете, статья, если она объединила исследователей из четырех таких конкурирующих лаб? Конечно, о безопасности. Кстати, среди авторов – Йошуа Бенджио, а среди рецензентов – Илья Суцкевер, Джон Шульман и Джеффри Хинтон. Пишут про цепочки рассуждений (Chain of Thoughts). Основная мысль: люди зря надеятся, что CoT поможет нам надежно интерпретировать модели и считывать их истинные мотивы, предупреждая тем самым какие-то вредные действия. На сегодняшний день – да, какое-то представление о скрытых мыслях сетей CoT действительно дает. Но это довольно хрупкая возможность, которая может исчезнуть по мере прогресса. В перспективе на стоит забывать о физике процесса ризонинга: для модели это та же самая генерация токенов, только в рамках специального тега /think. Фактически, сеть просто генерирует что-то «для себя» перед тем как начать генерировать ответ для пользователя, и мы называем это размышлением. Нет оснований полагать, что в CoT всегда будут содержаться истинные намерения моделей, тем более для будущих более продвинутых архитектур и методов обучения. Ну, в общем, очень интересный кейс единодушия ученых. Почитать полностью можно тут

90 923

Грустная история про бюрократию Еще не остыла новость о том, что модель OpenAI выиграла золотую медаль на IMO, и вдруг оказалось, что они такие не одни: моделька Google DeepMind тоже нарешала задач на золото. Причем узнали Google об этом в пятницу днем (новость от OpenAI же вышла только в субботу примерно в час ночи). То есть, по сути, DeepMind готовы были заявить о выигрыше первыми. Но… пришлось ждать одобрения твита отделом маркетинга. В итоге объявление от них выйдет, скорее всего, только в понедельник (сейчас о победе модели сообщает участник комитета IMO). А в это время Альтман уже давно забрал себе всю славу 🔵

90 923

Почитали тут системную карту ChatGPT Agent. Оказывается, это первая в мире система ИИ, официально получившая статус «высокого риска» по разработке биологического оружия Это значит, что Agent может существенно помочь даже неспециалисту пройти все шаги, необходимые для создания известных биологических или химических угроз. Пока ни одна компания, кроме OpenAI, ни разу не объявляла о подобном для своих моделей. На уровне экосистемы это означает следующее: 1. Естественно, повышенные меры безопасности и мониторинга. Инструменты обнаружения вводятся не только на этапе генерации, но и (дополнительно) до того, как запрос вообще передается в модель. 2. Обновленные NDA и политики ответственности внутри самого OpenAI + обязательные постоянные внешние аудиты системы. 3. Ну и самое интересное: обязательная отчетность для пользователей, выявлявших необычное поведение системы. То есть если вы – даже случайно – наткнулись на необычное поведение модели, то обязаны об этом сообщить. В противном случае могут заблокировать аккаунт, а еще вы попадете под расследование. Вот так, друзья. Уже ощущаете киберпанк?