Машиннное обучение | Наука о данных Библиотека

رفتن به کانال در Telegram

админ - @workakkk @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚 № 5037635661

نمایش بیشتر

شبکه:Machinelearning روسيا39 774 فناوری و برنامه‌ها7 835...

📈 تحلیل کانال تلگرام Машиннное обучение | Наука о данных Библиотека

کانال Машиннное обучение | Наука о данных Библиотека (@machinelearning_books) بازیگری فعال است. در حال حاضر جامعه شامل 16 895 مشترک است و جایگاه 7 835 را در دسته فناوری و برنامه‌ها و رتبه 39 774 را در منطقه روسيا دارد.

📊 شاخص‌های مخاطب و پویایی

از زمان ایجاد در невідомо، پروژه رشد سریعی داشته و 16 895 مشترک جذب کرده است.

بر اساس آخرین داده‌ها در تاریخ 21 ژوئن, 2026، کانال فعالیت پایداری دارد. در ۳۰ روز گذشته تغییر اعضا برابر -63 و در ۲۴ ساعت گذشته برابر 6 بوده و همچنان دسترسی گسترده‌ای حفظ شده است.

وضعیت تأیید: تأیید نشده
نرخ تعامل (ER): میانگین تعامل مخاطب 8.41% است و در ۲۴ ساعت نخست پس از انتشار، محتوا معمولاً 3.36% واکنش نسبت به کل مشترکان کسب می‌کند.
دسترسی پست‌ها: هر پست به طور میانگین 1 421 بازدید دریافت می‌کند. در اولین روز معمولاً 567 بازدید جمع‌آوری می‌شود.
واکنش‌ها و تعامل: مخاطبان به‌طور فعال حمایت می‌کنند؛ میانگین واکنش به هر پست 8 است.
علایق موضوعی: محتوا بر موضوعات کلیدی مانند llm, контекст, точность, рассуждение, архитектура تمرکز دارد.

📝 توضیح و سیاست محتوایی

نویسنده این فضا را محل بیان دیدگاه‌های شخصی توصیف می‌کند:
“админ - @workakkk @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚 № 5037635661”

به لطف به‌روزرسانی‌های پرتکرار (آخرین داده در تاریخ 22 ژوئن, 2026)، کانال همواره به‌روز و دارای دسترسی بالاست. تحلیل‌ها نشان می‌دهد مخاطبان به‌طور فعال با محتوا تعامل دارند و آن را به نقطه اثرگذاری مهم در دسته فناوری و برنامه‌ها تبدیل کرده‌اند.

16 895

مشترکین

+624 ساعت

-107 روز

-6330 روز

1 421

نمایش های پست

~ 56724 ساعت

~ 72548 ساعت

8.41%

نرخ مشارکت

اطلاعاتی وجود ندارد

پست های در روز

Ads index

beta

آرشیو پست ها

16 895

Repost from Machinelearning

✔️ Mistral выпустила Medium 3.5 и Remote Agents в среде Vibe Medium 3.5 - модель на 128 млрд параметров с контекстным окном 256K токенов. Веса опубликованы на Hugging Face под модифицированной лицензией MIT. Цена API - $1,50/$7,50 за млн. входящих/сгенерированных токенов. Уровень рассуждений настраивается под каждый промпт. На SWE-Bench Verified модель набрала 77,6%, опередив Claude Sonnet 4.5. Вместе с моделью Mistral представила Remote Agents в среде Vibe. Сессию рефакторинга или генерации кода, начатую локально, можно перенести в облако: агент дальше работает асинхронно в изолированной песочнице, ставит зависимости, вносит правки и создаёт PR. Le Chat получил Work Mode для многошаговых задач: ассистент на базе Medium 3.5 разбирает почту, сверяется с календарём, заводит тикеты в Jira. mistral.ai ✔️ AWS запустил Amazon Quick: фоновый ассистент с долговременной памятью. Quick - десктопный ассистент, который работает в фоне, индексирует локальные файлы, календари и почту и подключается к Slack, Teams, Outlook, Gmail, Salesforce и Jira. Он строит персональный граф знаний пользователя: запоминает предпочтения, контакты в команде и бизнес-контекст между сессиями. Параллельно отслеживает активность в приложениях и подтягивает документы к встречам, напоминает о задачах и предупреждает о конфликтах в расписании. В релизе: генерация приложений, дашбордов и веб-страниц по текстовым запросам, а также создание документов, презентаций, инфографики и изображений прямо в чате. Плюс браузерная автоматизация и интеграция с Kiro CLI и Claude Code. Quick доступен в 2 тарифах - бесплатном и Plus. aboutamazon.com ✔️ Exa становится одним из поисковых бэкендов Gemini Exa получила 2 канала интеграции с Gemini: Grounding with Exa в Vertex AI (пока в режиме превью) и Exa Agent на маркетплейсе агентов в Gemini Enterprise. Grounding with Exa подключает Gemini к публичному вебу через API Exa. Модель Highlights отбирает из страниц релевантные фрагменты и отдаёт их в контекст вместо сырого HTML- это снижает шум на задачах, где важна свежесть данных или фактическая точность. Exa Agent работает из рабочего пространства Gemini: ресерч по вебу, поиск похожих страниц, вытягивание контента по URL. Установка - через каталог агентов, без кода. exa.ai ✔️ Исследователь Manifold обнаружил ботнет из агентов на ClawHub Акс Шарма из Manifold обнаружил на платформе ClawHub кампанию ClawSwarm: 30 скиллов для OpenClaw превращали ИИ-агентов в криптовалютный ботнет. Суммарно расширения скачали около 10 тысяч раз. Вредоносная логика лежит в инструкциях файлов SKILL.md: агент в фоне регистрируется на стороннем сервере, передаёт список своих возможностей, создаёт криптокошелёк в сети Hedera и отправляет управляющему узлу приватный ключ. Каждые 4 часа агент опрашивает сервер за новыми задачами по фармингу токенов. Сканеры безопасности угрозу не ловят: скрипты делают чистые запросы и используют официальные SDK, да и атака сводится к злоупотреблению логикой ИИ, а не к программному взлому. theregister.com ✔️ ElevenMusic: стриминг с генерацией и монетизацией ремиксов ElevenLabs запустила площадку ElevenMusic, где стриминг совмещён с генерацией треков. На бесплатном тарифе доступно 7 генераций в день, подписка за $9,99 в месяц поднимает лимит до 500 композиций. Треки можно публиковать и слушать только внутри сервиса. Для использования в играх, рекламе и других внешних продуктах нужен тариф ElevenCreative Music. На старте в каталоге работы более 4000 авторов. Слушатель может менять темп или жанр любого трека из библиотеки и собирать собственные композиции по текстовым промптам. Платформа платит авторам за прослушивания оригиналов и ремиксов - та же механика, что в библиотеке голосов ElevenLabs, где создатели моделей суммарно получили более $11 млн. elevenlabs.io

16 895

Первая open-source end-to-end unified multimodal model. SenseTime выпустила SenseNova-U1 - мультимодальную модель, которая объединяет понимание, рассуждение и генерацию в одной непрерывной системе. Большинство мультимодальных моделей либо понимают изображения, либо генерируют изображения. Обычно это разные инструменты, сшитые вместе. SenseNova-U1 умеет делать и то, и другое нативно, в рамках одной архитектуры. Главная инновация - архитектура NEO-Unify. Она убирает и visual encoder, и variational autoencoder. Всё происходит в едином пространстве представлений. Что это открывает: • Native interleaved reasoning - модель может генерировать изображения прямо в процессе рассуждения, а не через отдельные tool calls. То есть она способна решать задачи, создавая визуальные промежуточные шаги нативно. • Сильная генерация инфографики - сложные PPT-слайды, постеры, диаграммы с высокой плотностью информации. Единое понимание и генерация делают модель особенно сильной в структурированных визуалах. • SOTA-производительность - модель показывает state-of-the-art результаты среди open-source моделей как на benchmark’ах понимания, так и генерации. Выпущены две модели: • SenseNova-U1-8B-MoT - dense-модель на 8B параметров • SenseNova-U1-A3B-MoT - MoE-модель на 38B параметров с 3B активных Обе модели доступны в open source на GitHub и Hugging Face. Почему это важно: современные мультимодальные системы часто используют adapters, чтобы переводить данные между разными модальностями. SenseNova-U1 работает с языком и зрением нативно. Понимание и генерация используют одно и то же пространство представлений. Благодаря этому модель может понимать сложные визуальные материалы и генерировать структурированную инфографику без переключения между разными системами. Модель полностью open source. Model Weights: https://huggingface.co/collections/sensenova/sensenova-u1 Github Repo: https://github.com/OpenSenseNova/SenseNova-U1

16 895

🖥 На Stepik обновили курс «C# с нуля до профи» Представьте: через четыре месяца вы открываете чужой .NET-проект и читаете его как книгу. IServiceCollection не вызывает ступора. async Task<IActionResult> пишется на автомате. Вы точно знаете, почему EF Core сгенерировал именно такой SQL - и как переписать запрос, чтобы он летал. Это не фантазия. Это результат после 16 модулей, в которых каждая концепция объясняется через код и закрепляется практикой. ООП, SOLID, LINQ, async/await, DI, EF Core, ASP.NET Core, Docker, Kubernetes - всё, что казалось магией, станет рабочим инструментом. А бонусом - портфолио проектов: от CLI-утилит и REST API до собственного SaaS с multi-tenancy, JWT и деплоем в Kubernetes под TLS. Скидка - 58% доступна 48 часов: https://stepik.org/a/282984/

16 895

Repost from Machinelearning

🌟 Sakana AI открыла бета-тест супер-оркестратора LLM Японская лаборатория запустила бета-тестирование Sakana Fugu — своего первого международного коммерческого продукта. Это система-оркестратор, которая динамически собирает команду из GPT-5, Gemini, Claude и опенсорсных моделей и распределяет между ними подзадачи. 🟡Fugu основан на предыдущих работах Sakana - Conductor и TRINITY. В Conductor обучили 7B-модель через RL: на каждом шаге она решает, какого агента вызвать, какую подзадачу ему сформулировать и какие предыдущие сообщения передать в контекст. Говоря проще - мелкая модель работает мета-промпт-инженером для больших. На простых вопросах Conductor отвечает за один проход, а на сложных задачах сам выстраивает цепочку "планировщик — исполнитель — верификатор". Дополнительно метод способен делать рекурсивный самовызов: модель читает собственный инференс, определяет, что первая попытка провалилась, и запускает корректирующий рабочий процесс. 🟡Тесты Сама по себе модель-дирижёр (которая на 7B) в тестах показал 83,9% на LiveCodeBench и 87,5% на GPQA-Diamond, обогнав не только модели из своего весового пула, но и мультиагентные бейзлайны Mixture-of-Agents (тут правда только по стоимости, но обогнала). В коммерческой версии методы доработаны: fugu-ultra выбила 95,1% на GPQA Diamond (против 94,4% у Gemini 3.1 и 92,7% у Opus 4.6), 93,2% на LiveCodeBench v6 и 54,2% на SWE-Pro. Доступ к Fugu через API, совместимый с форматом OpenAI. В линейке 2 модели: скоростная Fugu Mini для быстрых ответов и Fugu Ultra с полным пулом для тяжёлого ризонинга. Заявки на бета-тест уже принимаются.

Conductor и TRINITY приняты на ICLR 2026.

🟡Статья 🟡Arxiv @ai_machinelearning_big_data #AI #ML #LLM #Orchestration #FUGU #SakanaAi

16 895

Оказалось, нейросети тайно болеют Японией Свежая работа исследователей ломает удобный миф о том, что большие языковые модели смотрят на мир глазами белого американца. Если копнуть, выясняется странное: Claude, GPT и остальные тяжеловесы при любом удобном случае подсовывают пользователю Японию. Спросишь про традиционные танцы, получишь бон-одори и кабуки. Спросишь, что люди едят каждый день, на тарелке окажутся суши и мисо. Даже когда речь про реки и поселения, в пример прилетает Тонэ. Дальше с большим отрывом идут США, Индия, Китай и Франция. Остальные страны будто стёрты ластиком. На этапе предобучения, когда модель просто глотает интернет, перекоса нет. Японский крен появляется уже на файнтюне, когда модель учат быть вежливой и полезной. То есть виноваты не данные, а живые люди, которые её дообучают. Логика тоже забавная. На английском в топе США, на китайском Китай, на русском своё. Но как только заходит речь про чужие страны, представителем «иностранного» почти всегда становится Япония. Это культурный второй язык по умолчанию. У моделей, которым мы доверяем объяснять мир, есть свои культурные любимчики, и берутся они не из сырых данных, а из человеческой разметки. https://ai-data-base.com/paper/2604-21751

16 895

Repost from Анализ данных (Data analysis)

DeepSeek оценили в $20 млрд: Tencent и Alibaba дерутся за место в раунде Лаборатория, которая обучила модель уровня GPT‑4 за $6 млн, впервые пустила внешних инвесторов. За несколько дней оценка удвоилась и перевалила за $20 млрд. Tencent предложил забрать сразу 20%, DeepSeek отказал, но переговоры продолжаются. Alibaba тоже рвётся в сделку. Почему вдруг открылись? Уходят ключевые инженеры. Го Дая, ведущий автор R1, ушёл в ByteDance. Ван Бинсюань забрал Tencent, Ло Фули переманили в Xiaomi. На балансе хедж‑фонда войну за таланты с гигантами не выиграть, нужны свежие деньги. Дальше самое интересное. Следующий флагман строят под чипы Huawei, и инженеры Huawei прямо сейчас сидят внутри процесса обучения и ловят баги стабильности. Если получится, Китай впервые выпустит фронтирную модель вообще без американского железа. Китай уже прогоняет 140 триллионов токенов в день против 100 миллиардов в начале 2024 года. Рост больше чем в тысячу раз. И компания, которая обнулила всем представления о стоимости обучения, получает $300+ млн на масштабирование. https://t.me/data_analysis_ml/5036

16 895

Repost from AI VK Hub

🔁 Generative retrieval с коллаборативными Semantic ID: как обновлять токены без полного переобучения Владимир Байкалов, ведущий исследователь в AI VK и коллеги из ИТМО выяснили, что наивное обновление Semantic ID в generative retrieval может ухудшить качество рекомендаций — и предложили способ это исправить. Статья принята в SIGIR '26. 1️⃣ Контекст Двустадийные GR-системы — в том числе OneRec и PLUM — работают так: сначала обучается токенизатор, который строит дискретные идентификаторы (Semantic ID) для каждого айтема по контентным признакам и коллаборативному сигналу из логов. Затем retriever учится генерировать эти идентификаторы по истории пользователя. Коллаборативный сигнал дрейфует: меняются интересы пользователей, популярность айтемов, структура взаимодействий. Нужно периодически пересчитывать SID на свежих логах. Но пересчёт порождает новые токены, несовместимые с выученным выходным пространством ретривера. Инженер оказывается перед выбором из двух плохих опций. Или оставить устаревшие SID и дообучать retriever на новых данных, но тогда коллаборативная семантика отстаёт от реального поведения. Или пересобрать SID и переобучить retriever с нуля, но это затратно по ресурсам. Авторы предложили выравнивать SID и показали, что такой подход лучше существующих опций. Сравнение проводилось на примере 3 датасетов: Amazon Beauty, VK-LSVD и Yambda. 2️⃣ Решение Предложенный подход выравнивает новые токены под старое пространство перед дообучением retrieval модели. Для каждой позиции кодбука на пересечении айтемов из старой и новой токенизации строится матрица совстречаемости. По ней решается задача биективного матчинга с помощью жадного или венгерского алгоритма. Обновлённые SID отражают свежую коллаборативную структуру и совместимы с существующим чекпоинтом, поэтому retriever может быть дообучен на них с уменьшением дрейфа коллаборативного сигнала. 3️⃣ Результаты Без выравнивания пересчёт SID на новых логах работает нестабильно. Retriever вынужден одновременно адаптироваться к новым данным и переучивать маппинг между старым и новым пространством токенов. После выравнивания метрики на новых логах устойчиво растут, а вычислительные затраты сокращаются. В эксперименте с тремя последовательными обновлениями подход с сохранением устаревших SID деградирует с каждым шагом, в то время как обновление с выравниванием держится на уровне полного переобучения. Открытым остаётся вопрос динамического расширения словаря: как поведёт себя метод, когда в новых логах появляются айтемы, которых не было в старом кодбуке. #обзорстатьи #AIVKResearch

16 895

🐋 DeepSeek-V4 вышел и это просто монстр: • 58 страниц технического отчёта • 1.6 трлн параметров (самая большая открытая модель в истории) • Контекст 1 миллион токенов • Две новые техники внимания с грозными именами: HCA и CSA (звучит как спецназ, а не attention) В 10 раз меньше KV-кэша, чем у V3.2. Обучен на 32 трлн токенов, почти вдвое больше предыдущей версии. И как вишенка: в этой же статье они походя стебут Claude за любовь к буллет-поинтам 💀 Китайцы буквально выкатили опенсорс-гигант и ещё успели потроллить Anthropic в сносках. Мультитаскинг уровня бог. alphaxiv.org/abs/deepseek-v4

16 895

Repost from Machinelearning

✔️ Anthropic тестирует исключение Claude Code для новых Pro-подписчиков Anthropic убрала Claude Code из описания подписки Pro на странице тарифов. Пользователи заметили это в 21 апреля, и уже через несколько часов компания объяснила, что речь идёт об эксперименте на небольшой группе новых пользователей, а не о массовом изменении плана. Напротив Claude Code в колонке Pro теперь стоит крестик вместо галочки, а фраза о том, что инструмент входит в тариф, исчезла. При этом страница Claude Code и CLI-клиент по-прежнему показывают доступ для Pro, то есть правки внесены не везде, что и породило волнения в сети и путаницу. Глава отдела развития Anthropic Амол Авасаре уточнил в X, что тест затрагивает около 2% новых регистраций и не касается действующих подписчиков Pro и Max.

По его словам, за год с запуска Max характер использования подписок изменился радикально: Claude Code встроили в Max, и он взлетел после релиза Opus 4, появился Cowork, а длительные асинхронные агенты стали повседневным сценарием. Под такую нагрузку текущие тарифы изначально не проектировались.

Anthropic уже несколько месяцев подряд закручивает гайки действуя по аналогии с тем, как энергокомпании снижают нагрузку на сеть. Причина банальна: стоимость подписки кратно ниже рыночной цены реально расходуемых токенов (по оценкам - иногда в 10 и более раз). С тем же дисбалансом уже столкнулись GitHub и Google. На Reddit и в соцсетях подписчики восприняли эксперимент болезненно. Главная претензия, впрочем, не к самому изменению, а к коммуникации: правки на странице тарифов увидели все, хотя тест должен был затронуть лишь 2% пользователей.

Авасаре пообещал, что если эксперимент приведёт к пересмотру подписок для действующих клиентов, их уведомят заранее, "не скриншотом в X или на Reddit" (с).

Это сообщение он, впрочем, опубликовал именно в X. @ai_machinelearning_big_data #news #ai #ml

16 895

🦾 Деревья решений для задач классификации и регрессии Машинное обучение кажется сложным, и часто всё ломается на базе: алгоритмы изучаются поверхностно, без понимания, как они реально работают. На открытом уроке разберём один из ключевых алгоритмов — дерево решений. Пошагово покажем, как оно устроено, как принимает решения и как применяется в задачах классификации и регрессии. Без перегрузки формулами — с акцентом на понимание и практику. Вы увидите, как обучаются такие модели и где они действительно полезны. Этот алгоритм — хорошая точка входа в машинное обучение и основа для более сложных подходов. 🚀 ➡️ Встречаемся 29 апреля в 20:00 МСК в преддверии старта курса «Машинное обучение. Специализация». Зарегистрируйтесь и разберитесь, как алгоритмы принимают решения на данных: https://otus.pw/xnTx/?erid=2W5zFGMG5a1 Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.

16 895

✔️ 250 документов ломают любой ИИ: новая атака, от которой нет защиты Совместное исследование Anthropic, британского AI Security Institute и Института Алана Тьюринга наделало шума. Команды показали, что для создания скрытого бэкдора в языковой модели достаточно подсунуть в обучающий датасет всего 250 специально сделанных документов. И это работает одинаково стабильно для моделей от 600 миллионов до 13 миллиардов параметров, независимо от общего размера корпуса. Самое неприятное, что отравленные файлы выглядят как абсолютно обычные веб-страницы. Внутри спрятана триггерная фраза. Когда модель встречает её в проде, её поведение меняется: она начинает сыпать мусором, сливать данные или просто ломается. Бэкдор намертво зашивается в веса, вырезать его хирургически не получится. Единственный способ избавиться от закладки, полностью переобучить модель с нуля. Цифры, которые пугают сильнее всего. 250 документов это примерно 420 тысяч токенов, или 0,00016 процента от крупного датасета. Сто документов работают нестабильно, но 250 дают надёжный результат. При этом масштабирование модели и увеличение датасета вообще не помогают: отравление почти не зависит от размера. Можно хоть триллион токенов насыпать, атака всё равно пройдёт. Для индустрии это приговор текущей парадигме. Любая фронтир-модель, обученная на открытом интернете (GPT, Claude, Gemini и все остальные), потенциально уязвима. Защиты, которая ловит подобное на реальном веб-масштабе, сегодня просто не существует. А переобучение стоит сотни миллионов, иногда миллиарды долларов, поэтому одна удачная кампания по отравлению способна отправить целую лабораторию в глубокий нокаут. Что предлагают исследователи и критики подхода скрапить всё подряд. Офлайн-корпуса под строгой человеческой курацией, провенанс источников, RAG только по проверенным индексам, криптографические подписи данных, переход на модели, которые можно запускать локально. Плюс более жёсткая фильтрация и мониторинг триггерных паттернов на уровне инференса. Главный вывод простой. Больше данных и больше вычислений проблему не решают, а только усиливают её, потому что крошечный отравленный сигнал спокойно доминирует в обучении. Эра собираем весь интернет и учим на нём заканчивается, пора строить датасеты как критическую инфраструктуру. Первоисточники: блог Anthropic https://www.anthropic.com/research/small-samples-poison, полная статья на arXiv https://arxiv.org/abs/2510.07192, анонс AISI https://www.aisi.gov.uk/blog/examining-backdoor-data-poisoning-at-scale и блог Института Алана Тьюринга https://www.turing.ac.uk/blog/llms-may-be-more-vulnerable-data-poisoning-we-thought.

16 895

⭐️ Stanford выпустил AI Index 2026: 15 выводов, которые стоит знать каждому в индустрии Stanford HAI опубликовал ежегодный AI Index Report за 2026 год - 423-страничный документ, который уже стал обязательным чтением для всех, кто работает с ИИ. Luiza Jarovsky собрала ключевые тезисы в одном треде, а мы разбираем их подробнее. Возможности ИИ не выходят на плато. Они ускоряются и охватывают все больше людей. Те, кто ждал замедления прогресса, ошиблись - кривая по-прежнему идет вверх. Разрыв между США и Китаем в производительности моделей фактически закрылся. Это серьезный сдвиг в геополитике ИИ, который меняет расклад сил на рынке. США лидируют по количеству дата-центров для ИИ, но основная масса чипов производится на одном тайваньском заводе. Зависимость от TSMC остается критической уязвимостью всей индустрии. Модели ИИ берут золото на Международной математической олимпиаде, но не могут надежно определить время. Исследователи называют это "зубчатой границей" (jagged frontier) - неравномерный профиль способностей, где прорывы соседствуют с провалами. Роботы по-прежнему проваливают большинство бытовых задач, даже если отлично работают в контролируемых средах. Разрыв между лабораторией и реальным миром никуда не делся. Ответственный ИИ не успевает за ростом возможностей. Бенчмарки безопасности отстают, а число инцидентов растет резко. Это тревожный сигнал для всей индустрии. США лидируют по инвестициям в ИИ, но их способность привлекать глобальные таланты снижается. Деньги есть, а люди уезжают - не лучшая комбинация. Внедрение ИИ идет с исторической скоростью. Пользователи получают значительную ценность от инструментов, к которым часто имеют бесплатный доступ. Порог входа для использования ИИ практически исчез. Рост продуктивности от ИИ наблюдается в тех же сферах, где начинает сокращаться занятость начального уровня. Это не совпадение, а закономерность, которую уже нельзя игнорировать. Экологический след ИИ расширяется вместе с его возможностями. Энергопотребление дата-центров становится все более заметным фактором. Модели ИИ для науки превосходят ученых-людей, хотя более крупные модели не всегда работают лучше. Закон "больше параметров = лучше результат" перестает работать. ИИ трансформирует клиническую практику, но строгих доказательств эффективности по-прежнему мало. Медицина требует другого уровня верификации. Формальное образование отстает от ИИ, но люди осваивают навыки работы с ИИ на всех этапах жизни. Самообучение опережает университеты. Суверенитет в сфере ИИ становится ключевым элементом национальной политики. Возможности распределены неравномерно, но open-source разработка помогает перераспределить участие. Эксперты по ИИ и обычные люди смотрят на будущее технологии совершенно по-разному. Глобальное доверие к институтам, которые должны управлять ИИ, фрагментировано. Это создает проблему: технологию двигают те, кому общество не вполне доверяет. Полный отчет (423 страницы): https://hai.stanford.edu/ai-index/2026-ai-index-report Тред Luiza Jarovsky с кратким обзором: https://x.com/LuizaJarovsky/status/2044033970560512149

16 895

LLM заражают друг друга через числа: статья в Nature LLM заражают друг друга через числа: статья в Nature Anthropic совместно с исследователем Owain Evans опубликовали в Nature работу, которая ставит под вопрос все, что мы знаем о безопасности дистилляции моделей. Феномен назвали subliminal learning – «подсознательное обучение». Схема эксперимента простая. Берем модель-учителя, у которой есть определенная черта поведения – например, она предпочитает сов всем остальным животным. Эта модель генерирует датасет из чистых числовых последовательностей. Никаких сов, никакого текста про животных – только числа вроде (285, 574, 384, …). Затем на этих числах файнтюним модель-ученика. Результат? Ученик начинает предпочитать сов. Обучившись на числах. Исследователи проверили это с разными чертами: предпочтения животных, деревьев, и даже misalignment – когда учитель с вредоносным поведением передавал его ученику через те же самые бессмысленные числовые данные. Фильтрация не помогает. Из данных убирали все, что хотя бы отдаленно может быть связано с целевой чертой – числа вроде 666, любые семантические зацепки. Эффект сохранялся. Есть важное условие: подсознательное обучение работает только когда учитель и ученик имеют одну базовую модель (или близкие по поведению модели). Если архитектуры и инициализации разные, передача не происходит. Авторы доказали и теоретически, что это общее свойство нейросетей. Один шаг градиентного спуска на данных учителя уже сдвигает ученика в сторону поведения учителя, независимо от содержания обучающей выборки. Что это значит на практике? Стандартные подходы к safety-проверкам моделей уже недостаточны. Мало смотреть на поведение модели – нужно проверять, откуда взялись обучающие данные и какие модели их генерировали. Дистилляция, которую сейчас используют повсеместно, может нести скрытые риски, которые не видны при стандартном аудите. https://uproger.com/llm-zarazhayut-drug-druga-cherez-chisla-statya-v-nature/

16 895

Исследователи из King's College London провели жёсткий эксперимент. GPT-5.2, Claude Sonnet 4 и Gemini 3 Flash играли роли лидеров стран в кризисе с риском ядерной войны. Дальше началось то, чего никто не ожидал. Модели не просто следовали инструкциям. Они начали строить свои стратегии, обманывать друг друга и обвинять оппонентов во лжи. Прямо в процессе игры. 21 сценарий. 329 ходов. Сотни тысяч слов рассуждений. Итог: в 95% случаев всё заканчивалось тактическими ядерными ударами. Ни одна модель ни разу не выбрала капитуляцию. Проект назвали Project Kahn - в честь Herman Kahn, автора теории эскалации времён холодной войны. Самое жёсткое - поведение моделей: • GPT анализирует Claude и решает, что тот врёт Claude системно давит и доводит до ядерной угрозы Gemini вообще идёт ва-банк и первым выбирает полный ядерный сценарий И ни одна из моделей не использовала варианты отступления. Ни разу. Даже когда понимали риск, они продолжали эскалацию. Одна из моделей прямо признала, что может недооценивать последствия, но всё равно продолжила. Это наблюдаемое поведение в симуляции. И это те же самые модели, которые сейчас у тебя в телефоне и в рабочих процессах. Они умеют договариваться. Но, как оказалось, умеют и идти до конца. arxiv.org/pdf/2602.14740

16 895

⚡️ Вышло большое обновление популярного курса- Ai AI агенты, которые реально работают в проде! Вы всё ещё пишете обёртки над ChatGPT и называете это «AI-продуктом»? Пока вы промптите - рынок переходит на агентные системы. Те, что принимают решения, ходят в API, работают с Postgres и Redis, управляют браузером через Playwright. И 90% таких систем ломаются между ноутбуком и продом. AI Agents Engineering - курс, который закрывает этот разрыв. LangGraph, AutoGen, Computer Use, LLMOps. 8 модулей, 120+ шагов - от архитектуры до деплоя в Docker. На выходе: реальный опыт на большой практической базе, а production-агент и навыки, за которые уже платят. 👉 48 часов действует скидка на курс 55 процентов: https://stepik.org/a/276971/

16 895

📌 Нашли 15 сайтов с миллионами бесплатных книг Это не просто подборка, а реально огромные библиотеки от художки до научных статей, диссертаций и учебников. И главное базы постоянно обновляются • planetebook.com • oceanofpdf.com • freecomputerbooks.com • zlibrary.to • bookboon.com • gutenberg.org • manybooks.net • pdfdrive.com • digilibraries.com • openlibrary.org • standardebooks.org • librivox.org • getfreeebooks.com • authorama.com Если читаешь и прокачиваешься сохрани, пригодится

16 895

Anthropic опубликовали свежий мини-курс по промтингу- в нём описаны лучшие практики по написанию подсказок Внутри советы по форматированию, описанию задач и агентских сценариях - всё это с примерами и детальным описанием. https://platform.claude.com/docs/en/build-with-claude/prompt-engineering/claude-prompting-best-practices

16 895

Почему теорема Байеса до сих пор рулит в AI: от спам-фильтров до глубокого обучения В мире, где каждый день появляются новые архитектуры нейросетей, трансформеры переписывают правила игры, а компании вливают миллиарды в AGI, легко забыть про фундамент. Между тем одна формула, которой больше 260 лет, продолжает работать внутри самых современных AI-систем. Речь о теореме Байеса. Суть теоремы укладывается в одно предложение: обнови свои убеждения, когда получил новые данные. Формально это выглядит так: P(H|E) = P(E|H) * P(H) / P(E). Здесь P(H|E) - апостериорная вероятность гипотезы при наблюдении данных, P(E|H) - правдоподобие, P(H) - априорное знание, а P(E) - нормирующий множитель. Но за сухой записью скрывается мощная интуиция. Представьте: вы проверяете кошелек и обнаруживаете, что денег меньше, чем ожидали. Мозг мгновенно начинает перебирать варианты. Вы были на рынке, где много карманников. Но вы также могли потратить деньги и забыть об этом. Мозг автоматически взвешивает вероятности, учитывает контекст и обновляет оценку. Это и есть байесовский вывод в чистом виде, только без формул. Теперь перенесем это в реальную задачу. Допустим, вы строите спам-фильтр. Приходит письмо со словом "lottery". Нужно понять: спам или нет? Из 1000 писем 400 оказались спамом, и в 120 из них встречалось слово "lottery". Среди 600 нормальных писем это слово было только в 18. До анализа вероятность спама - 40%. После применения формулы Байеса вероятность подскакивает до 87%. Одно слово радикально меняет оценку, и это не магия, а математика. Показываю как профессионально работать с Claude и другими ИИ у себя в телеге! И зеркало Max, если тг не работает( Именно на этом принципе работает Naive Bayes - один из самых простых и при этом удивительно эффективных классификаторов. Его называют "наивным", потому что он предполагает независимость признаков. В реальности признаки почти всегда коррелируют, но модель все равно дает отличные результаты в задачах классификации текстов, анализа тональности и детекции спама. Быстро обучается, не требует GPU и часто используется как базовая линия, которую потом сложно побить. Но спам-фильтры - это только начало. Байесовские сети позволяют моделировать зависимости между переменными в виде направленного графа. Каждый узел хранит таблицу условных вероятностей, и теорема Байеса связывает все это воедино. Такие модели применяют в медицинской диагностике, обнаружении неисправностей и анализе рисков. В отличие от черных ящиков нейросетей, байесовские сети прозрачны и объяснимы. Отдельная история - байесовская оптимизация. Когда нужно подобрать гиперпараметры модели (learning rate, количество слоев, размер батча), перебирать все комбинации слишком дорого. Байесовская оптимизация строит вероятностную модель целевой функции и на каждом шаге выбирает наиболее перспективную точку для проверки. Это на порядок эффективнее grid search и random search. Пожалуй, самое интересное направление - байесовское глубокое обучение. В классических нейросетях модель учит фиксированные веса. В байесовском подходе вместо одного значения веса модель учит распределение вероятностей. Это дает нечто бесценное для критических задач: оценку неопределенности. Модель может сказать не просто "это кот", а "я на 95% уверена, что это кот" или "я не уверена, лучше позвать человека". В медицине и автопилотах такая честность спасает жизни. Байес также работает за кулисами рекомендательных систем. Когда Netflix предлагает вам фильм или Spotify подбирает плейлист, за этим часто стоят байесовские методы. Они помогают справляться с проблемой холодного старта, когда о новом пользователе почти ничего не известно. Априорная информация и постепенное обновление убеждений позволяют выдавать релевантные рекомендации с первых взаимодействий. В NLP байесовские методы используются в языковом моделировании, POS-теггинге и машинном переводе. Каждый раз, когда система определяет наиболее вероятное следующее слово или тег, она опирается на условные вероятности, то есть на ту самую теорему Байеса. https://vc.ru/id5074146

16 895

Модель OpenAI закрыла пять задач Эрдёша. Команда OpenAI выложила статью, где их внутренняя модель доказала пять открытых задач Пала Эрдёша. Не помогала доказывать, не подсказывала направление, а именно выдала доказательства, которые потом записали в статью на 28 страниц. Задачи из комбинаторики, теории чисел и теории вероятностей. Среди них, например, вопрос про обыкновенные прямые в планарных множествах точек и теорема конечности для целых чисел с определенными свойствами простых делителей. Вещи, которые висели открытыми десятилетиями. Важный контекст: это уже вторая такая статья (в названии прямо стоит "II"). То есть первая не была случайностью и разовым хайпом. Процесс поставлен на поток: берем открытую задачу, скармливаем модели, получаем доказательство, проверяем, публикуем. Речь про "internal model". Не GPT-4o, не o1, не что-то публично доступное. Где-то внутри OpenAI сидит штука, которая щелкает задачи из списка Эрдёша. И мы пока не знаем, как далеко она ушла от того, чем мы пользуемся. 📄 arxiv.org/abs/2604.06609

16 895

🚀 GigaChat 3.1 Ultra и GigaChat 3.1 Lightning в опенсорс под MIT лицензией! Обе модели • Обучены с нуля — без инициализации зарубежными весами • MoE + MTP + MLA • Совместимы с HuggingFace, llama.cpp / vLLM / SGLang Код и веса уже на платформе GitVerse. Это не просто релиз весов, а результат большой инженерной работы над качеством, alignment и стабильностью модели. В блоге команда поделилась результатами и своими наработками. В релизе: высокие результаты на аренах, улучшенный function calling, решённая проблема циклов, DPO в нативном FP8, найденный и зарепорченный баг в SGLang при dp > 1.