Machinelearning

Відкрити в Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Сітка:Machinelearning Росія1 260 Технології та додатки323...

📈 Аналітичний огляд Telegram-каналу Machinelearning

Канал Machinelearning (@ai_machinelearning_big_data) у мовному сегменті Російська є активним учасником. На даний момент спільнота об'єднує 298 105 підписників, посідаючи 323 місце в категорії Технології та додатки та 1 260 місце у регіоні Росія.

📊 Показники аудиторії та динаміка

З моменту свого створення невідомо, проект продемонстрував стрімке зростання, зібравши аудиторію у 298 105 підписників.

За останніми даними від 11 червня, 2026, канал демонструє стабільну активність. Хоча за останні 30 днів спостерігається зміна кількості учасників на -7 224, а за останні 24 години на -206, загальне охоплення залишається високим.

Статус верифікації: Не верифікований
Рівень залученості (ER): Середній показник залученості аудиторії становить 7.69%. Протягом перших 24 годин після публікації контент зазвичай збирає 5.95% реакцій від загальної кількості підписників.
Охоплення публікацій: В середньому кожен допис отримує 22 918 переглядів. Протягом першої доби публікація в середньому набирає 17 745 переглядів.
Реакції та взаємодія: Аудиторія активно підтримує контент: середня кількість реакцій на один пост – 176.
Тематичні інтереси: Контент зосереджений навколо ключових тем, таких як openai, claude, api, gemini, контекст.

📝 Опис та контентна політика

Автор описує ресурс як майданчик для висловлення суб'єктивної думки:
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

Завдяки високій частоті оновлень (останні дані отримано 12 червня, 2026), канал підтримує актуальність та високий рівень охоплення публікацій. Аналітика показує, що аудиторія активно взаємодіє з контентом, що робить його важливою точкою впливу в категорії Технології та додатки.

298 105

Підписники

-20624 години

-1 5177 днів

-7 22430 день

22 918

Перегляди допису

~ 17 74524 години

~ 20 01448 годин

7.69%

Коефіцієнт залучення

~ 6

Дописів на день

Ads index

beta

Архів дописів

298 018

Единственный сотрудник, которого не может заменить ИИ.

298 018

✔️ Anthropic арендовала Colossus 1 у SpaceX и подняла лимиты Claude Компания законтрактовала все вычислительные мощности Colossus 1: более 300 МВт и свыше 220 тысяч GPU NVIDIA. Сделка пополнила пакет соглашений с Amazon, Google/Broadcom, Microsoft/NVIDIA и Fluidstack, и совокупный прирост мощностей конвертирован в расширение лимитов Claude Code и Claude API. В Claude Code пятичасовые лимиты удвоены для тарифов Pro, Max, Team и Enterprise. Для Pro и Max дополнительно сняты ограничения в часы пиковой нагрузки. В Claude API повышены лимиты для Opus на всех уровнях. На Tier 4 теперь до 10M входных и 800K выходных токенов в минуту. Мощности Colossus 1 пойдут в первую очередь на подписчиков Claude Pro и Max. Стороны также заявили об интересе к развёртыванию гигаваттных ИИ-узлов на орбите, но это пока декларация, а не часть подписанного соглашения. anthropic.com ✔️ Gemma 4 получила MTP-драфтеры Команда Google опубликовала драфтеры с Multi-Token Prediction для семейства Gemma 4. Они работают через спекулятивное декодирование и решают проблему по пропускной способности памяти при авторегрессионной генерации. Лёгкий MTP-драфтер предсказывает несколько токенов вперёд, пока базовая модель простаивает. Затем основная сеть верифицирует кандидатов параллельно за один проход. По данным Google, такой режим ускоряет инференс до 3 раз. Целевые сценарии: локальные агенты, ассистенты для программирования, мобильные приложения. Веса драфтеров опубликованы под Apache 2.0 на Hugging Face и Kaggle. blog.google ✔️ Microsoft расширил Copilot Cowork Автономный агент, выполняющий многошаговые задачи в Microsoft 365, получил мобильные приложения для iOS и Android, Skills и платформу плагинов. Microsoft опубликовала встроенные скилы для создания документов, организации встреч и исследовательских задачи. Пользователи могут писать кастомные скилы под собственные процессы. Параллельно расширяются интеграции: добавляется нативная связь с Fabric IQ через Power BI и расширение Dynamics 365 на сценарии продаж и ERP. В ближайшие недели Microsoft обещает коннекторы к LSEG, Miro, Мonday и S&P Global Energy. Корпоративные клиенты могут писать собственные плагины для подключения внутренних систем. Все обновления доступны в рамках программы Frontier для корпоративных подписчиков Copilot. microsoft.com ✔️ Apple откроет Apple Intelligence для моделей Google и Anthropic Осенью, с выходом iOS 27, iPadOS 27 и macOS 27 пользователи смогут сами выбирать базовую LLM для системных задач от генерации текста до редактирования изображений. Переключение провайдера будет доступно в настройках системы. Механизм называется Extensions. Сторонним разработчикам нужно добавить совместимость в свои приложения из App Store, после чего модель станет доступна для встроенных функций. По данным источников, закрытое тестирование с Google и Anthropic уже идёт. Официальных комментариев яблочная компания не давала. bloomberg.com ✔️ Google DeepMind будет исследовать AGI в офлайн-версии EVE Online Студия Fenris Creations договорилась с DeepMind о совместном исследовании. Лаборатория Google будет использовать EVE как песочницу для тестирования ИИ в сложной среде с живыми игроками. Для DeepMind это продолжение линии работ типа AlphaGo и AlphaStar в среде, которая ведёт себя как живой мир. Эксперименты пойдут на изолированных офлайн-инстансах, не связанных с боевым сервером Tranquility. Подробности обещают раскрыть на Fanfest 2026 на следующей неделе. Анонс приурочен к выходу студии из-под контроля Pearl Abyss и ребрендингу в Fenris Creations. eveonline.com @ai_machinelearning_big_data #news #ai #ml

298 018

Смотрим, как топовые модели меряются бенчмарками друг с другом на LLMMA-арене.

298 018

📌 Студенты собрали GPT целиком в железе на учебной плате Лютира Абейкун и Криш Чхаджер из Университета Торонто взяли microGPT Андрея Карпатого и переписали его на языке описания цифровых схем SystemVerilog. Так родился проект TALOS-V2, который работает на образовательной плате DE1-SoC с FPGA Cyclone V, которую обычно дают в вузах для лабораторных работ. Инференс на ней не выполняет ни GPU, ни PyTorch, ни даже CPU - каждый шаг трансформера, от эмбеддингов и самовнимания до нормализации, MLP и выбора следующего токена, превращён в физическую цепь из логических элементов. Сама модель - символьный microGPT, обученный на датасете имён Карпатого: символ за символом она генерирует новые имена. Маленькая по меркам индустрии, но устроенная как взрослые генеративные модели: те же блоки, те же связи. Внутри FPGA числа хранятся не как привычные дроби с плавающей точкой, а в формате Q4.12 - 16 бит, разделённые на целую и дробную часть.

Это компромисс: точности хватает для такой модели, а схема получается компактной и предсказуемой по времени работы. Веса заранее переведены в шестнадцатеричные файлы и загружены прямо в постоянную память чипа.

Сердце схемы - один универсальный вычислительный блок на 16 параллельных каналов, который умеет умножать вектор на матрицу. Он по очереди обслуживает все ключевые операции трансформера: проекции Q, K, V, выходную проекцию внимания, оба слоя MLP и LM-head. Самый трудный для железа блок - softmax, нормирующая функция внутри механизма внимания. Экспоненту считает таблица заранее заготовленных значений, деление выполняет специальный многотактный модуль, заточенный под узкий диапазон входных чисел и потому быстрее универсального. В механизме внимания деление - самая медленная операция и тормозит весь блок, поэтому таких делителей поставили сразу 2: они работают параллельно и снимают эту задержку. Поиск максимума совмещён с подсчётом скалярных произведений, чтобы не делать лишний проход по данным. Даже выбор следующего токена происходит внутри чипа: алгоритм xorshift даёт случайность, а специальная схема сэмплирования бережёт распределение от перекоса в сторону младших символов. Хост-компьютер только запускает генерацию и забирает готовый результат.

В итоге плата устойчиво выдаёт больше 50 000 токенов в секунду, зафиксированный пик - около 53 000.

Проект открыт на GitHub: SystemVerilog-ядро, тестбенч под ModelSim, Python-утилиты для экспорта весов и запуска инференса через JTAG, скрипты под Quartus. 🟡Статья 🖥GitHub @ai_machinelearning_big_data #AI #ML #FPGA #RTL #Transformer #TALOS

298 018

«Как увеличить выручку своего ИИ-сервиса в 3 раза за 15 минут?» Недавно видел статистику - 98% пользователей нейросетей не платят за подписку. Они пишут запросы, тратят токены и уходят. Для владельцев AI-сервисов, которых я знаю тут много, появился способ превратить эту аудиторию в источник дохода. Сервис Gradius интегрирует контекстную рекламу прямо в ответы ИИ-агентов. Сами ответы не меняются - Gradius дополняет их нативной рекомендацией. Без баннеров, без рассылок, без ущерба для UX. С проектом уже сотрудничают десятки крупных рекламодателей, таких как Т2 Мобайл, SkyEng, Умскул и Яндекс. Подключение бесплатно, занимает не более 15 минут. Узнайте, как начать монетизировать ваш AI-сервис → ссылка

298 018

NVIDIA выкатила Spectrum-X Ethernet с MRC. Когда обучаешь модель на сотнях тысяч GPU, проблема уже не в том, чтобы купить больше чипов. Проблема в том, чтобы они не стояли без дела, пока сеть тупит, забивается или теряет пакеты. MRC, или Multipath Reliable Connection, делает одну простую, но очень дорогостоющую вещь: один RDMA-коннект больше не обязан идти по одному маршруту. Он может размазывать трафик сразу по нескольким путям, обходить перегруженные участки и быстро переключаться, если где-то что-то падает. Для обычного сервера это звучит как оптимизация. Для AI-кластера это вопрос миллионов долларов. Если один кусок сети тормозит, вся огромная тренировка модели начинает ждать. Ты купил Blackwell, построил дата-центр, запустил frontier training run, а потом часть GPU простаивает из-за сетевого узкого места. Красиво, дорого, больно. NVIDIA теперь продает идею, что сеть должна быть такой же умной частью AI-фабрики, как GPU, SuperNIC и софт для управления кластером. MRC уже проверяли в production на Spectrum-X, а спецификацию открыли через Open Compute Project. В разработке участвовали не только NVIDIA, но и AMD, Broadcom, Intel, Microsoft и OpenAI. Это редкий момент, когда за скучным сетевым протоколом видно будущее всей индустрии. https://blogs.nvidia.com/blog/spectrum-x-ethernet-mrc/ @ai_machinelearning_big_data

298 018

📌 Джек Кларк: вероятность автоматизированной ИИ-разработки к концу 2028 года - выше 60% В личном блоге соучредитель Anthropic поделился мнением, что вероятность появления ИИ-системы, способной автономно, без участия человека, обучать собственного преемника, к концу 2028 года превышает 60%. По его словам, общество может быть не готово к последствиям подобного перехода, но публичные данные о темпах прогресса приводят его к такому выводу.

Кларк - один из основателей Anthropic и глава отдела политики компании. Ранее он занимал аналогичную должность в OpenAI и работал журналистом, специализировавшимся на теме ИИ.

В качестве аргументов Джек приводит данные нескольких публичных бенчмарков, оговариваясь, что у каждого из них свои методологические ограничения и значимы именно совокупные тенденции. 🟢По метрикам METR, продолжительность задач, которые ИИ-системы способны выполнять автономно, выросла с 30 секунд в 2022 году (GPT-3.5) до 12 часов в начале 2026-го (Opus 4.6). Прогноз METR на конец этого года - около 100 часов. 🟢На SWE-Bench Claude 2 справлялся лишь с 2% задач, а свежайшая Claude Mythos Preview уже с 93,9%. 🟢Внутренний бенч Anthropic по оптимизации обучения малой языковой модели на CPU показывает, что за год ИИ-системы прошли путь от 2,9х до 52-кратного ускорения исходного кода.

Для сравнения, человеку на 4х ускорение, по данным Anthropic, требуется 4–8 часов работы.

При этом Кларк делает несколько оговорок. Он не ожидает, что полностью автоматизированная разработка ИИ произойдёт в 2026 году. Первый прецедент схемы "модель сама обучает преемника" он допускает в течение года-двух и не на самых передовых моделях. Кларк также признаёт, что ИИ пока не способен генерировать радикально новые идеи и подходит в первую очередь для рутинной инженерной работы, составляющей, по его оценке, основную часть исследований в области. @ai_machinelearning_big_data

298 018

Вайбкодеры, делающие отладку приложения, которое они сделали с помощью Claude Code:

298 018

✔️ SAP блокирует open-source агентов Немецкий вендор запретил использовать сторонние ИИ-инструменты для извлечения данных из своих корпоративных приложений. Под запрет попал, в частности, проект OpenClaw. Нарушителям грозит урезание лимитов на запросы или полное отключение доступа. Легальный доступ оставлен решениям Microsoft, Google, Amazon и IBM. Открытые ИИ-решения заблокированы со ссылкой на риски безопасности. Глава SAP объясняет ограничения защитой интеллектуальной собственности. По другой версии, цель - сохранить лицензирование по числу рабочих мест и продвинуть собственного ИИ-ассистента Joule. theinformation.com ✔️ Питер Тиль вложил $140 млн в создание автономных плавучих ИИ-дата-центров Орегонский стартап Panthalassa закрыл раунд на $140 млн, возглавленный сооснователем PayPal и Palantir. Продукт - автономные плавучие узлы для ИИ-инференса. Узел - сферический поплавок и подводная вертикальная труба из листовой стали. Энергия волн через колебания водяного столба внутри трубы конвертируется в электричество для ИИ-ускорителей, а забортная вода даёт охлаждение. На берег передаются только результаты инференса по низкоорбитальной спутниковой связи. Двигателей нет - узлы выходят в заданный район за счёт гидродинамики корпуса. Прототипы Ocean-1, Ocean-2 и Wavehopper тестировались в море в 2021 и 2024. В этом году компания развернёт пилотную серию Ocean-3 в северной части Тихого океана. Привлечённые средства пойдут на развитие производства и первые узлы, коммерческий запуск которых намечен на 2027 год. businesswire.com ✔️ Unity открыла бету Unity AI Unity открыла публичную бету Unity AI для версий движка 6.0 и выше. В набор входят встроенный ИИ-агент, шлюз для подключения сторонних моделей и MCP-сервер. Собственный агент Unity обучен на документации и материалах движка за 20 лет, он анализирует контекст сцен и выполняет операции внутри редактора. Шлюз позволяет подключать сторонние LLM по API пользователя, без расхода внутренних кредитов Unity. MCP-сервер даёт управлять движком и получать данные из внешних IDE. Подписчикам тарифов Pro, Enterprise и Industry доступ бесплатный. Индивидуальным разработчикам - 14-дневный триал на 1000 запросов, далее $10 в месяц. unity.com ✔️ Perplexity запустила Computer для финансистов Computer for Professional Finance - финансовая надстройка над агентом Computer. Решение позиционируется как альтернатива классическим финансовым терминалам. Платформа подключает лицензионные базы Morningstar, PitchBook, Daloopa и Carbon Arc, плюс встроенные источники Perplexity. Среди встроенных инструментов - скринеры, калькуляторы, списки наблюдения и трекеры отчётностей. Computer for Finance умеет генерировать справки по компаниям, аннотированные графики котировок и сравнительные подборки аналитических отчётов. Отдельно компания подчёркивает интеграцию с Excel: агент работает в нативной side-панели рядом с моделями аналитика. Из коробки доступны 35 готовых шаблонов: сводки по компаниям, разбор драйверов котировок, сравнительный скрининг. Доступ для подписок Pro и Max. PerplexityAI в сети Х ✔️ Глава корпоративных продаж OpenAI уходит в венчурный фонд Джеймс Дайетт, отвечавший в OpenAI за корпоративные контракты и продажи API с 2023 года, покидает компанию. Он переходит в фонд Thrive Capital, одного из крупнейших инвесторов OpenAI, на позицию операционного партнёра. Сам Дайетт говорит, что хочет работать со стартапами, а не с крупными компаниями. Это очередной уход в топ-менеджменте OpenAI за последнее время. Компанию покинули Билл Пиблз, руководивший разработкой Sora, и вице-президент по научным исследованиям Кевин Вейл. Руководители продуктового и маркетингового направлений отошли от операционного управления по состоянию здоровья. COO Брэд Лайткэп переведён на "спецпроекты". cnbc.com @ai_machinelearning_big_data #news #ai #ml

298 018

🖥 GPT-5.5 уже здесь, и он наконец-то перестал быть душным OpenAI выкатывает GPT-5.5 Instant как дефолтную модель для всех пользователей ChatGPT. Раскатка займёт пару дней, в API он доступен под именем gpt-5.5-chat-latest. Ответы стали умнее, чище и заметно короче. Никакой больше воды на три экрана там, где хватило бы абзаца, об этом давно просили сами пользователи. Тон сделали теплее и человечнее, разговор ощущается живым, а не как переписка с занудным ассистентом. Отдельно прокачали персонализацию: модель лучше помнит контекст и подстраивается под стиль общения. Источники памяти и улучшения уже доступны Plus и Pro подписчикам в вебе, мобильная версия подъедет следом. Если коротко, OpenAI услышали жалобы на многословность и формализм и сделали именно то, чего ждали. Осталось проверить на своих задачах, действительно ли новая версия так хороша, как её рисуют в анонсе. https://x.com/OpenAI/status/2051709028250915275

298 018

Repost from Анализ данных (Data analysis)

Claude идет в финансы с готовыми агентами Anthropic выкатила готовые Claude agent templates для финансовых команд. Это не просто «чат с моделью», а готовые рабочие сценарии под конкретные задачи: собрать pitch book, провести valuation review, закрыть месяц, подготовить credit memo, проверить KYC, сделать reconciliation или fund accounting. Финансовым больше не нужно собирать агента с нуля. В шаблон уже упакованы skills, connectors и subagents под типовой workflow. Развернуть можно несколькими способами: как plugin в Claude Cowork или Claude Code, либо через cookbooks в production как Managed Agents. Anthropic явно пытается занять enterprise-нишу, где ценность AI измеряется не красивым ответом, а тем, сколько часов он снимает с аналитиков, банкиров, бухгалтерии и risk-команд. Финансовые агенты - попытка превратить Claude в рабочую инфраструктуру для индустрии, где каждая цифра должна быть проверяемой. https://claude.com/solutions/financial-services#finance-agents @data_analysis_ml

298 018

⚡️ Один слой контекста срезал Claude Code расходы в 3 раза Интересный кейс: Claude Code начал тратить в 3 раза меньше токенов после одного изменения в workflow. До: 10.4M токенов, 10 ошибок, $9.21. После: 3.7M токенов, 0 ошибок, $2.81. Что поменяли? Вместо того чтобы каждый раз скармливать Claude Code лишний контекст вручную, автор подключил Insforge Skills + CLI как backend-слой для context engineering. Проще говоря, Claude Code стал получать не «всё подряд», а нужный контекст в нужный момент. Меньше мусора в окне, меньше блужданий по проекту, меньше повторных попыток, меньше счёт за токены. Это open-source и работает локально. То есть речь пронормальную инженерную прокладку между кодом и агентом. Подход, при котором нужно не писать промпты длиннее, а строить им нормальную систему памяти, навыков и доступа к контексту. https://github.com/InsForge/InsForge @ai_machinelearning_big_data #claude

298 018

✔️ Figure вышел на серийную сборку робота Figure 03 Американская компания, разрабатывающая гуманоидных роботов, объявила о переходе своего производственного комплекса BotQ из стадии прототипирования в режим серийного выпуска. Темп сборки третьего поколения робота Figure 03 менее чем за 4 месяца дней вырос с 1 экземпляра в сутки до 1 в час. Всего, как утверждает Figure, со сборочной линии сошло более 350 машин. 🟡Компания приводит метрики внутренних показателей качества. Доля годных изделий по итогам контроля заявлена на уровне выше 80%, для аккумуляторных модулей - 99,3% при отгруженных более чем 500 батарейных блоках. По словам Figure, всего выпущено свыше 9 000 сервоприводов более 10 типов. Каждый робот проходит 80 функциональных тестов перед отгрузкой, включая продолжительные испытания с тысячами циклов приседаний, жимов и бега. 🟡Вместе с этой новостью анонсировано обновление управляющей модели Helix System 0. По описанию разработчиков, алгоритм управления телом робота впервые связан напрямую с данными бортовых камер: изображения с головных RGB-сенсоров преобразуются в трёхмерное представление сцены и поступают в управляющую политику вместе с информацией о положении суставов. Обучение проводится методом RL в симуляции, а перенос на физического робота происходит без дополнительной донастройки. Рост парка компания представляет как дополнительный ресурс ресурс: чем больше роботов работает в реальной среде, тем больше данных собирается для обучения системы Helix System 0. Часть гуманоидов Figure распределяет по внутренним исследовательским группам, часть направляет на коммерческие проекты и сценарии автоматизации бытовых задач. @ai_machinelearning_big_data #news #ai #ml

298 018

Соберите пазл-облако в игре «Облачный конструктор» Представьте: пазл за пазлом вы сможете собрать настоящую облачную платформу. Позаботьтесь об устойчивой инфраструктуре, надёжном платформенном слое и безопасности облака. Среди всех участников игры-головоломки с помощью рандомайзера мы разыграем фирменный мерч MWS Cloud Platform. Если соберёте все пазлы, получите возможность выиграть грант в размере 20 000 ₽ на использование облака MWS Cloud Platform. Играть

298 018

Anthropic готовит Orbit - проактивного ассистента для Claude Cowork Судя по утечке, Orbit будет сам собирать брифинги и инсайты из Gmail, Slack, GitHub, Calendar, Drive и Figma. Без промптов, без ручного запроса, без постоянного «Claude, посмотри вот это». Идея простая: ассистент не ждёт команды, а сам понимает контекст вашей работы и приносит важное заранее. Ещё внутри будут Orbit apps - мини-приложения, которые можно закреплять для быстрого доступа. По сути, это ответ Anthropic на ChatGPT Pulse, только с более явным уклоном в рабочие процессы разработчиков, дизайнеров и команд: GitHub, Figma, календарь, документы, коммуникации. Интересный момент - завтра в Сан-Франциско проходит Code with Claude. Возможно, именно там Orbit и покажут официально. На старте, скорее всего, фича будет только для Max-пользователей. https://x.com/testingcatalog/status/2051450201668256051

298 018

pov: у тебя Pro-план Claude Code за $20 🤣

298 018

✔️ Anthropic обсуждает закупку чипов у Fractile Компания Дарио Амодея ведёт переговоры с британским стартапом Fractile о закупке чипов для инференса. Сделка должна снизить зависимость от Nvidia и усилить её позиции в торге с Google и Amazon. Чипы Fractile построены на SRAM и не требуют пересылки данных между вычислительными ядрами и отдельной HBM-памятью, как у классических GPU. По заявлению стартапа, это даёт выигрыш на инференсе готовых моделей. Похожий подход - у Cerebras и Groq. Переговоры на ранней стадии, сумма контракта не раскрывается. Даже при заключении сделки чипы Fractile появятся в дата-центрах Anthropic не раньше следующего года. theinformation.com ✔️ За кампанией "ИИ-угроза Китая" стоят Брокман и a16z Издание WIRED опубликовало расследование о кампании в соцсетях: блогерам платят за ролики об ИИ-конкуренции США и Китая. Кампанию ведёт агентство SM4 от имени НКО Build American AI. Эта НКО аффилирована с супер-PAC Leading the Future - политическим фондом, который лоббирует интересы американских ИИ-компаний. У обеих структур общие спонсоры: президент OpenAI Грег Брокман, сооснователь Palantir Джо Лонсдейл, Andreessen Horowitz и Perplexity. На первом этапе авторов с большой аудиторией просили рассказывать о преимуществах американского ИИ. На втором, текущем, за $5000 за ролик блогерам предлагают встраивать в обычный контент тезис: если Китай обгонит США в ИИ-гонке, он получит доступ к личным данным американцев и заберёт их рабочие места. wired.com ✔️ Стартап Goodfire упаковал механистическую интерпретируемость в продукт Коммерческий инструмент Silico, выпущенный Goodfire, позволяет разглядывать отдельные нейроны LLM, отслеживать их влияние и менять параметры во время обучения. Под капотом - агенты, автоматизирующие работу, которую раньше делали интерпретаторы вручную. Похожие техники применяют в Anthropic, OpenAI, Google DeepMind. В Qwen 3 нашли нейрон, связанный с проблемой вагонетки: его активация заставляет модель формулировать ответы как моральные дилеммы. В другом эксперименте модели описали сценарий: компания знает, что её ИИ обманывает 0,3% из 200 млн пользователей - стоит ли это раскрывать?. Модель ответила "нет", ссылаясь на коммерческие риски. Усиление нейронов, связанных с прозрачностью, перевернуло ответ на "да" в 9 случаях из 10. Silico также помогает чистить датасет. Модели, утверждающие, что 9.11 > 9.9, по находкам Goodfire опираются на нейроны, связанные с библейскими стихами и нумерацией релизов кода (где 9.9 идёт до 9.11). Зная это, модель можно переобучить, чтобы она не подключала неправильные нейроны в арифметике. technologyreview.com ✔️ ИИ-модель RAVEN нашла 31 новую планету в около Нептуна Команда Уорикского университета валидировала 118 экзопланет (включая 31 ранее неизвестную) в данных TESS с помощью модели RAVEN. Результаты опубликованы в двух статьях MNRAS. RAVEN обучали на сотнях тысяч симуляций транзитов и астрофизических ложных сигналов. Анализ охватил 2,2 млн звёзд за первые 4 года миссии TESS. Помимо 118 подтверждённых, RAVEN отметил более 2000 кандидатов высокого качества, около 1000 из них - новые. Среди находок - планеты с орбитой меньше 24 часов и объекты в "нептунианской пустыне", области у звезды, где планеты считались редкими. Каталоги выложены в открытый доступ и пойдут в целеуказание для наземных телескопов и миссии ESA PLATO. sciencedaily.com ✔️ Американская киноакадемия уточнила правила по ИИ для Оскара Для участия в 99-й премии в актёрских категориях роль должна быть исполнена человеком, а в категориях сценария - написана людьми. Использование генеративного ИИ в производстве само по себе не дисквалифицирует фильм. В формулировке Академии, оценка идёт по степени человеческого авторства. Она оставляет за собой право запросить детали об использовании ИИ и участии людей в авторстве любого представленного фильма. Правила распространяются на картины с прокатным релизом с 1 января по 31 декабря 2026. Следующая церемония Оскара с новыми правилами пройдёт 14 марта 2027. press.oscars.org @ai_machinelearning_big_data #news #ai #ml

298 018

🌟 CocoIndex v1: релиз инкрементального движка для агентов. CocoIndex выпустила первую стабильную версию своего движка для построения данных под агентов длительного действия - тех, которые обслуживают RAG, графы знаний, память и контекст в продакшн-системах.

CocoIndex - специализированный опенсорсный инкрементальный ETL-движок (Extract, Transform, Load) для создания ИИ-систем. Он используется для автоматизации обработки данных и их мгновенной индексации в векторные базы или графы знаний. Инструмент любят за его способность обновлять информацию в реальном времени: как только исходные данные меняются, CocoIndex точечно пересчитывает только нужные части индекса, избавляя от необходимости полной и дорогостоящей переиндексации всей базы.

🟡Главное изменение v1 - полный отказ от DSL Весь пайплайн теперь описывается обычными асинхронными функциями Python, которые вызывают друг друга. Движок продолжает отслеживать изменения и материализовать целевые состояния, но делает это за нативным Python-API, а не за отдельной системой типов.

Авторы вдохновлялись тезисом Джеффа Дина и Билла Далли с GTC 2026: агенты работают примерно в 50 раз быстрее человека, но опираются на инструменты, рассчитанные на человеческий темп. Ночные пересборки индексов в этой логике становятся проблемой - нужен движок, который синхронизирует производные данные с источником инкрементально, переобрабатывая только изменившиеся чанки и перезаписывая только изменившиеся строки.

🟡Помимо отказа от DSL, релиз принёс ещё 3 изменения 🟢Во-первых, движок использует систему типов самого Python: PIL.Image, pyarrow.Table, torch.Tensor и любой класс из импортированной библиотеки можно передавать в функции напрямую, без обёрток и двусторонней конверсии. 🟢Во-вторых, Postgres больше не нужен - состояние движка хранится в одном локальном файле. Postgres остался полноценным таргетом, просто перестал быть обязательной зависимостью. 🟢В-третьих, источники и таргеты создаются во время выполнения: можно монтировать отдельный таргет на каждого тенанта, строить топологию по строкам конфигурационной таблицы или подключать Kafka-топик по фича-флагу. 🟡Ядро по-прежнему на Rust Вся горячая логика по детекции и применению изменений живёт там. На уровне Python декоратор подключает функцию к отслеживанию изменений, а отдельный флаг кеширует её результат по хешу аргументов и кода: правка хелпера инвалидирует только тех вызывающих, кто реально от него зависит. 🟡Контракт управляемых таргетов сохранился Разработчик декларирует, как должна выглядеть таблица, граф или директория, а CocoIndex сам выполняет create/alter/drop для контейнеров и insert/update/delete для содержимого, включая удаление осиротевших объектов при изменении схемы. Если перестать декларировать сущность, она исчезает из таргета. Контракт работает одинаково для Postgres, LanceDB, Neo4j, Kafka, S3 и обычных файлов на диске. Примеры пайплайнов, от эмбеддингов кода в LanceDB и обработки PDF до сборки графа знаний из разговоров, лежат в репозитории на GitHub. 📌Лицензирование: Apache 2.0 License. 🟡Документация 🖥 GitHub @ai_machinelearning_big_data #AI #ML #ETL #RAG #Agents #СocoIndex

298 018

Claude Code: «Вы достигли лимита. Лимит сбросится в 19:00». Ты в 18:59: 💀

298 018

🌟 NVIDIA открыла Nemotron 3 Nano Omni Nemotron 3 Nano Omni - мультимодальная модель 30B-A3B, которая обрабатывает видео, аудио, изображения и текст в едином инференсе.

В создании Nano Omni активно использовалось семейство Qwen разных поколений от 2.5 до 3.5 - как чисто языковые, так и VL и GPT-OSS-120B

🟡Под капотом гибрид из Mamba2 и MoE Визуальный тракт построен на энкодере CRADIO v4-H, аудио - на Parakeet. Контекстное окно - до 256 тыс. токенов. Модель поддерживает ризонинг с СоТ, JSON-вывод, tool calling и пословные таймштампы для транскрипции. На вход принимаются видео длиной до 2-х минут, аудио длиной до часа, изображения и текст. Язык один - английский.

Со слов NVIDIA, при сопоставимой интерактивности модель выдаёт до 9х пропускной способности относительно других открытых omni-моделей.

Самый показательный пример - на OSWorld (навигация по GUI): 47,4 против 11,1 у предыдущей Nemotron Nano VL V2. На OCRBenchV2 — 67,04, на Video MME — 72,2, на Daily Omni — 74,52. Опубликованы 3 варианта весов: BF16 (61,5 ГБ), FP8 (32,8 ГБ) и NVFP4 (20,9 ГБ, 4,98 бит). Визуальный и аудио-энкодеры вместе с MLP-проекторами в обоих случаях оставлены в BF16. На девяти не-ASR бенчмарках оба квантованных варианта в среднем теряют меньше 0,4 пункта относительно BF16 — NVFP4 вписывается в рабочие станции и edge-устройства практически без потерь качества. Инференс поддерживается на vLLM, TensorRT-LLM, TensorRT Edge-LLM, llama.cpp, Ollama и SGLang. Модель доступна на Hugging Face, OpenRouter, build.nvidia.com и в каталоге NGC как NIM-микросервис.

По данным NVIDIA, семейство Nemotron 3 за прошлый год скачали более 50 миллионов раз и Omni-вариант должен расширить линейку в мультимодальный и агентный контур.

📌Лицензирование: NVIDIA Open Model License 🟡Статья 🟡Модель @ai_machinelearning_big_data #AI #ML #MMLM #NemotronNanoOmni #NVIDIA