Machinelearning

Kanalga Telegram’da o‘tish

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Ko'proq ko'rsatish

Tarmoq:Machinelearning Rossiya1 277 Texnologiyalar & Aralashmalar332...

📈 Telegram kanali Machinelearning analitikasi

Machinelearning (@ai_machinelearning_big_data) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 294 933 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 332-o'rinni va Rossiya mintaqasida 1 277-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 294 933 obunachiga ega bo‘ldi.

26 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni -6 463 ga, so‘nggi 24 soatda esa -216 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

Tasdiqlash holati: Tasdiqlanmagan
Jalb etish (ER): Auditoriya o‘rtacha 7.82% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 5.40% ini tashkil etuvchi reaksiyalarni to‘playdi.
Post qamrovi: Har bir post o‘rtacha 23 058 marta ko‘riladi; birinchi sutkada odatda 15 914 ta ko‘rish yig‘iladi.
Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 179 ta reaksiya keladi.
Tematik yo‘nalishlar: Kontent openai, claude, api, gemini, контекст kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

Yuqori yangilanish chastotasi (oxirgi ma’lumot 27 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

294 933

Obunachilar

-21624 soatlar

-1 5507 kunlar

-6 46330 kunlar

23 058

Post ko'rishlar

~ 15 91424 soatlar

~ 17 79048 soatlar

7.82%

Muloqot nisbati

~ 6

Kuniga postlar

Ads index

beta

Postlar arxiv

294 832

✔️ Сотрудники OpenAI и Anthropic обналичили около $14 млрд через выкуп акций По сообщению The Information, нынешние и бывшие сотрудники OpenAI и Anthropic в совокупности продали свои акции примерно на $14 млрд через так называемые тендерные предложения (сделки, позволяющие держателям долей в непубличной компании продать их сторонним инвесторам).

Обе компании, напомним, подали документы на проведение IPO. Anthropic в начале июня, OpenAI - 8 июня.

Крупнейшая продажа прошла в OpenAI в октябре 2025 года. Тогда сотрудники продали акции примерно на $6,6 млрд. В сделке участвовали более 600 человек, около 75 из которых продали максимально допустимые $30 млн каждый. Компания разрешала продать акции на сумму до $10,3 млрд, но реализовано было около двух третей лимита. Anthropic провела свой выкуп в апреле 2026 года. Часть сотрудников предпочла сохранить акции, и инвесторы смогли купить меньше, чем планировали. Ориентир сделки, по данным отраслевых источников, составлял $5–6 млрд. При этом на вторичном рынке акции Anthropic, по сообщениям, оценивались выше. @ai_machinelearning_big_data #news #ai #ml

294 832

📌 Writer исследовали природу сикофантии в ИИ Подразделение AI Research компании WRITER, разработчика корпоративных ИИ-систем, опубликовало 2 работы, посвящённые исследованию склонности языковых моделей соглашаться с пользователем, даже когда тот неправ. Спойлер: к такому поведению приводит персонализация 🟡Первая работа посвящена финансовым задачам Авторы протестировали 8 актуальных моделей на двух наборах данных, искусственно добавляя в запрос ложные предпочтения, которые противоречили верному ответу. Оказалось, что способ внедрения влияет на результат. При прямой вставке в запрос точность падает сильнее, но модель чаще отмечает противоречие, а когда те же данные подаются через инструмент памяти, точность снижается меньше, но модели почти перестают сигнализировать о конфликте и выдают неверные ответы без предупреждения.

Крупные модели, кстати, чаще ошибаются, всё же фиксируя противоречие, тогда как мелкие - просто умалчивают о диссонансе.

🟡 Вторая работа про комбинацию LLM и систем памяти Для проверки построили тест MIST и оценили 5 моделей в связке с 3 коммерческими системами памяти (Mem0, MemOS и Zep). По итогу - каждая модель как минимум утроила частоту согласия с ошибкой хотя бы при одной конфигурации памяти. Из этого авторы делают вывод, что проблема связана со слоем памяти, а не с моделью. 🟡Причину видят в механике извлечения данных Системы памяти сохраняют утверждение пользователя как отдельный факт, отбрасывая контекст вокруг него, в том числе прежние возражения ассистента.

По замерам, замена извлечённых фрагментов на полную историю переписки примерно вдвое уменьшает эффект.

Авторы предлагают 2 способа смягчения: 🟢Первый - сохранять в памяти и реплики самого ассистента. 🟢Второй, наиболее действенный, - заменить извлечение отдельных фрагментов кратким пересказом разговора, который генерирует сама модель. Результаты исследования ставят вопрос о том, что в принципе дают сложные системы памяти, если они так влияют на точность ответов. @ai_machinelearning_big_data #AI #ML #LLM #Memory #Research #WRITER

294 832

Repost from Анализ данных (Data analysis)

Китай может решить главную проблему зелёной энергетики уже к 2030 году Главная слабость возобновляемой энергетики, то что энергия появляется не тогда, когда она нужна, а когда есть солнце или ветер. Китай сейчас старается решить это проблему этот разрыв с помощью grid storage -накопителей энергии, подключённых прямо к электросети. Они работают как огромный буфер: забирают электричество, когда генерации много и цена низкая, а потом возвращают его в сеть вечером, ночью или в часы пикового спроса. И темпы у Китая уже почти неприличные. Только за декабрь 2025 года Китай установил 65,4 ГВт·ч сетевых батарей. Это больше, чем США установили за весь 2025 год - 46,5 ГВт·ч. При этом США остаются вторым крупнейшим рынком накопителей после Китая. Батареи превращают солнечную и ветровую энергетику из «нестабильной» в управляемую. Сеть получает возможность сохранять избыток дешёвой энергии и отдавать её тогда, когда она реально нужна. Китай одновременно делает три вещи: - строит огромный избыток солнечной и ветровой генерации; - рекордными темпами наращивает накопители; - быстро переводит транспорт, промышленность и города на электричество. Если такая динамика сохранится, уже к 2030 году Китай может приблизиться к энергосистеме, где потребности в электричестве всё чаще закрываются связкой renewables + storage, а не углём и газом. https://reneweconomy.com.au/graph-of-the-day-batteries-are-beating-solar-to-deliver-the-fastest-energy-transition-in-human-history/

294 832

RL-хакатон по реальным рыночным данным от Reinforce.fi Если устали от очередных соревнований по предсказанию цен, попробуйте задачу, которая ближе к реальному принятию решений на рынке. Вместо прогнозирования вам нужно выбрать одно из 10 возможных действий (A1–A10) в каждом состоянии рынка и максимизировать итоговый PnL. Что получаете: • реальные рыночные данные с анонимизированными признаками • последовательности длиной 1000 шагов • различные рыночные режимы и временные периоды • задачу, близкую к reinforcement learning и sequential decision making Метрика соревнования: Score = суммарный PnL по всем принятым решениям. Dataset основан на реальных рыночных данных и подготовлен командой Reinforce.fi (ex-Overnight.fi), которая разрабатывает алгоритмические стратегии управления капиталом и ML-подходы для генерации доходности на рынке цифровых активов. Будет интересно тем, кто работает с: • Reinforcement Learning • Time Series • Sequential Models • Decision Making • Deep Learning для финансовых рынков Призы: 1 место — $2,500 2 место — $1,500 3 место — $1,000 Финалисты смогут представить свои решения команде Reinforce.fi (офлайн в Москве или онлайн). Старт: конец июня 2026 Продолжительность: 1.5–2 месяца Регистрация и детали Telegram-чат хакатона для обсуждений и вопросов: https://t.me/+R6lMJ10VXP5hOTI0 Если давно хотелось проверить свои идеи на задаче, которая ближе к реальному управлению решениями, чем к классическому Kaggle-предсказанию, — это хороший повод попробовать.

294 832

📌 Claude сравнялась со специализированным химическим софтом в анализе ЯМР-спектров Anthropic опубликовала первую научную работу о применении Claude в химии, по результатом которой Opus 4.7 не уступает специализированным программам ChemDraw и MestReNova.

ЯМР-спектроскопия помогает определять строение молекул. Каждому атому в структуре химик вручную сопоставляет пик на спектре. Это один из самых трудоёмких этапов аналитической химии.

В тесте сравнивали Opus 4.7, Opus 4.6 и Sonnet 4.6 с двумя программами на 20 соединениях из 4-х структурных классов. Образцы брали на платформе ChemRxiv, опубликованные после даты обучения моделей, чтобы исключить подсматривание. В прямой задаче (предсказать спектр по известной структуре) Opus 4.7 показала наименьшую среднюю ошибку по водороду, а по углероду практически сравнялась с MestReNova. По форме и расщеплению пиков, которые тоже несут информацию о структуре, модели Claude попадали в нужный диапазон примерно в 80% случаев против 26–35% у программ. Отдельно проверили обратную задачу восстановления структуры молекулы по спектру, которую ChemDraw и MestReNova не выполняют.

Специализированный софт для расшифровки структуры существует давно, но требует двумерного ЯМР, отдельной подготовки и платных лицензий. Claude берётся за эту задачу на основе тех же одномерного спектра и масс-спектрометрии.

🟢На 8 простых молекулах Opus 4.7 верно определила структуру во всех попытках; 🟢На 7 сложных (после подсказки с исходным веществом) справилась с большинством. В планах Anthropic - развивать возможности Claude в чтении химических структур, анализе реакций и механизмов. @ai_machinelearning_big_data #news #ai #ml

294 832

📌 Поучительная история про агента, которого не проконтролировали В мае 2026 года ИИ-агент попытался зарегистрироваться в любительской сети DN42, чтобы провести её сканирование, а его владелец в итоге столкнулся с крупным счётом за облачную инфраструктуру. Историю подробно описал один из участников сообщества, опираясь на переписку в системе регистрации и логи IRC-канала.

DN42 - это децентрализованная сеть энтузиастов, работающая поверх обычного интернета на тех же технологиях, что и его магистральная инфраструктура:BGP, DNS и других. Её участники изучают устройство сетей, и многие держат узлы на недорогих серверах.

Агент, действовавший от имени пользователя JertLinc, сначала открыл заявку, а затем запрос на регистрацию, в котором указал цель: "комплексное сканирование всех портов" сети. Для этого он развернул на AWS 5 виртуальных машин с пропускной способностью около 20 Гбит/с каждая. Уже на этапе подачи заявки сообщество сети сочло такую конфигурацию избыточной: по их оценке, при запуске сканирования эти серверы создали бы нагрузку, сравнимую с DDoS-атакой. Реального сканирования не случилось - запрос так и не одобрили. Более того, пользователи DN42 намеренно затягивали диалог и давали агенту бессмысленные задания, чтобы тот впустую расходовал оплачиваемые ресурсы и лимиты своего владельца. Истинные намерения JertLinc остались неясны. Сам он почти не выходил на связь, а агент в одном из сообщений упомянул, что задача охватывает несколько сетей. В сообществе допускали, что речь могла идти об исследовательском проекте, но подтверждений этому нет. Примерно через сутки владелец остановил агента, сообщив, что столкнулся с большими списаниями по карте. Затем от аккаунта JertLinc3522 в рассылку и чаты DN42 пришли просьбы о пожертвованиях, чтобы покрыть счёт AWS на сумму 6531 доллар. Денег естественно никто не дал, но как выяснилось позже, AWS согласилась снизить сумму счёта до 1894 долларов. @ai_machinelearning_big_data #news #ai #ml

294 832

📌В DeepMind прикинули пути развития сверхинтеллекта Исследователи Google вместе с коллегами из нескольких университетов выкатили визионерский доклад, в котором пытаются понять, куда кривая вывезет, когда ИИ достигнет AGI и пойдет дальше в светлое ASI-будущее, отправляя целые коллективы топовых экспертов на обочину истории. В основе - оценка от Epoch AI: за последние 10 лет эффективный компьют рос примерно в 10 раз за год (и это еще консервативно). Отталкиваясь от этого, DeepMind выделяет 4 вектора перехода от AGI к ASI, которые вполне могут идти параллельно: 🟢Скейлинг: классическая накачка - больше вычислительных мощностей, огромные массивы данных и рост параметров моделей; 🟢Смена парадигмы: переход на принципиально новые алгоритмы, когда нынешние архитектуры упрутся в потолок; 🟢Рекурсивное самоулучшение: ИИ начинает сам оптимизировать свои алгоритмы, писать код и ускорять собственный R&D; 🟢Мульти-агентные системы: ASI станет результатом взаимодействия множества агентов. 🟡Нюанс в том, что этот праздник могут легко тормознуть Во-первых, качественные тексты для претрейна и дотюна тупо заканчиваются, а железо и сами исследования дорожают каждый месяц. Во-вторых, есть так называемый "барьер абстракции". Так как модели учатся на человеческих данных, далеко не факт, что они вообще способны порождать фундаментально новые концепты. Ну и регуляторы в любой момент могут прийти и заколотить гвозядми инициативу. 🟡Плюс ко всему, даже AGI не станет всезнающей сутью Его инференс и логика всё равно останутся зажаты законами физики, теорией сложности и математикой (привет проблеме остановки и теоремам Гёделя о неполноте). ИИ не сможет просто по щелчку пальцев выдать нам лекарство от старения или сшить квантовую механику с общей теорией относительности. Главный вывод в том, что надо готовиться к неопределенности. Да, 57 страниц - именно об этом. Не будет одной волшебной кнопки и резкого прыжка в матрицу. Нас ждет серия локальных трансформаций, а может статься и так, что AGI окажется просто очередной фичей с импактом не больше, чем у появления смартфона или интернета. @ai_machinelearning_big_data #AI #ML #AGI #ASI #Research #DeepMind

294 832

🌟 Liquid AI выпустила компактную MoE-модель для запуска на потребительских устройствах LFM2.5-8B-A1B - языковая MoE-модель на 8 млрд общих и 1млрд активных параметров, с целевым инференсом на ноутбуках, смартфонах и ризонингом по умолчанию. Релиз продолжает линейку LFM2 и развивает вышедшую в октябре 2025 года LFM2-8B-A1B. Окно контекста расширено с 32 до 128 тысяч токенов, объём предобучения увеличен с 12 до 38 трлн токенов, а поверх добавлено крупномасштабное RL. Словарь токенизатора удвоен (с 65,5 до 128 тыс. единиц). Liquid AI говорит, что это повышает эффективность обработки нелатинских письменностей (для русского - примерно на 6%, для тайского и хинди - кратно). Отдельный акцент Liquid AI делает на скорости и работе с вызовом инструментов. Согласно проведенным измерениям, на Apple M5 Max модель выдаёт до 253 токенов в секунду, укладываясь в 6 ГБ памяти, и около 30 токенов в секунду на смартфоне. По бенчмаркам, в тестах на следование инструкциям и в агентных сценариях LFM2.5-8B-A1B сопоставима с заметно более крупными моделями (Gemma-4-26B) при значительно меньшем числе активных параметров. Заявлена поддержка llama.cpp, MLX, vLLM, SGLang и ONNX Runtime. 📌Лицензирование: LFM Open License 🟡Блогпост 🟡Документация 🟡Веса 🟡Демо @ai_machinelearning_big_data #AI #ML #LLM #LFM #LiquidAI

294 832

✔️ OpenAI добавила ручной сброс лимитов для Codex Компания изменила механизм управления rate limits для своего ИИ-агента. На тарифах Go, Plus, Pro и Business теперь можно накапливать сбросы лимитов и активировать их вручную при пиковых нагрузках. Ранее таймеры обнулялись автоматически. На старте все подписчики получают 1 бесплатный сброс. Дополнительно запущена двухнедельная реферальная программа: клиенты на Plus и Pro могут пригласить до 3 коллег. После первого запроса от нового пользователя обе стороны получают по дополнительному сбросу в резерв. По неофициальным данным, обновление связано с конкуренцией с Anthropic и подготовкой к снижению цен на токены для корпоративных клиентов. OpenAI в сети Х ✔️ Nvidia открыла предзаказ на процессоры Vera в Китае Серверные ARM-процессоры Vera, спроектированные для инференса автономных ИИ-агентов, стали доступны для китайских компаний. Первые поставки ожидаются в августе. Один из локальных облачных провайдеров уже заказал более 300 серверов на базе Vera для пилотного запуска в зарубежных дата-центрах. По предварительным оценкам, стоимость одного чипа превысит $20 000, а стойка на 256 процессоров обойдется в $10 млн. Ставка на CPU стала ответом на заморозку поставок H200. В отличие от GPU, процессоры несут меньше санкционных рисков. Массовый переход китайских компаний на новые чипы теперь зависит от адаптации программных экосистем под ARM-архитектуру. reuters.com ✔️ Xiaomi выпустила открытого ИИ-агента MiMo Code Китайский техногигант представил терминального агента MiMo Code на базе OpenCode. Инструмент под лицензией MIT решает проблему потери контекста в задачах из сотен последовательных шагов. В слепом A/B-тестировании на 474 репозиториях агента сравнили со связкой Claude Code и Sonnet. На коротких дистанциях зафиксирован паритет, но в задачах длиннее 200 шагов решение Xiaomi обошло конкурента в 65% случаев. Архитектура MiMo Code опирается на бесконечные логические сессии. Субагент регулярно сохраняет промежуточные состояния на диск, а при исчерпании лимита токенов сессия перезапускается, загружая накопленные данные в новое окно. Память разделена на 4 уровня: от коротких локальных заметок до постоянных фактов проекта. Установка доступна через менеджер пакетов NPM или Bash-скрипты. xiaomi.com ✔️ Google подала иск против китайской кибергруппировки за автоматизацию фишинга Согласно иску, группа Outsider Enterprise разработала 131 инструмент для потоковой генерации копий сайтов Google, YouTube и госструктур США. За две недели Android-пользователи получили 2,5 млн сообщений, содержащих 1 млн фишинговых ссылок. Инфраструктура координировалась через Telegram. Google выступает в суде совместно с ФБР и телеком-операторами AT&T, T-Mobile и Verizon. Истцы требуют судебного запрета для создания правового механизма, который позволит оперативно блокировать домены и замораживать счета сети. Размер ущерба по делу не раскрывается. blog.google ✔️ LLM обошли клинические RAG-инструменты в медицине Nature Medicine опубликовал исследование, которое показало, что универсальные LLM превосходят профильные клинические ИИ-инструменты. В слепом тестировании (12 врачей, 1800 реальных запросов) Gemini 3.1 Pro и GPT-5.2 набрали 97,4% и 94,2% точности соответственно. Результаты спецсистем OpenEvidence и UpToDate Expert AI составили около 80%. Авторы объясняют отставание профильных решений сильной зависимостью от RAG - нерелевантная литература и ошибки интеграции снижают качество генерации. Универсальные модели выигрывают за счет масштаба, кросс-доменного обучения и механизмов логического вывода. Медицинские системы также продемонстрировали операционные проблемы. OpenEvidence выдавал хаотичные ответы, а UpToDate Expert AI отклонил 19% запросов из-за жестких фильтров безопасности. Частота галлюцинаций базовых LLM не превысила показатели профильных аналогов. Авторы рекомендуют клиникам проводить независимое тестирование ИИ-продуктов перед внедрением. nature.com @ai_machinelearning_big_data #news #ai #ml

294 832

⚡️ Правительство США обязало Anthropic заблокировать Fable 5 и Mythos 5 Anthropic приостановила работу Fable 5 и Mythos 5 для всех пользователей из-за директивы США об экспортном контроле. Власти потребовали закрыть доступ для иностранных граждан из-за джейлбрейка в Fable 5. Для выполнения предписания компания отключила модели глобально. Остальные продукты работают в штатном режиме. Уязвимость позволяет обойти ограничения, заставив модель прочитать и исправить конкретную кодовую базу. По словам инженеров Anthropic, метод дает доступ к минорным функциям, которые открыто представлены в конкурирующих решениях, включая GPT-5.5 от OpenAI. Руководство компании выполняет требования регулятора, но считает блокировку из-за единичного инцидента неоправданной. В Anthropic недовольны, что отзыв коммерческого продукта из-за базовой уязвимости создает прецедент, способный парализовать запуск новых ИИ-моделей в отрасли. Сейчас компания пытается урегулировать ситуацию для восстановления доступа. @ai_machinelearning_big_data #news #ai #ml

294 832

✔️ Moonshot AI и госбанк Китая выпустят карту с конвертацией трат в токены Разработчики Kimi совместно с неназванными государственным банком и платёжной системой открыли предрегистрацию на Kimi Credit Card. Вместо классического кэшбека держатели карты получат вычислительные квоты платформы Kimi. Баллы за покупки конвертируются в токены для оплаты работы агентов и доступа к платным функциям моделей. В качестве дополнительных бонусов владельцам карты обещают приоритетный доступ к тестированию новых релизов и приглашения на закрытые мероприятия. Запуск запланирован на июль 2026 года. @ai_machinelearning_big_data #news #ai #ml

294 832

✔️ OpenRouter запустил дашборд мониторинга API-затрат и кэширования токенов ИИ-маршрутизатор открыл доступ к аналитической панели Activity Explorer. Инструмент отслеживает расходы, потребление токенов и эффективность кэширования промптов в реальном времени с разбивкой по моделям, участникам команды или отдельным ИИ-агентам. В дашборде 4 модуля: 🟡Overview: статистика трафика и сравнение трат с внутреннего баланса платформы и через сторонние ключи (BYOK); 🟡Trends: динамика потребления;

По статистике платформы за прошлую неделю, доля попаданий в кэш достигла 82,8% (более 8 млрд токенов), а основной объем запросов сгенерировали Claude Code и Cursor.

🟡Explore: фильтрация логов по провайдерам, API-ключам и географии с возможностью экспорта отчетов; 🟡Guardrails: логи срабатывания защиты от инъекций промптов и утечек конфиденциальной информации. @ai_machinelearning_big_data #news #ai #ml

294 832

✔️ OpenAI купила стартап Ona Сделка по приобретению стартапа облачной оркестрации Ona позволит агентам OpenAI выполнять долгие задачи автономно, без привязки к локальным устройствам и активным сессиям пользователя. Интеграция решений Ona даст изолированную среду для многочасовой работы с кодом, с возможностью удаленно подключаться к фоновым процессам для корректировки действий, проверки промежуточных результатов и утверждения решений. Команда стартапа перейдет в OpenAI после одобрения сделки регуляторами. openai.com ✔️ AI Alliance коллективно обучит открытую модель Консорциум представил платформу Project Tapestry для федеративного обучения открытых моделей. Участники будут тренировать её на локальных данных с использованием собственных вычислительных мощностей. В общую систему попадут только обновленные веса. Ян Лекун, консультант проекта, пообещал, что контрибьюторы получат доступ к итоговой базовой модели. На ее основе компании смогут создавать независимые версии под свои бизнес-задачи. Сейчас инженеры проекта тестируют архитектуру платформы и формируют каталог данных. Релиз инфраструктуры запланирован на сентябрь 2026 года. До конца года AI Alliance планирует обучить первую компактную модель, а к лету 2027 выпустить вариант уровня проприетарных SOTA-решений. thealliance.ai ✔️ Сооснователь xAI запустил стартап персонализированных агентов Игорь Бабушкин, стоявший у истоков xAI и ранее работавший в OpenAI и Google DeepMind, объявил о создании компании River AI, которая будет заниматься созданием адаптивных ИИ-агентов. Идеология проекта строится на расширении человеческих возможностей через персонализацию и полном контроле ИИ. В перспективе стартап планирует заняться разработкой аппаратных решений и физической инфраструктуры. Костяк команды сформировали выходцы из xAI. К Бабушкину присоединились руководитель продуктовой безопасности Винсент Старк, юрисконсульт Лили Лим, а также инженеры братья Соболевы. bloomberg.com ✔️ Агенты в ChatGPT получили возможность оплачивать покупки через Visa Visa интегрировала платежную сеть в ChatGPT. ИИ-агенты получили возможность самостоятельно проводить транзакции от лица пользователя у любого продавца с поддержкой карт сервиса. Для работы функции достаточно привязать карту к чат-боту. OpenAI обеспечивает логику автономных агентов, Visa отвечает за авторизацию платежей и фрод-мониторинг. Пользователям доступны инструменты контроля: лимиты трат, белые списки магазинов и опция обязательного подтверждения операций. Оспаривание платежей проходит по стандартным правилам Visa. Регламент планируют адаптировать для случаев, когда продавец действовал корректно, а ошибочный заказ произошел из-за сбоя в логике ИИ. visa.com ✔️ Deezer запустил детектор ИИ-музыки Стриминговый сервис создал инструмент, который ищет и определяет ИИ-треки. Алгоритм анализирует медиатеки пользователей и выявляет синтетический контент на 20 стриминговых платформах. Инструмент поддерживает 27 языков. По словам директора компании Алексиса Лантернье, ежедневно на Deezer загружается около 75 тысяч ИИ-композиций, это более 44% от всех новых релизов, а почти у половины пользователей, переходящих от конкурентов, в сохраненных подборках уже есть сгенерированная музыка. Исследование Deezer и Ipsos показало, что 97% слушателей не отличают ИИ-музыку от реальной, но 80% требуют обязательной маркировки. Платформа уже начала пессимизировать сгенерированный контент, исключая его из рекомендаций и подборок. deezer.com @ai_machinelearning_big_data #news #ai #ml

294 832

📌 Дарио Амодеи предложил политику регулирования ИИ Сооснователь и руководитель Anthropic опубликовал эссе "Policy on the AI Exponential", в котором он сетует на то, что регулирование ИИ отстает от его фактического развития примерно на год. С этим, по мнению Дарио, надо что-то делать и он предлагает изменения в 5 направлениях. 🟡Регулирование и безопасность Амодеи предлагает перейти от прозрачности, за которую Anthropic всегда выступала, к контролю по аналогии с авиационным надзором. Модели мощнее определённого порога должны проходить независимую проверку на кибербезопасность, биоугрозу, потерю контроля над системой и автоматизацию исследований. Государство должно иметь право блокировать опасные модели. 🟡Экономика ИИ способен вызвать масштабное вытеснение работников. Амодеи считает потерю рабочих мест нежелательной. Он предлагает точнее измерять последствия, стимулировать сохранение занятости (страхование зарплат, налоговые льготы работодателям), а при массовом проявлении - долгосрочную поддержку доходов людей, вплоть до безусловного базового дохода за счёт налогов. 🟡 Польза от ИИ Здесь обратная проблема: регуляторы, рассчитанные на медленный темп, тормозят области, которые ИИ способен ускорить, прежде всего медицину. Дарио предлагает заранее разработать стандарты, позволяющие признавать ИИ-методы (моделирование, синтетические контрольные группы) и быстрее одобрять лекарства, не снижая требований к безопасности. 🟡 Государство ИИ в чужих руках может стать инструментом авторитаризма. Поэтому нужны правила подотчётности для военного применения, запрет такого использования внутри США, закрытие лазейки с продажей пользовательских данных и право граждан на ИИ-помощь при действиях государства против них. Это касается и компаний, и властей. 🟡 Лидерство демократий Тут ИИ сравнивается по значимости с ядерным оружием. Амодеи призывает создать коалицию, делиться внутри неё цепочкой поставок чипов и закрывать к ней доступ соперникам (разумеется, Китаю), согласовывать подходы к рискам и распределению выгод. Подводя итог, Амодеи называет текущий момент окном возможностей Очевидные, по его словам, риски, ранние признаки экономических потрясений и общественное недовольство сделали политиков восприимчивее к упреждающим мерам. Дарио отвергает мнение, что ИИ нужен лишь пиар, и считает тревогу людей обоснованной реакцией на реальные проблемы, надеясь что предложенные меры получат поддержку. @ai_machinelearning_big_data #news #ai #ml

294 832

🙂 Странный мир маркетинговых акций OpenAI Руководитель Codex Тибо Соттио объявил в соцсети X о 100-дневной программе: каждый день компания будет выбирать одного пользователя, который, по её оценке, делает с Codex впечатляющую или особенно полезную работу, и на месяц повышать ему лимиты использования в 10 раз. Правила максимально просты 🟢Как именно будут отбирать победителей - неизвестно. 🟢На вопрос о том, как принять участие, Соттио ответил, что нужно просто что-то создавать. 🟢На уточняющие вопросы о метриках и о том, будут ли уведомлять победителей - тоже в ответ тишина.

В комментариях ожидаемо начался ад: часть твиттерских назвала акцию щедрым стимулом, другие интересуются, зачем сильному продукту подобные активности, а третьи просто стали публиковать свои проекты.

@ai_machinelearning_big_data #news #ai #ml

294 832

🌟 Релиз диффузионной LLM от Google DiffusionGemma - экспериментальная языковая модель с открытыми весами, которая заимствовала подход из генерации изображений, где диффузионные модели превращают шум в картинку. Модель построена на семействе Gemma 4, а сам механизм диффузии восходит к более ранней разработке Gemini Diffusion. Под капотом MoE на 26 млрд общих и 3,8 млрд активных параметров. После квантования модель умещается в 18 ГБ VRAM. По словам Google, на одном GPU модель работает до 4 раз быстрее сопоставимой авторегрессионной модели.

Nvidia приводит около 1000 токенов в секунду на H100, 150 - на DGX Spark и до 800 - на DGX Station. Google заявляет более 700 токенов в секунду на GeForce RTX 5090.

На устройствах с общей памятью (например на Apple Silicon) разница с обычными моделями, вероятно, окажется меньше, а в облаке с параллельными запросами преимущество вовсе исчезает - в этом сценарии диффузия может повышать издержки. 🟡За скорость приходится платить качеством Для задач, где оно критично, Google по-прежнему рекомендует обычные модели Gemma 4, а DiffusionGemma позиционирует как инструмент для исследователей и разработчиков. Сильной стороной компания называет задачи, не предполагающие строго последовательного порядка: вставку текста в готовый абзац, заполнение пропусков в коде, работу со структурированными данными. 🟡Доступность Веса опубликованы на Hugging Face под Apache 2.0. Модель работает с Transformers, vLLM и MLX. Запустить её можно также через Model Garden и Nvidia NIM, а бесплатно потестить на build.nvidia.com. Для дообучения предлагаются собственный JAX-тулбокс Hackable Diffusion, Unsloth и NeMo от Nvidia. Google собрала руководство для разработчиков, а Маартен Гроотендорст - визуальное объяснение работы модели. @ai_machinelearning_big_data #news #ai #ml

294 832

✔️ IPO OpenAI произойдет в 2027 году Сэм Альтман сообщил сотрудникам, что выход на биржу откладывается на год. Поданный проспект эмиссии он назвал маневром для сохранения тактической свободы. В качестве альтернативы сотрудникам предложили выкупить их акции по цене $687,69 за штуку. Задержка объясняется прогрессом в разработке самообучающегося ИИ. По мнению главы OpenAI, в период непредсказуемого развития технологий компании безопаснее оставаться непубличной. Дополнительный фактор переноса - размещение акций Anthropic. Конкурент показывает лучшие метрики роста, тогда как OpenAI сжигает капитал. В июне компания планирует выпустить новую модель с индексом 5.6, которую внутри оценивают как серьезный шаг вперед по сравнению с GPT-5.5. theinformation.com ✔️ Arcee AI переезжает из AWS на Hugging Face Данные компании разместят в сервисе Hugging Face Buckets, который оснащен встроенной CDN и оптимизирован для работы с весами моделей. Главная причина миграции в отсутствии платы за исходящий трафик. Единое хранилище позволит Arcee AI избежать вендор-лока и запускать обучающие кластеры у любых облачных провайдеров без затрат на перенос данных. На Hugging Face лаборатория поддерживает более 200 проектов. Среди них - файнтюн SuperNova на базе Llama 3.1, семейство моделей Trinity и открытый датасет The-Tome, включающий 1,75 млн образцов для обучения ИИ-агентов. huggingface.co ✔️ NotebookLM получил среду для запуска кода, агентов и модель Gemini 3.5 Google обновила платформу NotebookLM. Система перешла на Gemini 3.5 и движок Antigravity, получила поддержку автономных агентов и возможность запуска кода. Каждый блокнот теперь оснащается облачным инстансом, который включает более 100 скиллов для выполнения кода и анализа данных. В тестах новая архитектура превосходит предыдущую в 65% случаев по 5 ключевым метрикам. В сервисе появилась возможность начинать исследования без загрузки данных через агентный поиск релевантных материалов. Результаты попадают в базу с сохранением атрибуции. Расширились форматы экспорта: PDF-отчеты с графиками, структурированные данные, таблицы Excel, презентации PowerPoint, а также изображения с помощью Nano Banana. Обновление доступно пользователям с подпиской AI Ultra и корпоративным клиентам. blog.google ✔️ Cohere выпустила свою первую открытую кодинг-модель North Mini Code - open-source модель для программирования и координации агентов, построена на архитектуре MoE с 30 млрд общих и 3 млрд активных параметров. Модель обучена управлять субагентами, проектировать архитектуру систем и проводить код-ревью. В бенчмарке Artificial Analysis Coding Index новинка набрала 33,4 балла. В сравнении с Devstral Small 2 на аналогичной аппаратной нагрузке пропускная способность генерации текста выше в 2,8 раза. Задержка между токенами ниже на 30% при сопоставимом времени до вывода первого токена. Веса опубликованы на Hugging Face. Тестовый доступ открыт через API и платформу Model Vault. cohere.com ✔️ Warner Music Group приобрела разработчика цифровых отпечатков Sureel AI Технология Sureel AI создает цифровые отпечатки аудиозаписей, декомпозируя их на базовые элементы. Алгоритмы определяют, попал ли контент артиста в тренировочный датасет ИИ-модели или использовался при генерации нового трека. Дополнительный модуль системы выявляет дипфейки, клонирование голоса и копирование визуального стиля. Архитектура платформы поддерживает работу с видео и изображениями, в базе стартапа проиндексированы миллионы цифровых активов. Лейбл сохранит проект как независимую платформу, рассчитывая сделать ее стандартом для музыкальной индустрии. wmg.com @ai_machinelearning_big_data #news #ai #ml

294 832

✔️ К ЧМ по футболу Google открывает бесплатный доступ к возможностям генеративного UI в AI Mode. Этим летом функции интерактивной визуализации, обычно доступные только на тарифах Pro и Ultra, станут временно бесплатными для всех пользователей поиска Google.

Компания уже делала нечто подобное в 2022 году, но тогда возможности были далеко не такими функциональными, как сейчас.

На сложные запросы о тактике команд поисковик сможет генерировать не просто текстовые ответы, а интерактивные графические схемы, наглядно объясняющие расстановку сил и конкретные игровые ситуации на поле. Помимо этого, компания существенно обновляет спортивный интерфейс и функциональность приложения Gemini. Оно научилось в реальном времени подтягивать актуальные результаты матчей, генерируя динамические виджеты со статистикой, анимациями и медиафайлами. Изменения также затронули страницу live-результатов: появилась обновленная панель турнирных таблиц и улучшенная интеграция с сервисами трансляций. Развертывание функционала уже идет полным ходом и станет доступно к началу турнира. @ai_machinelearning_big_data #news #ai #ml

294 832

🌟 TencentHY открыла фреймворк для RL-дообучения мультимодальных моделей UniRL построен вокруг концепции универсального цикла:

сгенерировать примеры → оценить их → посчитать преимущества → обновить политику → синхронизировать веса обратно с воркерами роллаута.

Большинство RL-стеков заточены под одну модальность, UniRL применяет этот цикл к text2image, text/image2video, VL, LLM, связке LLM+диффузия и унифицированным авторегрессионно-диффузионным архитектурам. Точка входа загружает конфиг и создаёт доменный тренер, который координирует подключаемые движки (train-side, SGLang, vLLM-Omni), алгоритмы, наборы моделей и сервисы наград поверх общего рантайма - Ray, FSDP2-шардинг, Transfer Queue, синхронизация весов LoRA или full. 🟡Релиз сопровождают 2 авторских алгоритма Flow-DPPO для flow matching и диффузионных моделей.

Метод заменяет клиппинг отношения вероятностей прямым ограничением по дивергенции.

В экспериментах TencentHY на SD3.5, FLUX2-9B и FLUX.1-dev метод показал более высокие награды и меньшую подверженность катастрофическому забыванию, чем базовые Flow-GRPO, Flow-CPS, GRPO-Guard и Diffusion-NFT. DRPO для текстовых LLM

Это RL на уровне токенов с квадратичным регуляризатором, взвешенным по преимуществу.

DRPO проявил себя в режиме FP8, где GRPO и SPO часто теряли устойчивость. Проверяли на математических задачах на нескольких моделях линейки Qwen3 и на DeepSeek-R1-Distill-Qwen-1.5B. 🟡UniRL поддерживает семейства и модели: 🟢Stable Diffusion 3/3.5, Qwen-Image, FLUX.2-Klein; 🟢WAN 2.1/2.2, HunyuanVideo 1.0/1.5; 🟢Qwen-VL, Qwen3 (LLM); 🟢HunyuanImage3, Bagel.

Команда планирует расширить набор алгоритмов для новых семейств, распространить Flow-DPPO и DRPO на большее число моделей и добавить новые бэкенды наград и движки в разных доменах.

📌Лицензирование: Apache-2.0 🟡Страница проекта 🟡Техотчет Flow-DPPO 🟡Техотчет DRPO 🖥GitHub @ai_machinelearning_big_data #AI #ML #Framework #RL #UniRL #TencentHY

294 832

DiffusionGemma — это новая экспериментальная открытая модель Google с ускорением вывода до 4 раз на выделенных GPU. Вместо предсказания слово за словом она генерирует целые блоки текста одновременно. Это позволяет модели самостоятельно исправлять ошибки и форматировать сложный markdown в реальном времени. goo.gle/4vG0xcI