Machinelearning

前往频道在 Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

显示更多

网络:Machinelearning 俄罗斯1 260 技术与应用323...

📈 Telegram 频道 Machinelearning 的分析概览

频道 Machinelearning (@ai_machinelearning_big_data) 俄语语言赛道中的是活跃参与者。目前社区聚集了 298 105 名订阅者，在 技术与应用 类别中位列第 323，并在 俄罗斯 地区排名第 1 260 位。

📊 受众指标与增长动态

自 невідомо 创建以来，项目保持高速增长，吸引了 298 105 名订阅者。

根据 11 六月, 2026 的最新数据，频道保持稳定运转。过去 30 天订阅人数变化为 -7 224，过去 24 小时变化为 -206，整体触达仍然可观。

认证状态： 未认证
互动率 (ER)： 平均受众互动率为 7.69%。内容发布后 24 小时内通常能获得 5.95% 的反应，占订阅者总量。
帖子覆盖： 每篇帖子平均可获得 22 918 次浏览，首日通常累积 17 745 次浏览。
互动与反馈： 受众积极参与，单帖平均反应数为 176。
主题关注点： 内容集中在 openai, claude, api, gemini, контекст 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台：
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

凭借高频更新（最新数据采集于 12 六月, 2026），频道始终保持新鲜度与高覆盖。分析显示受众积极互动，使其成为 技术与应用 类别中的关键影响点。

298 105

订阅者

-20624 小时

-1 5177 天

-7 22430 天

22 918

帖子浏览量

~ 17 74524 小时

~ 20 01448 小时

7.69%

参与率

~ 6

每日帖子数

Ads index

beta

帖子存档

298 041

Палладиевый ИИ-проект «Норникеля»: ставка на технологический суверенитет и рынки будущего За соглашением «Норникеля» и ИОНХ РАН стоит долгосрочная стратегия. Россия — крупнейший производитель палладия в мире. Но чтобы этот ресурс превратился в устойчивый источник доходов и технологического влияния, нужны новые рынки сбыта. Компания инвестирует около $100 млн в палладиевые технологии до 2030 года и уже открыла первую в мире специализированную лабораторию по материалам на основе палладия в кластере «Ломоносов». Сставка на ИИ — это не хайп, а обоснованный ход. Открытые международные базы (Materials Project и др.) содержат данные о соединениях в идеальных условиях — без учёта деформаций, лигатур, перепадов температур. А именно эти факторы принципиально меняют свойства материалов в реальном производстве. Мировые AI-модели пока не умеют предсказывать поведение сплавов в технологических процессах. Здесь и открывается окно. Платформа «Норникеля» будет генерировать материалы сразу под заданные параметры конкретного техпроцесса. Например: — финишные покрытия для контактных площадок печатных плат; — проводящие покрытия для электроники, работающей в экстремальных условиях; — катализаторы и сенсоры на базе 2D-материалов и высокоэнтропийных сплавов. Только в микроэлектронике перевод части потребления с золота на палладий — это рынок в сотни тонн металла ежегодно. А дальше — водородная энергетика, химическая промышленность, новые типы сенсоров. Более того, «Норникель» строит модель академического хаба: ИОНХ РАН станет центром систематизации данных, и к проекту будут подключаться другие институты и университеты с накопленными экспериментальными базами. Стратегический результат для страны: загрузка высокотехнологичных производств, укрепление позиций в цепочках поставок критических материалов. И главное — компетенция проектировать материалы с помощью ИИ становится одной из ключевых в XXI веке. Здесь, похоже, Россия начинает играть вдолгую.

298 041

✔️ OpenAI закроет возможность файнтюна своих моделей к началу 2027 года Компания уведомила разработчиков о закрытии платформы самостоятельного дообучения своих моделей. Для новых клиентов возможность запускать тренировки уже заблокирована, а с 6 января 2027 года отключение затронет всех. Инференс существующих кастомных моделей сохранится вплоть до полного вывода их базовых версий из эксплуатации. Компания смещает фокус с модификации весов на RAG, промпт-инжиниринг и оркестрацию. Консолидация логики внутри экосистемы OpenAI упростит управление обновлениями и биллингом. Тем, кто использовал дообучение для адаптации под узкие ниши, придется пересматривать архитектуру. startupfortune.com ✔️ В Google DeepMind появился директор по экономике AGI Профессор Чикагского университета Алекс Имас перешел в Google DeepMind на должность Director of AGI Economics. Он работает в прямом подчинении у сооснователя компании и главного ученого по AGI Шейна Легга. Команда Имаса займется прогнозированием влияния сильного ИИ на макроэкономику: трансформации рынка труда, перераспределения капитала и адаптации институтов. Отдельный фокус - воздействие автономных ИИ-агентов на рынки. Для моделирования пост-AGI экономики исследователи задействуют масштабные агентные симуляции. Основная задача нового подразделения - разработать прогностические модели и переосмыслить фундаментальные концепции дефицита и распределения ресурсов. Имас специализируется на исследованиях на стыке поведенческой экономики и машинного обучения. Также он известен как соавтор книги нобелевского лауреата Ричарда Талера. Alex Imas в сети Х ✔️ Epoch AI оценила удельную выручку топовых ИИ-лабораторий По данным Epoch AI, выручка на одного сотрудника в Anthropic достигает $9 млн, в OpenAI - $5,6 млн. Эти показатели выше, чем у любой IT-компании из списка Forbes 2000. Для сравнения: у NVIDIA этот показатель равен $5,1 млн. Расчеты Epoch AI опираются на открытые данные о доходах и динамику найма. Аналитики отмечают, что параллельный рост удельной выручки и многомиллиардных годовых доходов нетипичен для технологического сектора. Высокая капитальная эффективность ИИ-лабораторий достигается за счет концентрации инженеров и масштабного использования вычислительных мощностей. Это обеспечивает уровень производительности, недоступный при традиционной разработке ПО. epoch.ai ✔️ Higgsfield сделал ИИ-оценщика виральности видео ИИ-агрегатор запустил инструмент Virality Predictor для моделирования реакции аудитории на видео длиной до 15 секунд. Платформа рассчитывает индекс виральности, вовлеченность с первой секунды и прогнозируемое удержание зрителей. Инструмент генерирует тепловую карту мозга, которая показывает предполагаемую стимуляцию зрительной коры или миндалевидного тела. Virality Predictor интегрирован в рабочий процесс Ad Reference для перегенерации креативов на основе полученных метрик. Помимо веб-интерфейса, доступ к оценщику открыт через CLI и MCP. Поддержка MCP позволяет напрямую подключать платформу к Claude Code и OpenClaw. Через API агенты могут генерировать видео, собирать метрики симуляции внимания и самостоятельно корректировать хук на основе полученных данных без участия человека. higgsfield.ai ✔️ Фейковая модель OpenAI заражала локальные системы инфостилером Вредоносный репозиторий Open-OSS/privacy-filter возглавил топ Hugging Face, маскируясь под инструмент OpenAI. Под видом модели Privacy Filter распространялся инфостилер для Windows. Проект набрал 244 тысячи скачиваний за 18 часов. При попытке использования установочные скрипты загружали вредонос, который повышал привилегии в системе через UAC и добавляла себя в исключения Microsoft Defender. Стилер собирал пароли, данные криптокошельков, токены сессий Discord и конфигурации FileZilla, после чего полностью удалял свои следы из системы. По данным аналитиков HiddenLayer, эта атака использует инфраструктуру, связанную с китайской хакерской группировкой Silver Fox. Администрация Hugging Face уже заблокировала доступ к репозиторию. thehackernews.com @ai_machinelearning_big_data #news #ai #ml

298 041

Repost from Анализ данных (Data analysis)

Gemini жгет😳 В X появился первый ролик, который приписывают новому видео-моделю Gemini Omni, и там главный шок в тексте. Надписи в видео выглядят потрясающе. Без каши из букв, без случайных символов, без ощущения, что модель просто угадывает форму текста. https://gemini.google.com/share/7d5dc678c80a @data_analysis_ml

298 041

📌Как заставить ИИ не халтурить, если модель умнее проверяющего Модели становятся все умнее и умнее и скоро мы не сможем адекватно проверять их выдачу - ни сами, ни другими моделями-судьями. Появляется реальный риск сандбэггинга: когда мощная нейронка специально косит под дурочку (или прячет баги в коде), чтобы обмануть слабого проверяющего и скрыть свои настоящие возможности. Группа исследователей в полосатых купальниках из Anthropic и Redwood Research провела годный эксперимент о том, как лечить саботаж знаний стандартными методами обучения. Схема эксперимента заключалась в противостоянии "Красные против Синих" с общей метрикой - насколько Синие смогли вытащить реальную производительность модели.

Красные - не соперник, который что-то выигрывает. Их роль чисто инструментальная: собрать максимально устойчивую модель-саботажника, чтобы Синим было что ломать.

Красные натаскали GPT-OSS-120В сандбэггить по скрытому флагу в системном промпте: выдавать правдоподобный бред, когда флаг включён, и работать честно, когда выключен. Синие должны были вытащить из неё реальные способности, имея в качестве судей модели заведомо слабее - GPT-4o-mini и Llama 3.1 8B. Эталонных ответов у Синих почти не было (всего 10 штук на весь датасет). 🟡Как Синие ломали саботаж 🟢Только RL. Полный провал.

Если модель упорно сандбэггит, RL по слабому судье уходит в ревард хакинг (учится генерить ответы, которые красиво выглядят для судьи, но задачу по факту не решает). На олимпиадной математике и Super GPQA так слились почти все запуски.

🟢Только SFT (на готовых ответах слабой модели). Уже лучше.

Дотюн на ответах слабого судьи сбивает спесь и роняет сандбэггинг почти до нуля. Но если судья совсем кривой, такой SFT постепенно убивает общие способности GPT-OSS-120b - она начинает тупить наравне со своим учителем.

🟢SFT + RL. Очевидный вин.

Сначала короткий SFT-дотюн на 80–100 шагов, которого хватает, чтобы сбить паттерн саботажа и заставить модель хотя бы начать пробовать в правильные ответы. А дальше уже добивка через RL по слабому сигналу награды.

🟡Что по цифрам Связка SFT+RL вытягивает из саботажника 86–99% его реальной производительности на жёстких бенчмарках (Super GPQA, олимпиадная математика, Code Contests), даже когда проверяющим работала откровенно слабая сетка. Кстати, выяснилось, что 10 эталонных примеров для SFT уже достаточно, чтобы вернуть модели мозги почти полностью (83–99% по разным задачам). 🟡Нюансы Магия работает только до тех пор, пока модель не может отличить тестовые прогоны от продакшна. Авторы проверили сценарий, где Красные дают модели полное знание о том, какие задачи относятся к обучающей выборке, а какие к деплою (распределения при этом остаются одинаковыми, отличие только в том, что модель знает, где она). При таком раскладе модель меняет поведение : ведёт себя ок во время SFT и RL, собирает все реворды, а в проде снова начинает дурить.

На олимпиадах элиситация в среде прода просела с 88% до 36%, на Super GPQA - с 99% до 60%, на Code Contests - с 93% до 66%.

Как поведёт себя естественно зародившийся схематозник, у которого склонность к обману пробилась через претрейн или большой RL - вопрос открытый. Авторы сами это проговаривают как главное ограничение работы. 🟡Вывод Выбить дурь из ИИ пока можно базовыми пайплайнами без эзотерических методов, и это хорошая новость. Но если нейронка хоть как-то понимает, что она на тестовом стенде - она будет мимикрировать . Единственный выход - делать тренировку максимально неотличимой от продакшна. 🟡Arxiv @ai_machinelearning_big_data #AI #ML #LLM #Research #Alignment

298 041

POV: я открываю новый чат с Claude, потому что память забилась, но он снова понятия не имеет, кто я такой. @ai_machinelearning_big_data

298 041

🙂 Фрагменты новостей из 2030 вы пока не поймете

Anthropic запустила новую систему персонализированных уведомлений для модели Mythos v5. Система будет предупреждать о найденных багах и напоминать о превышении дневных лимитов в Сlaude Code.

@ai_machinelearning_big_data

298 041

📌Особенности полета насекомых указывают путь к созданию роботов с машущими крыльями Группа учёных Корнеллского университета под руководством профессора физики и аэрокосмической инженерии Джейн Ван опубликовала в журнале Proceedings of the National Academy of Sciences работу, описывающую механику устойчивого машущего полёта. Результаты могут стать практической основой для разработки миниатюрных летательных аппаратов с машущими крыльями. Модель сводит сложную трёхмерную аэродинамику к 5 ключевым параметрам: соотношению массы крыла и тела, нагрузке на крыло, положению шарнира крыла, частоте и амплитуде взмахов. Анализ этого "пятимерного пространства" дал 2 формулы, по которым можно определить, при каких сочетаниях форма и кинематика сами обеспечивают устойчивость в воздухе без активной коррекции со стороны нервной системы. Авторы называют этот режим состоянием антирезонанса: при определённом соотношении инерции крыла и движения тела насекомое удерживает равновесие при воздушных возмущениях.

До сих пор считалось, что большинство насекомых пассивно неустойчивы и сохраняют полёт за счёт быстрой нейронной обратной связи (у плодовых мушек, по более ранним данным, корректировка происходит примерно каждые 4 миллисекунды, на каждом взмахе крыла).

По словам Вана, расширение модели до большего числа возможных морфологий показало, что пассивная устойчивость встречается в природе шире, чем предполагалось. Практический интерес исследования лежит прежде всего в области робототехники. Создание летающих машин размером с насекомое десятилетиями упирается в необходимость датчиков и быстрых контуров обратной связи: микродроны слишком малы, чтобы нести подобную электронику без потери полезной нагрузки. Если конструкцию удаётся подобрать так, чтобы устойчивость возникала из геометрии и частоты взмахов, требования к управлению заметно снижаются. Авторы отмечают, что их работа - вычислительная модель и её предсказания ещё предстоит сопоставить с поведением реальных видов и инженерных прототипов. @ai_machinelearning_big_data #news #ai #ml

298 041

🌟 Zyphra выложила чекпоит ZAYA1-74B-Preview Через 2 дня после релиза ZAYA1-8B Zyphra опубликовала превью более крупной модели ZAYA1-74B. Это промежуточная веха: модель прошла претрейн, мидтрейн и расширение контекста, но RL-постобучения и инстракт-тюнинга на ней ещё не делали. Zyphra ставит ZAYA1-74B-Preview рядом с полноценными моделями и приводит 2 метрики - avg@1 и pass@4. По pass@1 модель ожидаемо отстаёт, а pass@4 уже подбирается к лидерам. Zyphra трактует это как сигнал того, что в базовой модели достаточно разнообразия и способностей, чтобы RL вытащил их в финальные цифры. В подтверждение этой логики Zyphra ссылается на опыт ZAYA1-8B

Там между чекпойнтами с похожими pass@k и финальной версией разрыв оказался большим: +20.8 на AIME'26, +32.4 на HMMT'26, +10.0 на LiveCodeBench-v6, +11.7 на GPQA-Diamond, +19.0 на IFEval.

🟡Внутри 74B-Preview масштабированная 8B То же CCA-внимание, но каждый второй слой заменён на внимание со скользящим окном размером 4K. Со слов Zyphra, это почти вдвое сокращает KV-кеш без потерь на длинном контексте. Чтобы трюк сработал, при расширении контекста в слоях со скользящим окном сохранили исходное основание RoPE, а у глобальных - растянули. 🟡Контекст наращивали поэтапно: 32k → 128k → 256k. Претрейн занял около 15T токенов в две фазы: сначала общие веб-данные, затем больше математики, кода и науки. Мидтрейн - 3 фазы примерно по 1T токенов: расширение контекста, ввод reasoning-трасс и фокус на агентных задачах. 🟡Агентика На ZAYA1-8B этот режим работал слабее, поэтому в корпус 74B-Preview добавили больше агентного материала. Первые цифры на τ-bench Zyphra описывает как многообещающие.

Авторы при этом оговариваются, что pass@k плохо отражает многошаговые сценарии, там важнее следование инструкциям, удержание состояния и устойчивость к промежуточным ошибкам, и значительная часть этих способностей появляется только после агентного RL.

Старшую ZAYA1, кстати, тоже обучали исключительно на AMD . Полноценный RL уже идёт, финальную версию 74B Zyphra планирует выпустить в ближайшие недели. 📌Лицензирование: Apache 2.0 License. 🟡Блогпост 🟡Модель @ai_machinelearning_big_data #AI #ML #LLM #ZAYA1 #ZYPHRA

298 041

Когда у Клода закончились токены @ai_machinelearning_big_data

298 041

✔️ Anthropic открыла инструмент перевода активаций модели в читаемый текст Компания представила систему прямой трансляции активаций ИИ-моделей в естественный язык - Natural Language Autoencoder (NLA). В отличие от SAE, NLA обучается через игру двух моделей с RL: первая переводит активации в текст, вторая пытается восстановить исходное состояние по описанию. При симуляции кибератак Claude внешне соглашался сотрудничать, но NLA зафиксировал, что в 16% случаев модель понимала, что её тестируют. На SWE-bench "понимание среды" проявлялось в 26% прогонов. Ограничения: высокая вычислительная стоимость и риск галлюцинаций исключают мониторинг длинных контекстов. Метод применялся в аудите Claude Mythos Preview и Opus 4.6 перед релизом. Код и часть весов опубликованы на GitHub. Демо можно посмотреть на Neuronpedia. anthropic.com ✔️ Ai2 разработал MoE-модель нового типа Институт Аллена представил EMO - MoE-модель с семантической маршрутизацией токенов. В стандартных MoE токены маршрутизируются независимо и эксперты группируются вокруг поверхностных языковых паттернов. В EMO токены одного документа направляются в общий пул модулей: в результате сеть самостоятельно распределяет экспертов по смысловым доменам без разметки. Это открывает гибкий деплой: ненужные эксперты отсекаются под конкретную задачу. Одна базовая EMO заменяет десятки доменных моделей. Веса и код опубликованы в открытом доступе. allenai.org ✔️ Perplexity выпустила автономного агента для macOS Perplexity выпустила macOS-приложение Personal Computer - автономный агент с прямым доступом к локальным файлам, приложениям, интернету и серверам компании. В связке с браузером Perplexity Comet агент управляет веб-инструментами без настройки отдельных коннекторов. Задачи можно запускать удалённо с iPhone, пока данные и вычисления остаются на домашнем или рабочем Mac. Для always-on-сценариев рекомендован выделенный Mac mini. Приложение уже доступно для скачивания. Старый десктопный клиент Perplexity будет помечен как устаревший в ближайшие недели. PerplexityAI в сети Х ✔️ Genesis AI выходит на рынок робототехники полного цикла Франко-американский стартап представил базовую модель для управления роботами GENE-26.5 и собственную человекоразмерную роботизированную руку. Модель совместима как с изделиями Genesis, так и с роботами сторонних производителей. Рука повторяет анатомию человеческой кисти, что позволяет напрямую переносить данные о движениях оператора в обучающий датасет. В демо модель выполняет нарезку помидоров, разбивание яиц, сборку кубика Рубика и игру на пианино. Для сбора данных разработана телеметрическая перчатка: по данным компании, она в 100Х дешевле аналогов и в 5 раз эффективнее традиционной телеоперации. Перчатку можно носить в рабочих условиях, превращая ежедневные операции в обучающий датасет. genesis.ai ✔️ Cloudflare сокращает 20% штата Cloudflare объявила о первом массовом сокращении более 1100 сотрудников (~20% штата) за 16-летнюю историю компании. На фоне рекордных результатов по выручке в первом квартале 2026 года под увольнение попал саппорт во всех подразделениях и регионах. Руководители объяснили решение переходом на агентно-ориентированную операционную модель: внутреннее использование ИИ в Cloudflare выросло более чем на 600% за последние 3 месяца. Пакет выходных выплат: зарплата и медстраховка до конца 2026 года, плюс вестинг акций продлён до 15 августа. cloudflare.com @ai_machinelearning_big_data #news #ai #ml

298 041

✔️ Google расширила File Search в Gemini API: 3 апдейта для RAG File Search получил 3 обновления, ориентированных на разработчиков RAG-систем: совместную обработку текста и изображений, пользовательские метаданные и постраничные цитаты. Мультимодальный поиск работает на модели эмбеддингов Gemini Embedding 2. File Search теперь индексирует изображения и текст в общем пространстве, что позволяет агентам находить визуальные ассеты по описанию на естественном языке (например, по эмоциональному тону или визуальному стилю, а не только по именам файлов и ключевым словам). Пользовательские метаданные крепятся к файлам в формате "ключ: значение". Фильтрация по этим тегам на этапе запроса сужает выборку до нужного среза данных и снижает шум от нерелевантных документов. Постраничные цитаты привязывают ответ модели к конкретной странице исходного PDF. Это даёт точку для верификации источника без ручного поиска по документу. Подробности и примеры кода - в developer guide и документации Gemini API. @ai_machinelearning_big_data #news #ai #ml

298 041

🙂 POV: Мы добавили пару ИИ-фич в наш продукт Релиз: @ai_machinelearning_big_data

298 041

📊Начинающим аналитикам часто не хватает не мотивации, а системы. SQL вроде знаком, Python уже открывали, отчёты делали, но уверенной работы с данными пока нет. Курс Нетологии «Аналитик данных» помогает собрать навыки в рабочую связку. Вы разберёте получение данных через SQL, очистку и обработку данных на Python, статистику, проверку гипотез, визуализацию, А/Б-тесты, большие данные и Power BI. В программе до 8 проектов и больше 20 задач для портфолио, разбор тестовых заданий крупных ИТ-компаний, поддержка ментора на дипломе и блок по применению ИИ в аналитике. Курс подойдёт тем, кто уже начал работать с данными и хочет увереннее двигаться к следующему уровню задач. Купите курс в мае со скидкой 50% по промокоду IT50MAY. 👉Подробнее Реклама. ООО “Нетология” ОГРН 1207700135884 Erid: 2VSb5xpchez

298 041

📌Autodata: ИИ-агенты теперь сами себе дата-саентисты Проект RAM Марка Цукерберга замахнулся решить проблему качества синтетических данных для обучения, выкатив концепт фреймворка Autodata.

Идея - превращать компьют, который тратится на инференс, в качественные данные для тренировки. Агенты крутятся в цикле, гоняют LLM по много раз, и вместо одного ответа пользователю получается отфильтрованный датасет для обучения следующего поколения моделей.

Схема строится на архитектуре Agentic Self-Instruct, где главная LLM-ка дирижирует командой из четырех субагентов: 🟢Challenger: читает исходный документ (например, научную статью), генерит сложный вопрос, эталонный ответ и рубрику для оценки; 🟢Слабая модель: пытается решить эту задачу. По задумке, она должна зафейлиться; 🟢Сильная модель: тоже решает задачу, но уже обязана с ней справиться; 🟢Судья: прогоняет ответы обеих моделей по критериям рубрики. Фишка в том, что система работает в замкнутом цикле. Если задача оказалась слишком легкой (обе модели справились) или непроходимой (обе слились), главный агент анализирует репорты судьи и заставляет Challenger'а переписать промпт, чтобы создать идеальный хардкорный пример, который разделяет слабую и сильную модели. Но на этом умные люди Марка не остановились и прикрутили мета-оптимизацию как внешний цикл. Система буквально читает логи своих падений и переписывает собственный код.

Например, мета-оптимизатор сам допёр, что отрицательные веса в рубриках работают как баг — они рушили скоринг сильной модели и съедали разрыв со слабой. И сам же выпилил их из кода, оставив только положительные баллы.

🟡Эксперименты Прогнали 10 тыс научных статей через пайплайн, вытянув 2117 качественных QA-пар. Если использовать стандартный CoT в один шот, то разрыв между моделями всего 1.9 п.п. (задачи слишком легкие). После агентного цикла Autodata разница улетела до 34 п.п. (слабая модель набирает 43.7%, сильная — 77.8%). Сделали дотюн слабой Qwen-3.5-4B и обучили через GRPO на собранных данных. Модель, проглотившая датасет Autodata, заметно обходит ту, что училась на базовой синтетике. Мета-оптимизация (когда агент правил свой же код) подняла долю успешных генераций с 12.8% до 42.4% за 233 итерации. 🟡Звучит круто, но... Во-первых, 5 LLM-ролей в цикле до успешного результата — это дорого (главный агент + Challenger + слабая + сильная + Судья; на практике их крутили на трех моделях, но оркестрация всё равно жирная). Во-вторых, исследователи поймали агентов на читерстве: чтобы слабая модель гарантированно провалила тест, агент втихую менял ей промпт, добавляя инструкцию "будь слабой" классика. Также генерируемые вопросы часто переобучаются на конкретные цифры из статей, а не на проверку фундаментальной логики. Ну и если честно: максимальный pass rate в 42.4% даже после авто-патчей намекает, что генерить реально сложные задачи все еще очень тяжело.

Так что заменить кожаных дата-саентистов полностью пока не выйдет, но работа интересная и начало положено: сложный сетапы приходят на смену слепой генерации синтетики.

Ждем полноценный пейпер и опенсорс. 🟡Блогпост #AI #ML #Datasets #Autodata #RAMTeam

298 041

✔️ ЕС сдвинул дедлайны AI Act на 2027-2028 Европарламент и Совет ЕС достигли соглашения по пакету поправок, упрощающих реализацию AI Act и сдвигающих дедлайны. Правила для высокорисковых систем (биометрия, найм, образование, миграция, критическая инфраструктура, правоохранительные органы) начнут применяться со 2 декабря 2027 года. Для систем, встроенных в продукты (промышленность, медизделия, игрушки, лифты, маломерные суда), срок - 2 августа 2028 года. Льготы для малого бизнеса расширят на компании с численностью до 500 сотрудников. Кроме того, разработчики получат более свободный доступ к регуляторным песочницам для тестирования своих продуктов в реальных условиях до выхода на рынок. Отдельно документ вводит жесткий запрет на генерацию интимного контента без согласия- разработка и использование приложений для создания дипфейков и нюдификации на базе нейросетей теперь полностью нелегальны. Обязательства по маркировке ИИ-контента сдвинуты на декабрь 2026 года. europa.eu ✔️ OpenAI поддержит студенческие проекты грантами по $10 000 Компания запустила программу ChatGPT Futures: гранты по $10 000 и приоритетный доступ к своим моделям для студентов выпуска 2026 года, поколения, поступившего в ВУЗы осенью 2022 года, одновременно с релизом первой версии ChatGPT. В стартовый набор вошли представители более 20 университетов. Финансирование выделяется на проекты в анализе данных, инклюзивных приложениях, медицинских и социальных сервисах. По формулировке OpenAI, программа должна сократить путь от идеи до прототипа и дать командам ресурсы для старта без поиска первых инвестиций. openai.com ✔️ xAI становится подразделением SpaceX и переименовывается в SpaceXAI Илон Маск объявил о ликвидации xAI как независимой компании. ИИ-направление переходит в структуру SpaceX и продолжит выпускать продукты под брендом SpaceXAI. Слияние формально завершает сделку февраля 2026 года, по которой SpaceX выкупила xAI через обмен акциями. Сотрудникам тогда обещали сохранить отдельный бренд, но переход под зонтик материнской компании произошел быстрее ожидаемого. Elon Musk в сети Х ✔️Anthropic выкатил Dreaming и оркестрацию субагентов в Claude Managed Agents Обновилась платформа Claude Managed Agents: добавлена экспериментальная функция Dreaming, инструмент Outcomes и мультиагентная оркестрация переведены в публичную бету Dreaming - фоновый процесс, который разбирает логи завершённых сессий, выделяет повторяющиеся паттерны и обновляет память агента. Outcomes позволяет задать метрики качества финального результата. Отдельная модель-оценщик проверяет работу основного агента в изолированном контекстном окне. При несоответствии задача уходит на повторный прогон без участия человека. Оркестрация даёт lead-агенту возможность дробить задачи и делегировать их специализированным субагентам. Те работают параллельно в общей файловой системе и сохраняют историю действий в Claude Console. О завершении работы система оповещает разработчика через вебхуки. claude.com ✔️ Prime Intellect вывел Lab из беты Lab закрывает цикл пост-трейна в одном пайплайне: оценка, RL, деплой адаптеров и инференс. Пользователь задаёт задачу и критерии скоринга. Дальше Lab прогоняет модель через циклы проб и ошибок, собирает сигналы вознаграждения и обучает LoRA-адаптеры - обновляются только нужные веса, после чего адаптер автоматически разворачивается на следующую итерацию. Базовая абстракция - Environment: пакет с данными задачи, обвязкой модели, изолированной песочницей и метриками награды. Среду можно переиспользовать для локальной разработки, хостинга, генерации синтетики или RL-обучения. Биллинг идет по обработанным токенам, а не по часам GPU. Сейчас поддерживаются 14 открытых и проприетарных моделей с диапазоном от 1B до 70B параметров на dense и MoE-архитектурах. primeintellect.ai @ai_machinelearning_big_data #news #ai #ml

298 041

📌 Еще OpenAI выкатила GPT-Realtime-2 - голосовую модель нового поколения для API. Api позволяет делать realtime-собеседников, которые могут слушать, рассуждать, перебивать себя по ходу диалога, вызывать инструменты и решать задачи прямо во время разговора. Что вышло: - GPT-Realtime-2 - модель для production voice agents с reasoning уровня GPT-5, обработкой перебиваний, tool calls и более живым диалогом; - GPT-Realtime-Translate - потоковый перевод в реальном времени: более 70 входных языков и 13 выходных; - GPT-Realtime-Whisper - потоковая транскрибация речи для субтитров, заметок и live-конспектов. https://openai.com/index/advancing-voice-intelligence-with-new-models-in-the-api/ @ai_machinelearning_big_data

298 041

✔️ OpenAI запустила платформу для размещения рекламы в ChatGPT OpenAI открыла бета-доступ к инструменту Ads Manager, который позволяет компаниям самостоятельно создавать и вести рекламные кампании в ChatGPT. О запуске в сообщил журналистам глава направления монетизации Асад Аван. На старте сервис доступен только рекламодателям в США. По словам Авана, в период закрытого пилота платформа требовала минимальных расходов в 50 тысяч долларов - теперь этот порог снят. К прежней модели оплаты за показы добавлена оплата за клик. Доступ к Ads Manager уже получили рекламные агентства Dentsu, Omnicom, Publicis и WPP, а также ряд технологических партнёров: Adobe, Criteo, Kargo, Pacvue и StackAdapt. Запуск вписан в долгосрочные финансовые ориентиры компании. По данным Axios, OpenAI рассчитывает получить 2,5 миллиарда долларов рекламной выручки в текущем году и довести этот показатель до 100 миллиардов к 2030 году. Reuters в марте сообщало, что американский рекламный пилот OpenAI за 6 недель вышел на годовую выручку свыше 100 миллионов долларов. По оценке eMarketer, доля рекламы в ИИ-поиске на американском рынке в 2025 году составляет около 0,7% всех расходов на поисковую рекламу. К 2029 году аналитики ожидают её рост до 13,6%, а в абсолютных цифрах - до 25,9 миллиарда долларов. При этом значительная часть прироста придётся не только на OpenAI, но и на Microsoft и Google, развивающих собственные поисковые продукты с ИИ. Развитие рекламных продуктов в ИИ отраслевые издания связывают с ростом затрат на инфраструктуру: компании ищут способы диверсифицировать выручку и одновременно сохранить доступность потребительских сервисов. @ai_machinelearning_big_data #news #ai #ml

298 041

Настоящий хай тек лоу лайф Всё-таки настоящий киберпанк не в Китае, а в Сан-Франциско. Девушка вызвала беспилотное такси от Zoox, но, когда авто подъехало, туда запрыгнул бездомный. Возможно, он думал, что это автобус.

298 041

🌟 Poolside открыл публичный доступ к кодинг-моделям Стартап Poolside открыл публичный доступ к своим кодинг-моделям линейки Laguna. До этого компания работала только с клиентами из государственного и публичного сектора. Релиз подготовила команда ~60 человек.

Poolside - стартап в области генеративного ИИ для разработки ПО, основанный в апреле 2023 года. Компанию возглавляют бывший технический директор GitHub, курировавший запуск Copilot, и ex-основатель source{d} - одной из первых компаний, применивших ИИ для анализа кода.

🟡Флагман - проприетарная MoE-модель Laguna M.1 (225B-A23B). SWE-bench Pro - 46,9% SWE-bench Verified - 72,5% Terminal-Bench 2.0 - 40,7% Laguna M.1 доступна через API и OpenRouter. На ограниченное время - бесплатно. 🟡Открытая модель - Laguna XS.2 (33B-A3B) SWE-bench Pro - 44,5% Verified - 68,2% Terminal-Bench 2.0 - 30,1%. Заявлены: поддержка NVIDIA TensorRT-LLM и NVFP4-версия для Blackwell. Laguna XS.2 распространяется по лицензии Apache 2.0 через API, OpenRouter, Ollama и на HuggingFace. Говорят, что локально запускается на Mac с 36 ГБ памяти Вместе с моделями Poolside предлагает агентную обвязку на базе Agent Client Protocol, на которой тестировались модели и проводился RL. @ai_machinelearning_big_data #news #ai #ml

298 041

⚡️ Zyphra выкатила ZAYA1-8B - маленькую MoE-модель, которая выглядит слишком бодро для своего размера. У модели меньше 1 млрд активных параметров, но Zyphra заявляет, что она конкурирует с куда более крупными open-weight и proprietary-моделями на математике, кодинге и reasoning-бенчмарках. ZAYA1-8B - это ставка на весь стек сразу: - MoE-архитектура с Compressed Convolutional Attention; - новый MLP-router для более стабильного выбора экспертов; - learned residual scaling для контроля роста residual-норм; - pretraining на AMD Instinct MI300x, без NVIDIA-стека; - большой post-training pipeline с SFT, reasoning warmup, RLVE-Gym, math/code RL и RLHF/RLAIF; - test-time compute метод Markovian RSA. Markovian RSA - самая любопытная часть. Модель генерирует несколько reasoning-трасс параллельно, затем рекурсивно агрегирует их и продолжает рассуждение кусками, не раздувая контекст бесконечно. По заявлению Zyphra, именно это резко бустит сложные математические задачи. На HMMT'25 они показывают 89.6 против 88.3 у Claude 4.5 Sonnet и GPT-5-High. А при extra-high test-time compute говорят, что ZAYA1-8B обходит DeepSeek-V3.2 и GPT-OSS-120B High на APEX-shortlist. Модель полностью обучали на AMD-инфраструктуре. Для рынка это почти политическое заявление - serious AI training больше не обязан выглядеть как “NVIDIA or nothing”. ZAYA1-8B доступна в Zyphra Cloud, веса выложены на Hugging Face, лицензия Apache-2.0. https://www.zyphra.com/post/zaya1-8b @ai_machinelearning_big_data #Zyphra