Machinelearning

Open in Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Network:Machinelearning Russia1 258 Technologies & Applications323...

📈 Analytical overview of Telegram channel Machinelearning

Channel Machinelearning (@ai_machinelearning_big_data) in the Russian language segment is an active participant. Currently, the community unites 297 740 subscribers, ranking 323 in the Technologies & Applications category and 1 258 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 297 740 subscribers.

According to the latest data from 13 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -7 002 over the last 30 days and by -157 over the last 24 hours, overall reach remains high.

Verification status: Not verified
Engagement rate (ER): The average audience engagement rate is 8.06%. Within the first 24 hours after publication, content typically collects 5.70% reactions from the total number of subscribers.
Post reach: On average, each post receives 24 001 views. Within the first day, a publication typically gains 16 986 views.
Reactions and interaction: The audience actively supports content: the average number of reactions per post is 182.
Thematic interests: Content is focused on key topics such as openai, claude, api, gemini, контекст.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

Thanks to the high frequency of updates (latest data received on 14 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

297 740

Subscribers

-15724 hours

-1 5127 days

-7 00230 days

24 001

Post views

~ 16 98624 hours

~ 19 16148 hours

8.06%

Engagement rate

~ 6

Posts per day

Ads index

beta

Posts Archive

297 672

🌟 "ИИ-отцы" получили главную ежегодную награду журнала Time «Человек года». Их объединённый портрет, вдохновлённый культовой фотографией «Обед на небоскрёбе», украсил обложку. В числе тех, кого редакция назвала главными архитекторами новой технологической эры: Илон Маск, Марк Цукерберг, Лиза Су (AMD), Джeнсен Хуанг (Nvidia), Сэм Альтман (OpenAI), Демис Хассабис (DeepMind), Дарио Амодей (Anthropic) и Фэй-Фэй Ли (World Labs). Как отмечает издание, в 2025 году потенциал ИИ был полностью реализован, а эта группа визионеров окончательно утвердила наступление эпохи мыслящих машин. @ai_machinelearning_big_data #news #ai #ml

297 672

🧠 Qwen представляет режим Learn Mode! Learn Mode - обучающий режим в Qwen Chat, который превращает модель в ИИ-репетора. Построен на базе Qwen3-Max, Что делает Learn Mode: - Ведёт обучение через диалог - Подстраивается под ваш уровень подготовки и темп - Строит логические опоры, помогая работать со сложными темами - Формирует индивидуальную траекторию обучения под ваш стиль мышления Попробовать можно здесь: https://chat.qwen.ai/?inputFeature=learn @ai_machinelearning_big_data #Qwen

297 672

🚨 The Information: DeepSeek тайно использует *запрещённые Nvidia Blackwell GPU* для обучения своей следующей модели По данным The Information, DeepSeek тренирует новое поколение своей модели на *тысячах* Blackwell-чипов, которые формально запрещены к поставкам в Китай. Схема выглядит так: серверы с GPU сначала устанавливают и проверяют в «фантомных» дата-центрах за рубежом, после чего их разбирают, декларируют как другое оборудование и снова собирают уже в китайских дата-центрах. Схема показывает, насколько неэффективными остаются экспортные ограничения США, даже несмотря на давление Вашингтона и недавние обвинения в контрабанде против посредников. Nvidia в спешке внедряет механизмы отслеживания местоположения GPU, которые могут фактически «отключать» нелегально ввезённые чипы. Интересное следствие: Китай проявляет слабый интерес к официально разрешённому H200, что может быть связано с тем, что у ведущих игроков уже есть доступ к более мощным - пусть и нелегальным - Blackwell. https://www.theinformation.com/articles/deepseek-using-banned-nvidia-chips-race-build-next-model @ai_machinelearning_big_data #ai #news #Nvidia

297 672

⚡️ В открытом доступе появился техрепорт собственного семейства моделей Яндекса — Alice AI. Что изменилось: ⭐️ VLM- и LLM-«Алисы» сближаются все сильнее, поскольку компания делает большую ставку на мультимодальность. Например, VLM-модель уже использует RL-подход текстовой «сестрёнки». Промпт на входе в Alice AI ART обрабатывается в специальном «рефразере», который помогает сделать описание более детальным. Также увеличен контекст и объем данных претрейна в VLM. ⭐️ Много технических подробностей о работе Alice AI LLM Search, которая теперь приносит в ответе не только текст, но и изображения, видео и геоданные. ⭐️ На инфраструктуре видим прирост по скорости за счет мелких аджастов — увеличение эффективного батча на претрейне, внедрение Ulysses attention, снижение объема кэша на инференсе и еще много изменений. В целом сняты ключевые ограничения для тренировки MoE-модели на сотни миллиардов параметров. @ai_machinelearning_big_data #vlm #llm #ml #ai

297 672

📌 SAPO: RL-метод, который приручил нестабильные градиенты в LLM и MoE. Qwen предложил RL-метод SAPO (Soft Adaptive Policy Optimization), который решает ключевую проблему нестабильного обучения LLM и архитектур MoE и предлагает более разумный и мягкий подход к контролю над процессом обучения.

Reinforcement Learning, RL - это ингредиент, превращающий просто большую языковую модель в рассуждающего помощника. Именно RL учит ИИ решать олимпиадные задачи по математике, писать чистый код и понимать связь между текстом и изображением.

Но у RL есть обратная сторона: катастрофическая нестабильность обучения, особенно для гигантских моделей. Главная техническая головоломка - это контроль над коэффициентами значимости на уровне каждого токена. В архитектурах MoE, где разные части модели активируются для разных задач, эти коэффициенты могут бесконтрольно «скакать». Слишком большие колебания коэффициентов превращают четкие обучающие сигналы в помехи, дестабилизирующие всю систему. До сих пор стандартными инструментами были GRPO и GSPO, которые использовали принцип хард-клиппинга. Если коэффициент выходил за заданные рамки, градиент просто обнулялся. 🟠Минус первый: Потеря информации. Ценные, но выбивающиеся данные безжалостно отбрасывались. 🟠Минус второй: Невозможный баланс. Сделаешь рамки узкими - задушишь обучение. Сделаешь широкими - полезет паразитный шум. Для капризных MoE-архитектур эта дилемма особенно актуальна. SAPO предлагает отказаться от хард-клиппинга в пользу интеллектуального сглаживания. Вместо резкого обнуления SAPO использует плавную, адаптивную функцию (контролируемую температурой), которая мягко снижает влияние проблемных градиентов, но не обнуляет их полностью. Это создает непрерывные области доверия, внутри которых модель может учиться более гибко и безопасно. 🟡Красота SAPO - в универсальности. 🟢Как GSPO, но умнее. Если в длинном ответе сбился лишь один токен, GSPO наказывает всю последовательность. SAPO избирательно подавляет только «виновника», сохраняя полезные сигналы от остальных слов. Это резко повышает эффективность наборов обучающих данных. 🟢Как GRPO, но плавнее. Вместо резкого отключения градиента для плохого токена SAPO применяет постепенное затухание. Это предотвращает резкие рывки в обучении, обеспечивая плавную и стабильную настройку политики модели. Вишенка метода - это асимметричный температурный дизайн. SAPO по-разному обрабатывает «хорошие» и «плохие» обновления. Для токенов с негативным вкладом используется более высокая температура, заставляющая их влияние затухать быстрее и сильнее. Это простое правило надежно гасит наиболее опасные колебания, что на практике приводит к беспрецедентной стабильности процесса RL-обучения. 🟡Теорию подтвердили тестами. При обучении Qwen3-30B-A3B-Base, SAPO не только показал более стабильную кривую обучения , но и достиг более высоких результатов на сложных математических бенчмарках AIME25, HMMT25. Причем он сделал это без трудоемкого маршрутизирующего воспроизведения, которая требовалась конкурентам для работы с MoE. Успех повторили в масштабном эксперименте с мультимодальной Qwen3-VL-30B-A3B, где SAPO стабильно обошел аналоги в смешанных задачах на кодинг, логику и математику. 🟡Статья 🟡Arxiv @ai_machinelearning_big_data #AI #ML #LLM #MoE #SAPO #Qwen

297 672

Расскажем, как создать умных AI‑агентов, работая с MCP 🌨 17 декабря на вебинаре покажем, как создать полезных AI-агентов, которые не просто «думают», а реально работают - получают актуальные данные и принимают решения в режиме реального времени. Ещё недавно разработчики AI‑агентов писали кастомные интеграции с внешними источниками данных и сервисами. Теперь появился способ подружить нейросети со всеми API всего за пару кликов! Ключевые темы вебинара:

♦️эволюция агентов и роль MCP; ♦️обзор MCP — как разрабатывать умных ИИ-агентов; ♦️особенности MCP в Enterprise; ♦️свой MCP-сервер за пару шагов в Octapi.

Регистрация доступна по ссылке, ждём вас ↗️

297 672

✔️ Марк Цукерберг сворачивает стратегию Open Source. Компания радикально меняет вектор развития ИИ, отказываясь от идеологии открытости в пользу закрытых коммерческих продуктов. По данным источников, уже весной будет выпущена проприетарная модель Avocado, которая будет распространяться по закрытой лицензии для прямой монетизации. Причиной резкого разворота стала неудача с Llama 4, которая не оправдала ожиданий руководства. Любопытно, что в процессе обучения Avocado использовались ответы моделей конкурентов: Google Gemma, GPT-OSS и Qwen. bloomberg.com ✔️ Nvidia разработала механизм проверки геолокации своих чипов. Компания создала ПО, которое определяет страну, где физически работают её ИИ-ускорители. Технология опирается на анализ сетевых задержек при обмене данными с серверами Nvidia, что позволяет установить геолокацию оборудования с точностью, достаточной для выявления нарушений санкционного режима. Первыми поддержку новой функции получат системы на Blackwell. Инженеры также изучают варианты внедрения технологии для предыдущих поколений Hopper и Ampere. Nvidia позиционирует этот инструмент как опциональное ПО для инвентаризации и мониторинга состояния GPU-флота в дата-центрах, но фактически он отвечает на требования властей США о противодействию контрабанды железа в Китай. reuters.com ✔️ Cursor получил режим Debug Mode. Debug Mode — это новый агентный сценарий для борьбы с ошибками, которые обычно ставят языковые модели в тупик. Фишка инструмента в том, что он не пытается угадать решение, а действует методично: сначала выдвигает несколько гипотез о причинах сбоя, а затем временно внедряет в код инструкции для сбора runtime-логов. Процесс отладки полностью интерактивен. После того как агент расставит «ловушки» в коде, разработчик должен воспроизвести ошибку в запущенном приложении. Получив реальные данные, Cursor локализует проблему и предлагает конкретный фикс без переписывания сотен строк кода. Если исправление работает, система автоматически вычищает весь черновой код, оставляя в проекте только финальный патч. cursor.com ✔️ Microsoft превратила Copilot в автономного агента для автоматизации работы в Excel. Microsoft открыла общий доступ к режиму Agent Mode в веб-версии Excel. Это обновление меняет взаимодействие с ИИ: Copilot теперь выполняет роль агента, способного самостоятельно выполнять многоступенчатые сценарии внутри книги. В новом режиме агент может создавать таблицы с нуля, используя данные из веба, проводить сценарное моделирование «что - если», исправлять сложные формулы и строить сводные таблицы. Система показывает цепочку рассуждений и каждый шаг выполнения задачи. Инструмент доступен подписчикам Microsoft 365 в веб-интерфейсе, а поддержка десктопных версий для Windows и Mac появится в январе. techcommunity.microsoft.com ✔️ Adobe интегрировала Photoshop и Acrobat в интерфейс ChatGPT. Компания запустила специализированные ИИ-агенты для редактирования медиафайлов и документов прямо в чат-боте. Новые инструменты поддерживают конкретные сценарии работы: Photoshop внутри чата умеет ретушировать области снимков и управлять контрастом и экспозицией. Acrobat - конвертировать, сжимать, объединять PDF-файлы и извлекать из них таблицы. Adobe Express используется для генерации и правки макетов. Если возможностей чат-бота окажется недостаточно, проект можно бесшовно перенести в десктопный софт Adobe. Решение уже доступно в веб-версии, на десктопах и iOS. Функциональность предоставляется бесплатно: для активации достаточно загрузить файл и ввести текстовую команду с упоминанием нужного сервиса, например, «Adobe Photoshop, убери фон на этом изображении». theverge.com @ai_machinelearning_big_data #news #ai #ml

297 672

Илон Маск:

Я бы притормозил развитие ИИ и робототехники, но не могу - они движутся вперёд слишком стремительно, нравится мне это или нет. «У меня было много кошмаров про ИИ… много дней подряд». И что я должен с этим делать?

@ai_machinelearning_big_data

297 672

Voice message00:01

297 672

⭐️ Nous Research открыла исходный код Nomos 1. При размере всего 30B параметров модель набрала 87/120 на Putnam - одном из самых престижных математических конкурсов в мире. Такой результат соответствовал бы 2-му месту среди 3988 участников в 2024 году. Nomos 1 показала 87/120 и восемь идеальных решений. Для сравнения: Qwen3-30B при тех же условиях получила 24/120. Это подчёркивает, что преимущество Nomos связано прежде всего с качеством обучения и данных, а не с тестовой средой. Проверка решений проходила вслепую: их оценивал реальный участник Putnam из топ-200, получивший обезличенные ответы. Задачи решались в тех же временных рамках, что и у участников - по 3 часа на каждую часть. Система рассуждений устроена так: — сначала “workers” решают наиболее сложные задачи и сами оценивают свои решения; — затем этап финализации, ИИ объединяет ответы и выбирает итоговый вариант. ▪HF: https://huggingface.co/NousResearch/nomos-1 ▪Github: https://github.com/NousResearch/nomos @ai_machinelearning_big_data #llm #ml #ai

297 672

Россия рискует проспать четвертую технологическую революцию, если частному IT-бизнесу не давать работать Данные подтверждают тревогу: по свежему Global AI Vibrancy Tool 2025 от Stanford HAI, Россия на 28-м месте из 36 стран по силе AI-экосистемы. Мы отстаем от США (1-е), Китая (2-е) и даже Индии (3-е). В рейтинге IMF AI Preparedness Index, который оценивает, насколько страны готовы к массовому внедрению и безопасному использованию AI, ситуация еще жестче: 53-е место из 174. При этом потенциал гигантский: по репорту Яков и Партнёры + Яндекс, AI может приносить экономике 8-13 трлн руб. в год, из них до 2,7 трлн только от генеративных моделей. Российский рынок AI уже сейчас растёт на, приблизительно, 30% в год, 74% компаний используют его в ключевых процессах. Если не мешать частному бизнесу, к 2030-му AI добавит к экономике около 11 трлн рублей (как ещё один бюджет Москвы). В своем свежем посте предприниматель Олег Дерипаска экспертно разбирает, почему в гонке AI Китай потенциально может вытеснить и США, а по сути – весь мир. Китай производит вдвое больше энергии с тарифами на 4–8% ниже, давая скидки до своих техгигантов, что делает их дата-центры и заводы дешевле. В чипах США лидируют по качеству технологий, но Китай удваивает производство ежегодно, пока Запад растёт на треть. Дерипаска цитирует главу Nvidia: по frontier-моделям США впереди на полгода, но open-source (основной рынок) – китайская территория. И главное: китайцы внедряют AI без оглядки, а американцы с опаской. Соперничество не в дуэли GPT и DeepSeek, а в реальных факторах. А что в России? Больше половины спецов по AI уехали, усиливаются регуляторные барьеры, развитие AI переориентировано на внутренние нужды, а не на экспорт. Решение в поддержке: больше грантов, меньше проверок. Частный бизнес – не угроза, а двигатель, который даже в таких условиях показывает результат: от Яндекса с их RATE (метрикой переводов, которая ловит в семь раз больше ошибок) до МТС с AI Agents Platform (платформа для создания, запуска и масштабирования AI-агентов). Секрет успеха по Дерипаске, прост: долгосрочное планирование, гос.поддержка перспективных индустрий и помощь лидерам в постройке инфраструктуры. А если не дать работать частному бизнесу, не перестать его кошмарить, то "мы проспим уже четвертую технологическую революцию", и застрянем "в пещере изолированного интернета" с чат-ботом, который рассказывает анекдоты про медведей.

297 672

🚀 Вышло крупное обновление Qwen3-Omni-Flash (версия 2025-12-01) Что изменилось: 🎙️ Модель намного лучше ведёт разговоры с голосом и видео - общение звучит естественно и непрерывно ✨ Теперь можно задавать характер ИИ через system prompts, например, стиль общения или роль 🗣️ Улучшена поддержка языков: 119 письменных и 19 голосовых 😊 Голоса звучат почти как настоящие люди Где попробовать: 🎙️ В Qwen Chat - нажмите VoiceChat или VideoChat (правый нижний угол): http://chat.qwen.ai 📝 Подробности в блоге: https://qwen.ai/blog?id=qwen3-omni-20251201 🎧 Онлайн-демо: http://hf.co/spaces/Qwen/Qwen3-Omni-Demo 🎧 Второе демо: http://modelscope.cn/studios/Qwen/Qwen3-Omni-Demo ⚡ Realtime API: https://modelstudio.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3-omni-flash-realtime-2025-12-01 📥 Offline API: https://modelstudio.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3-omni-flash-2025-12-01 @ai_machinelearning_big_data #Qwen #llm #ml

297 672

🦾 IR-SIM - открытый, легковесный Python-симулятор роботов для навигации, управления и обучения с подкреплением IR-SIM даёт простой способ моделировать роботов, сенсоры и окружения без сложной инфраструктуры и дорогого железа. Подходит для учебных и исследовательских задач, быстрых экспериментов и прототипирования алгоритмов. Что умеет: • Симулировать роботов с разной кинематикой, сенсорами и поведением. • Настраивать сцены через простые YAML-файлы без долгого программирования. • Визуализировать результаты через встроенный визуализатор на matplotlib - удобно для отладки и понимания. • Поддерживать столкновения и кастомные политики поведения объектов. • Работать в мульти-агентных сценариях и проектах по Reinforcement Learning. Подойдет, когда нужно быстро испытать алгоритм, обучить модель, протестировать динамику робота или создать учебный проект без тяжёлых фреймворков и симуляторов. IR-SIM включает примеры использования, показывающие навигацию, взаимодействие объектов, визуализацию и сценарии RL - отличный старт для студентов, исследователей и разработчиков автономных систем. https://github.com/hanruihua/ir-sim @ai_machinelearning_big_data

297 672

⚡ Пентагону приказано готовиться к AGI На этой неделе на голосование выходит оборонный бюджет на $900 млрд, и внутри есть исторический прецедент. Впервые Конгресс формально обязал Минобороны США создать к апрелю 2026 года “Комитет по будущему ИИ”. Его задача - изучать и готовиться к AGI: технологиям, которые могут сравняться или превзойти человека в любых задачах. Это первый раз, когда военное ведомство США получает прямой мандат анализировать не просто ИИ, а потенциал сверхразумных систем. Задачи комитета: 1) Изучать продвинутые технологии, которые могут привести к AGI: большие модели, агентные системы, нейроморфные вычисления. 2) Анализировать, как к AGI могут идти Китай, Россия, Иран и Северная Корея, где они могут догнать или опередить США. 3) Сформировать стратегию, где человек остаётся главным. В законопроекте прямо прописано: Пентагон должен обеспечить механизмы, позволяющие человеку отменять решения ИИ - технически, политически и операционно. Комитет возглавят заместитель министра обороны и зампред Объединённого комитета начальников штабов, совместно с руководителями видов войск и главным AI-офицером Пентагона. Итоговый доклад в Конгресс - до января 2027 года. AGI может прийти через пять лет или через пятьдесят, но США официально начали к нему подготовку. https://www.perplexity.ai/page/pentagon-ordered-to-form-ai-st-3qDBlb0uS0SHVH5mHEjxJw @ai_machinelearning_big_data #ml #ai #agi

297 672

Такой дейлик точно не захочется пропускать 👀 ИИ-помощник ГигаЧат общается голосом вообще на любые темы. Его можно перебивать в процессе и что-то уточнять. В чате есть мужской и женский голоса на выбор, а ещё доступна текстовая расшифровка после разговора. Это удобно, когда нужно быстро обсудить задачу или отрепетировать речь. Работает в веб-версии и приложении на Android . Переходим и пользуемся! Ниже оставили несколько полезных запросов:

Хочу создать блог про отечественные стартапы. Помоги с идеями: на какие темы писать, как привлечь аудиторию, с чего начать?

Какие навыки будут востребованы в работе в ближайшие 5-10 лет? Что стоит изучать уже сейчас, чтобы оставаться актуальным специалистом?

297 672

✔️ OpenAI наблюдает взрывной рост корпоративного ИИ. Компания опубликовала отчет «The state of enterprise AI», который указывает на масштабную трансформацию бизнес-процессов под влиянием ИИ. База корпоративных клиентов превысила 1 миллион организаций, а число Enterprise-мест за год выросло в 9 раз. Главным трендом стало качественное изменение сценариев использования: потребление ризонинг-токенов подскочило на 320%. Это говорит о том, что бизнес перешел от простых чат-ботов к решению многоступенчатых инженерных и аналитических задач. Статистика выявила четкую корреляцию между глубиной погружения в технологии и продуктивностью. Сотрудники, использующие GPT-5 Thinking и Deep Research, экономят более 10 часов в неделю, при этом потребляя в 8 раз больше ресурсов модели, чем обычные пользователи. Особенно заметен разрыв в разработке: там генерируют код через ИИ в 17 раз активнее. openai.com ✔️ Anthropic передала управление протоколом MCP в некоммерческий фонд. Model Context Protocol передан организации Agentic AI Foundation, действующей в структуре Linux Foundation. Это стратегический шаг: технология универсального стандарта для подключения ИИ-моделей к внешним базам данных и инструментам, теперь гарантированно останется нейтральной и открытой. Соучредителями нового фонда вместе с Anthropic выступили OpenAI и Block, а поддержку инициативе оказывают Google, Microsoft и AWS. За год существования MCP добился массовости: протокол используют ChatGPT, Gemini, Claude и VS Code, а число загрузок SDK превысило 97 млн. Переход под эгиду Linux Foundation ставит MCP в один ряд с Kubernetes и PyTorch. Теперь развитие стандарта будет определяться сообществом, что важно для создания совместимой экосистемы ИИ-агентов. anthropic.com ✔️ Китай ограничит использование чипов Nvidia H200 вопреки разрешению на экспорт от США. Власти КНР планируют ввести строгие ограничения на доступ и эксплуатацию Nvidia H200. Это решение готовится на фоне одобрения экспорта данных чипов со стороны администрации США. Несмотря на неожиданный «зеленый свет» из Вашингтона, Пекин демонстрирует осторожность в вопросах использования зарубежного железа. Конкретные детали и механизмы новых барьеров пока не обнародованы. МИД Китая в ответ на запросы ограничился стандартным заявлением о важности взаимовыгодного сотрудничества, не прояснив судьбу поставок. ft.com ✔️ Google выпустит умные очки с ИИ в 2026 году. Google официально подтвердила планы по запуску линейки смарт-очков с ИИ в 2026 году. Техногигант намерен потеснить Марка Цукерберга на этом рынке, объединив усилия с Samsung, Warby Parker и корейским фешн-брендом Gentle Monster. В разработке находятся 2 типа устройств. Первый вариант - оправа с аудиосистемой для голосового взаимодействия с ИИ, второй - модель с встроенными дисплеями для навигации и перевода в реальном времени. Чтобы сохранить вес и габариты на уровне обычных очков, инженеры решили перенести основную вычислительную нагрузку на сопряженный смартфон. cnbc.com ✔️ Инженеры EPFL превратили панцири лобстеров в детали для биогибридных роботов. В EPFL предложили неожиданное решение для робототехники: использование пищевых отходов в качестве готовых экзоскелетов. В рамках концепции, которую авторы назвали «робототехникой мертвой материи», панцири лобстеров перерабатываются в функциональные механические узлы. Процесс создания био-гибридов состоит из заполнения оболочки мягким эластомером, установку приводов и покрытия конструкции силиконом, а природная структура панциря обеспечивает идеальный баланс прочности и гибкости. Опытные образцы смогли поднимать вес до 500 граммов и выполнять захват помидора без повреждений. Инновация решает сразу две задачи: снижает стоимость производства и уменьшает углеродный след, превращая отходы в ресурсы. news.epfl.ch @ai_machinelearning_big_data #news #ai #ml

297 672

⚡️ Mistral AI выпустила Devstral 2. Компания представила сразу 2 версии модели для кодинга: флагманскую Devstral 2 (123 млрд. параметров) и облегченную Devstral Small 2 (24 млрд). Старшая модель выбила 72,2% в бенчмарке SWE-bench Verified, закрепив за собой статус одного из лучших инструментов с открытыми весами. Благодаря контекстному окну в 256k токенов, алгоритм способен удерживать в памяти структуру больших проектов и корректно управлять зависимостями. Для локального запуска на GPU или CPU подойдет версия Small 2, опубликованная под лицензией Apache 2.0. Старшая версия требует серьезного железа (от 4-х H100), но обещает быть до 7 раз экономичнее проприетарных аналогов уровня Claude Sonnet. Вместе с моделями разработчики анонсировали утилиту Mistral Vibe CLI, которая позволяет внедрять ИИ-агентов непосредственно в терминал для автоматизации рефакторинга и оркестрации изменений сразу в нескольких файлах. @ai_machinelearning_big_data #news #ai #ml

297 672

🌟 GeoVista: модель для визуальной геолокации. Tencent в коллаборации с ведущими китайскими университетами выложила в открытый доступ модель GeoVista, которая предлагает интересный подход к решению проблемы "где сделано это фото" - она делает ставку на активный майнинг данных из внешних источников. Система на архитектуре Qwen2.5-VL-7B-Instruct использует 2 инструмента: функцию зума и поисковый движок, подтягивающий до 10 релевантных ссылок с платформ Tripadvisor, Pinterest и Wikipedia и социальных сетей. Модель самостоятельно решает, в какой момент задействовать тот или иной инструмент, что, по сути, имитирует ход мыслей человека-расследователя. GeoVista обучалась сначала (SFT) на 2 тыс. примерах, а потом (RL) уже на 12 тыс. примерах. Для балансировки RL собрали кастомную систему вознаграждений, привязанную к географической точности: правильный ответ на уровне города ценится выше, чем попадание в провинцию или страну. Готовую модель прогнали на собственном бенчмарке GeoBench. На нем GeoVista показала 92,6% точности при определении страны, 79,6% региона и 72,7% - конкретного города. Легче всего модели даются панорамы (79,5% точности на уровне города) и стандартные фото (72,2%), а вот спутниковые снимки остаются ахиллесовой пятой, здесь показатель падает до 44,9%. Если сравнивать с закрытыми моделями, то GeoVista дышит в спину Gemini 2.5 Flash (73,3% на уровне города) и заметно обходит GPT-5, который показал лишь 67,1%. Лидером пока остается Gemini 2.5 Pro с результатом 78,98%, а вот другие открытые модели (Mini-o3-7B), безнадежно отстают с показателем 11,3%. В метриках физического расстояния разрыв с топами ощутим сильнее. 52,8% предсказаний GeoVista попали в радиус 3 километров от реальной точки, при этом медианное отклонение составило 2,35 километра. Для сравнения, Gemini 2.5 Pro укладывается в 3-километровую зону в 64,45% случаев с медианным отклонением всего в 800 метров. Даже GPT-5, проигравший в общей точности, показал медиану в 1,86 км. Помимо модели, команда опубликовала и сам датасет GeoBench: 1142 изображения из 66 стран и 108 городов. В выборку вошли 512 обычных фотографий, 512 панорам и 108 спутниковых снимков. Главное отличие этого набора от аналогов вроде OpenStreetView-5M - жесткая фильтрация. Разработчики намеренно удалили "нелокализуемые" изображения: крупные планы еды или типичные пейзажи без примет и слишком очевидные достопримечательности, чтобы исключить легкие победы для алгоритмов. 📌Лицензирование: Apache 2.0 License. 🟡Страница проекта 🟡Набор моделей 🟡Arxiv 🟡Датасет 🖥Github @ai_machinelearning_big_data #AI #ML #LLM #GeoVista #Tencent

297 672

🚀 QWEN представили SAPO - Soft Adaptive Policy Optimization. Новый метод обучения LLM, делающий RL-тюнинг более стабильным и масштабируемым. Зачем он нужен? 🔹 Жёсткое ограничение градиентов часто ломает обучение, то они исчезают, то взрываются . 🔹 В MoE-моделях эта нестабильность усиливается ещё больше Что делает SAPO: ✓ вместо резких границ - плавный «температурный» контроллер ✓ более мягкая зона доверия - без внезапного обнуления градиентов ✓ согласованное поведение на уровне последовательности ✓ адаптация на уровне токенов - сохраняет полезные сигналы и ускоряет обучение ✓ асимметричные температуры - сильный выигрыш по стабильности, особенно для MoE Что это даёт: 📌 длинные стабильные RL-тренировки 📌 выше точность (Pass@1) 📌 заметный прирост в задачах математики, кода и мультимодальности (например, на Qwen3-VL) SAPO - шаг к более надёжному и предсказуемому RL-тюнингу больших моделей. 📄 Paper: https://arxiv.org/abs/2511.20347 📚 Blog: https://qwen.ai/blog?id=sapo @ai_machinelearning_big_data #qwen #llm

297 672

🤖 Boston Dynamics показала работа Atlas, работающего на ИИ-мозге класса “Large Behavior Model”. Робот выполняет полноценные складские задачи - например, укладывает коробки. Один модуль управляет всем: ходьбой, приседанием, подъёмом, балансом. Навыки не программировали вручную- Atlas научился им по демонстрациям человека. Это шаг от «заранее прописанных движений» к автономному поведению: единая модель, способная учиться и выполнять сложные моторные задачи. @ai_machinelearning_big_data #ai #robots #BostonDynamics