ch
Feedback
Machinelearning

Machinelearning

前往频道在 Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

显示更多

📈 Telegram 频道 Machinelearning 的分析概览

频道 Machinelearning (@ai_machinelearning_big_data) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 297 383 名订阅者,在 技术与应用 类别中位列第 324,并在 俄罗斯 地区排名第 1 261

📊 受众指标与增长动态

невідомо 创建以来,项目保持高速增长,吸引了 297 383 名订阅者。

根据 14 六月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 -6 744,过去 24 小时变化为 -170,整体触达仍然可观。

  • 认证状态: 未认证
  • 互动率 (ER): 平均受众互动率为 8.03%。内容发布后 24 小时内通常能获得 5.69% 的反应,占订阅者总量。
  • 帖子覆盖: 每篇帖子平均可获得 23 912 次浏览,首日通常累积 16 939 次浏览。
  • 互动与反馈: 受众积极参与,单帖平均反应数为 186
  • 主题关注点: 内容集中在 openai, claude, api, gemini, контекст 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台:
Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

凭借高频更新(最新数据采集于 15 六月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。

297 383
订阅者
-17024 小时
-1 4767
-6 74430
帖子存档
🚨 Очень интересная идея в новой работе Google DeepMind - как справиться с ростом ИИ-агентов, которые начинают действовать ка
🚨 Очень интересная идея в новой работе Google DeepMind - как справиться с ростом ИИ-агентов, которые начинают действовать как самостоятельные игроки в экономике. Если оставить процесс без контроля, такие агенты могут создать собственную экономику, напрямую связанную с человеческой. Это сулит и выгоды, и риски. Авторы предлагают концепцию «песочницы» (sandbox economy) - контролируемого пространства, где агенты могут торговать и координироваться, не нанося вреда человеческим рынкам. Вместо выполнения одной задачи, такие агенты могут: ▪ торговать, вести переговоры и строить ценность без участия человека, ▪ переключаться между индустриями, формировать временные альянсы, ▪ координировать ресурсы в реальном времени. Первые стандарты вроде Agent2Agent и Model Context Protocol уже соединяют агентов между собой, закладывая основу глобальной экономики «машина-машина». Персональные AI-ассистенты вскоре смогут конкурировать и сотрудничать на этих рынках: торговаться за вычисления, доступ к данным или бронирование поездок - всё в интересах пользователей. Расчёты будут обеспечиваться цифровыми валютами и системами кредитов. 🟢Экономисты предупреждают: такие рынки будут развиваться быстрее человеческой реакции. Цены, сделки и бизнес-модели могут меняться не за месяцы, а за минуты. 🟢Предложения авторов - Использовать рынки и аукционы для честного распределения ресурсов. ▪Вводить миссионные цели — коллективные задачи, согласованные обществом. ▪Создавать систему удостоверений и репутации для агентов. ▪Применять смарт-контракты, аудит и прозрачные вычисления для доверия и контроля. ▪Разрабатывать гибридное регулирование - сочетание технических протоколов и институциональных мер. Если внедрение будет продумано, триллионы машинных часов можно будет направить на решение глобальных задач - от лечения болезней до строительства инфраструктуры. 💰 Но одно ясно уже сейчас: мы стоим на пороге крупнейшего события создания богатства в истории. ⚡️ Статья: https://arxiv.org/pdf/2509.10147 @ai_machinelearning_big_data #AI #AgentEconomy #DeepMind #AutonomousAgents

✔️ OpenAI выпустила Codex-CLI 0.36 с новым GPT-5-Codex Теперь система динамически выбирает время «размышлений»: на простые запросы отвечает почти мгновенно, а на сложных проектах может работать часами — вплоть до 7 часов подряд, выполняя рефакторинг, исправляя ошибки и доводя решение до финала. Одним из главных нововведений стала функция codex resume, позволяющая возобновлять старые сессии. Также обновили интерфейс: появилось анимированное онбординг-руководство, улучшены отображение статусов и обработка прерываний. Важным изменением стала и новая система авторизации с более надёжной работой API-ключей и кастомных провайдеров. По производительности GPT-5-Codex показывает заметный скачок. На бенчмарке SWE-bench модель набирает 74,5%, обгоняя GPT-5 high. На внутренних тестах по рефакторингу результат вырос с 34% до 51%, что говорит о серьёзном улучшении качества работы с большими кодовыми базами. OpenAi ✔️ Релиз TimesFM 2.5 от Google Google Research представила TimesFM 2.5 — обновлённую версию Time Series Foundation Model для прогнозирования временных рядов. В версии 2.5 разработчики улучшили точность по сравнению с 2.0 и значительно расширили максимальную длину контекста, что позволяет обрабатывать более сложные и длинные временные зависимости. Особое достижение — первое место в рейтинге GiFT-Eval: TimesFM 2.5 заняла лидирующую позицию сразу по всем метрикам среди zero-shot foundation-моделей, подтвердив статус одной из самых точных систем для анализа временных рядов. Github ✔️ OpenAI и Anthropic: инструменты используются по-разному и приносят разные результаты Согласно новому анализу от TipRanks, компании OpenAI и Anthropic показали, что их ИИ-инструменты применяются в существенно разных контекстах — и дают разные эффекты. OpenAI в основном используется для создания контента, разработки кода и поддержки творческих задач, где гибкость и масштабируемость — ключевые аргументы. Его модели помогают пользователям генерировать текст, автоматизировать рабочие процессы и решать задачи, требующие воображения и нестандартного подхода. Anthropic, напротив, чаще применяют в областях, где особенно важны точность, контроль бессознательных смещений и высокая надёжность — например, в юридических, медицинских или регулируемых средах. В таких сценариях делают упор на безопасность, на минимизацию ошибок и на возможность аудита и объяснений того, как пришёл к решению ИИ. Отчёт подчёркивает: разные компании и пользователи выбирают OpenAI или Anthropic не просто на основе производительности, но и в зависимости от ценностей — что важнее: скорость и творческий потенциал или строгие гарантии и прозрачность. Эксперты TipRanks полагают, что оба подхода — сильны в своих нишах. Поскольку спрос на ИИ-решения растёт, смешанные и гибридные модели применений, вероятно, станут всё более популярными: когда часть задач решается с помощью гибкого и креативного ИИ, а часть — с помощью инструментов повышенной эмпатии и осторожности. Отчет ✔️ Reve выпустили свой нейрофотошоп Reve представили AI-редактор изображений, который уже окрестили «текстовым фотошопом». В отличие от конкурентов, здесь почти нет цензуры, а ограничения на генерацию трудно заметить. Функция Image creator & remixer позволяет создавать и перерабатывать изображения на основе текстовых подсказок. Интерактивный drag-and-drop редактор даёт возможность перемещать, масштабировать и изменять объекты прямо мышкой — так, как в привычных графических редакторах. Вместо стандартного поля для ввода появился чат-ассистент, превращающий взаимодействие в диалог, что облегчает настройку и доработку картинок. Reve ✔️ Alphabet впервые достигла рыночной капитализации в $3 трлн Компании Alphabet, материнской структуры Google, впервые удалось преодолеть отметку в $3 трлн стоимости на бирже. Акции выросли на 4 % на фоне судебного решения по антимонопольному делу, по которому не потребовалось разделение бизнеса (Chrome и Android). Сильный рост показали облачная служба и заинтересованность инвесторов в AI-продуктах, особенно модели Gemini. Новость @ai_machinelearning_big_data #news #ai #ml

🚀 Совет, который спас OpenAI: “Всегда делай API” В первые годы OpenAI балансировала на грани: фундаментальные модели становились всё дороже, а продукта, который мог бы оплачивать эти расходы, так и не появлялось. GPT-3 выглядел впечатляюще, но в реальности был слишком «сырой», чтобы построить вокруг него работающий сервис. Сэм Альтман вспоминает: «Я поднимал градус срочности - нам нужен был продукт, а идей не было». И тогда в памяти всплыл совет Пола Грэма, основателя Y Combinator: 👉 «Всегда делай API. Что бы ни происходило - сделай API. Хорошие вещи придут сами». OpenAI без особых ожиданий открыла доступ к GPT-3 через API. «Может, кто-то найдёт применение», - подумали в компании. И действительно: первыми успехами стали сервисы для копирайтинга - Jasper, Copy.ai. Но самое любопытное оказалось в другом: часть пользователей начинала просто разговаривать с моделью часами напролёт. Это не было мейнстримом, но сигнал оказался настолько сильным, что команда поняла — вот он, настоящий продукт. 📅 30 ноября 2022 года OpenAI запустила ChatGPT как «исследовательский превью» на базе GPT-3.5. Всего за 5 дней им воспользовались более миллиона человек. 🔥 Из скучного API родился продукт, который изменил представление об искусственном интеллекте. И всё началось с одного простого совета. @ai_machinelearning_big_data #OpenAI #СэмАльтман #ChatGPT #стартапы

🚀 AI Journey Contest 2025 СТАРТОВАЛ! Регистрация открыта! До 30 октября включительно проходит международное онлайн-соревнова
🚀 AI Journey Contest 2025 СТАРТОВАЛ! Регистрация открыта!   До 30 октября включительно проходит международное онлайн-соревнование по ИИ AI Journey Contest 2025 с призовым фондом 6,5 млн рублей. ✨ Присоединяйся к сообществу лучших разработчиков со всего мира.   Выбери один или несколько треков: 🤖 Agent-as-Judge: Создай универсального «судью» для оценки текстов, сгенерированных ИИ. 🧠 Human-centered AI Assistant: Разработай персонализированного ассистента на основе GigaChat. Бонус: Участникам предоставляются токены для API + возможность получить дополнительно 1 млн токенов! 💾 GigaMemory: Придумай механизм долговременной памяти для LLM.   Регистрируйся по ссылке и приступай к созданию решений. Твой шанс выиграть денежный приз и заявить о себе на AI Journey - главной международной конференции по ИИ в России!

⚡️ Александр Мордвинцев, исследователь из Google, создал цифровые системы на основе клеточных автоматов, где каждая клетка вз
+3
⚡️ Александр Мордвинцев, исследователь из Google, создал цифровые системы на основе клеточных автоматов, где каждая клетка взаимодействует только со своими соседями. Эти нейронные клеточные автоматы (Neural Cellular Automata) способны самособираться в заданные формы и даже восстанавливаться после повреждений. В *Quanta Magazine* рассказали о том, как учёные научились обучать искусственные "клетки" собираться в заданные формы. Это похоже на игру «Жизнь» (*Game of Life*), но наоборот. 🧩 Что такое Game of Life? Это простая компьютерная модель: есть сетка из клеток, у каждой клетки всего два состояния — «жива» или «мертва». Жизнь клетки зависит от соседей (например, если вокруг слишком много соседей, клетка умирает). Обычно мы задаём правила и просто смотрим, что получится. А теперь учёные сделали наоборот: сначала задаём цель (например, фигуру), а потом подбираем правила так, чтобы клетки сами в неё собрались. ⚙️ Что изменили учёные? 1. Непрерывные состояния - клетка не просто «вкл/выкл», а может быть наполовину активна. Это как лампочка с плавным регулятором яркости. 2. Скрытые переменные - у каждой клетки есть «внутренние параметры», которые влияют на её поведение. Представь, что у клетки есть «настроение» или «память», которое не видно исследователю напрямую. 3. Асинхронное обновление — клетки меняются в случайное время, а не все сразу. Это ближе к реальной жизни, где всё развивается не идеально синхронно. 💡 Зачем это нужно? - Восстановление после повреждений: если часть фигуры «сломать», клетки могут достроить её заново. - Децентрализация: нет главного управляющего - каждая клетка действует локально, но вместе они формируют систему. - Устойчивость к шуму: клетки учатся справляться с хаосом и случайностями, а не просто повторяют выученный рисунок. 🟠Какие есть ограничения? - Пока это работает для картинок и форм, но не для сложных живых организмов. - Чтобы система умела «регенерировать», её нужно специально тренировать. - Перенести эту идею в настоящие биологические клетки или роботов сложно — там много физических ограничений. 🟠 Где это можно применить? - Медицина - модели самовосстановления тканей. - Робототехника - рой роботов, которые без команды сверху сами собираются в нужную конструкцию. - Материалы будущего — «умные» кирпичики или детали, которые сами подстраиваются под окружение. - Новые вычислительные системы - компьютеры без центрального процессора, где решения рождаются распределённо. Учёные показали, что нейронные клеточные автоматы можно рассматривать как модель эволюции: геном не задаёт форму напрямую, а запускает процесс её построения, что делает системы гибкими и адаптивными. Главное отличие от природы в том, что эволюция не имеет цели, а автоматы обучают под задачу. Эти модели предлагают новый тип вычислений: каждая клетка взаимодействует только с соседями, что делает архитектуру распределённой и потенциально энергоэффективной. Уже есть впечатляющие результаты — от распознавания цифр и умножения матриц до решения задач вроде IQ-тестов и управления роями роботов, которые начинают вести себя как единый организм. В итоге работы Мордвинцева соединяют биологию, компьютеры и робототехнику, возвращая к идее, что жизнь и вычисления — две стороны одного процесса. 🟢 Полная статья: https://www.quantamagazine.org/self-assembly-gets-automated-in-reverse-of-game-of-life-20250910/ @ai_machinelearning_big_data #evolution #machinelearning #neuralnetworks #biology

🤖 Robbyant R1 — конкурент Tesla Optimus из Китая Ant Group показала своего первого гуманоида - R1. Это двуручный робот на колёсах, созданный для реальной работы: от готовки до экскурсовода. ⚙️ Характеристики: - вес — 110 кг - рост — 1.6–1.75 м - скорость — до 1.5 м/с - 34 степени свободы 🛠 Особенность подхода Ant не просто продаёт робота, а сразу упаковывает его в готовые сценарии для применения: «железо + софт + инструменты + сервисные команды». Это снижает сложности внедрения и обслуживания. Разрабы показали демку, как R1 готовит еду и водит экскурсии. Первые внедрения — например, в историческом музее. 🧠 За интеллект отвечает Bailing LLM - 300B mixture-of-experts модель, которая планирует действия для физического тела работа. Обучение идёт в симуляции, а затем переносится в реальный мир. Главная проблема таких роботов остаётся прежней: надёжный и безопасный embodied AI, который сможет справляться с хаотичными ситуациями - от грязной кухни до неожиданных взаимодействий с людьми. Ant Group вошла в гонку за роботов нового поколения, где уже играют Unitree и Tesla. @ai_machinelearning_big_data #ml #ai #robots

Топ навыков ML-инженера на примере реальной бизнес-задачи Предсказать отток клиентов — одна из самых распространенных и актуа
Топ навыков ML-инженера на примере реальной бизнес-задачи Предсказать отток клиентов — одна из самых распространенных и актуальных задач для любого бизнеса. На примере этой задачи можно рассмотреть все этапы работы ML-инженера: данные, признаки, модель, метрики и выводы для бизнеса. Чтобы увидеть полный цикл решения реальной задачи и понять, какие навыки нужны ML-инженеру в работе, приходите 16 сентября на практико-ориентированный вебинар от Кристины Желтовой — директора по разработке моделей в Газпромбанке. В ходе вебинара мы на примере задачи предсказания оттока клиентов разберём:
🟠Актуальность предсказания оттока клиентов для бизнеса 🟠Как работать с «сырыми» данными и подготовить их для обучения модели 🟠Как выбрать, построить и обучить базовую модель в Google Colab 🟠Как проверить, качество работы модели: разбор метрик и ошибок 🟠Какие ключевые навыки складываются в профессию ML-инженера.
🕗 Встречаемся 16 сентября в 19:00 МСК Обязательно ждем вас в лайве — вы сможете напрямую задать свои вопросы Кристине Желтовой и забрать с собой пример файла в Google Colab, с которым сможете продолжить погружаться в задачу после вебинара! 😶Зарегистрироваться на бесплатный вебинар

✂️ xAI уволила 500 универсальных аннотаторов данных и сделала ставку узких на специалистов. Компания планирует увеличить числ
✂️ xAI уволила 500 универсальных аннотаторов данных и сделала ставку узких на специалистов. Компания планирует увеличить число AI-туторов в 10 раз и называет это стратегическим разворотом. Раньше универсальные аннотаторы размечали сырые данные, чистили корпуса и ранжировали ответы для обучения Grok. Теперь эту работу всё больше берёт на себя автоматизация. Фокус смещается на экспертов в STEM, финансах, медицине и безопасности. Они проектируют задачи для ии, оценивают ответы и тестируют поведение модели. Это дороже, но повышает экспертность ИИ. В итоге Grok должен получить прирост в математике, коде, финансах и медецине, но может потерять качество в повседневных темах, где раньше помогали универсальные аннотаторы. Вместо дешёвой массовой разметки от универсальных аннотаторов компания делает ставку на дорогих, но компетентных специалистов 🟠Источник: Business Insider businessinsider.com/elon-musk-xai-layoffs-data-annotators-2025-9 🟠Вакансия в Х: https://x.com/i/jobs/1845336351098667008 @ai_machinelearning_big_data #xAI #Grok #AI #DataAnnotation #AITutors #ElonMusk

+2
🧠 mem-agent — агент с памятью в стиле Obsidian Лёгкая LLM-модель, которая умеет хранить знания в человеко-читаемой памяти (Markdown-файлы) и использовать их для ответов. Агент не просто отвечает на запросы, а действительно «помнит» факты и обновляет их по ходу работы. Это агент на 4B с локальной, совместимой памятью для Claude, ChatGPT и LM Studio. Как работает память: - Вся информация лежит в Markdown: memory/user.md и отдельные файлы для сущностей. - Связи между файлами сделаны как в Obsidian: [[entity]]. - Агент может извлекать факты, обновлять их или задавать уточняющие вопросы, если запрос неполный. Вместо огромных контекстов и упора в лимиты, Mem-Agent извлекает нужные фрагменты из локальных документов, сжимает их и передаёт агенту. Как обучали: - Базовая модель: Qwen3-4B-Thinking-2507. - Использовали метод онлайн-RL (GSPO). - Тестировали на md-memory-bench. Результаты: - mem-agent уверенно решает задачи памяти, близко к уровню больших моделей. - Даже в сжатых версиях (4-bit и 8-bit) сохраняет почти то же качество. Чем хорош: - Память можно читать и редактировать вручную. - Агент работает быстро и эффективно, даже в маленьком размере. - Удобен как компонент в более крупных системах (например, через MCP). 🟠Model: https://huggingface.co/driaforall/mem-agent 🟠Blog: https://huggingface.co/blog/driaforall/mem-agent 🟠Repo: https://github.com/firstbatchxyz/mem-agent-mcp @ai_machinelearning_big_data #LLM #AI #Agents #MemAgent #Dria #MCP #LocalAI

Не все баги чинятся Ctrl+Z! 😅 Но если рядом — правильная команда, а на экране — продуманный до мелочей код, который решит любые таски, то всё реально. Сбер поможет и с классными коллегами, и с интересными задачами — здесь все открытые вакансии. А здесь поздравление от Сбера: team.congratulate("С Днём программиста! 💚”)

🖥 Nvidia меняет стратегию и уходит от универсальных GPU. Теперь каждый чип будет заточен под конкретный этап LLM-инференса.
🖥 Nvidia меняет стратегию и уходит от универсальных GPU. Теперь каждый чип будет заточен под конкретный этап LLM-инференса. Инференс делится на два шага: - Prefill - первая стадия. Требует огромной вычислительной мощности, но почти не использует память. - Decode - вторая стадия. Наоборот, сильно нагружает память, но вычислений нужно меньше. Раньше, например, R200 объединял в одном GPU и мощные вычислительные блоки, и много памяти. В итоге это было дорого и неэффективно: - при Prefill простаивает память, - при Decode — простаивают вычислительные блоки. 🟢Новый подход Nvidia — разные GPU под разные задачи: - Rubin CPX - оптимизирован для Prefill • 20 PFLOPS вычислений • 128 GB GDDR7 • 2 TB/s пропускная способность - R200 — GPU под Decode • 288 GB HBM4 • 20.5 TB/s памяти 📆 Планы компании: - **2024–2025**-— линейка Blackwell (B200, GB300): рост вычислений и памяти. - 2026–2027 - Rubin разделится: • VR200 — для Decode (максимум HBM). • CPX — для Prefill (много вычислений, дешёвая память). - 2027 — VR300 Ultra: 66.7 PFLOPS и 1024 GB HBM4E. Nvidia перестраивает линейку так, чтобы каждый GPU работал максимально эффективно именно под свой этап инференса. #Nvidia #GPU #AI #Blackwell #Rubin #LLM

📕 Свежий гайд от Anthropic: Writing effective tools for agents — with agents Anthropic описывает, как правильно создавать ин
+6
📕 Свежий гайд от Anthropic: Writing effective tools for agents — with agents Anthropic описывает, как правильно создавать инструменты (tools) для AI-агентов: так, чтобы они были максимально полезными, эффективными и надёжными. Особый акцент сделан на том, как использовать самих агентов для прототипирования, тестирования и оптимизации инструментов. Как писать эффективные инструменты для агентов - Делай быстрые прототипы и сразу проверяй, как агент с ними работает. - Тестируй на реальных сценариях, а не на абстрактных примерах. - Анализируй логи и поведение агента, чтобы находить ошибки и непонятные места. - Избегай дублирования: один инструмент должен выполнять одну чёткую задачу. - Используй понятные имена и структуры (`machinelearning_create_task`, `mla_list_users`). - Возвращай только нужные данные, не перегружай ответ лишним. Добавляй фильтрацию и пагинацию. - Пиши описания так, чтобы их понял даже человек, который не в теме: чётко, без двусмысленностей, с примерами входа и выхода. Что это дает: - Улучшает способность AI-агентов решать реальные задачи. - Минимизирует ошибки: неверное использование инструментов, лишние токены, избыточные вызовы. - Повышает надёжность и предсказуемость поведения агентов. - Упрощает масштабирование — добавление новых инструментов и задач. 🟠 Полный гайд: https://www.anthropic.com/engineering/writing-tools-for-agents @ai_machinelearning_big_data #Anthropic #claude #aiagents #ai

⚡️В Москве прошла Big Tech Night — квартирник для разработчиков, инженеров и исследователей. Сбер стал ключевым партнёром и о
+2
⚡️В Москве прошла Big Tech Night — квартирник для разработчиков, инженеров и исследователей. Сбер стал ключевым партнёром и одним из самых активных участников. Хард-трек открыл Андрей Белевцев, старший вице-президент, руководитель блока «Технологическое развитие» Сбера. Он рассказал про последние тренды в генеративном искусственном интеллекте, Top of Mind-решения для бизнеса на основе GigaChat и AI-инструменты для разработчиков. А после — самое главное: живое общение! 🤝 До самого вечера гости нетворкили, спорили об AI-агентах и архитектуре интеллектуальных систем. Говорили по душам — о профессии, культуре и о том, о чём обычно молчат в презентациях.

🖥 HunyuanImage 2.1 теперь доступна в квантизованной версии! Это text-image модель, которая может генерировать изображения в
+1
🖥 HunyuanImage 2.1 теперь доступна в квантизованной версии! Это text-image модель, которая может генерировать изображения в 2K. Теперь модель можно запускать локально. Для необходимо минимум 24GB VRAM. 🟢Hugging Face: https://huggingface.co/tencent/HunyuanImage-2.1) 🟢Подробнее про модель: https://t.me/machinelearning_interview/2161 @ai_machinelearning_big_data #AI #HunyuanImage #StableDiffusion #ImageGeneration

⚡ Speculative Cascades — как ускорить работу LLM Google Research придумали новый способ сделать большие языковые модели быстр
+4
Speculative Cascades — как ускорить работу LLM Google Research придумали новый способ сделать большие языковые модели быстрее и дешевле. Что это такое: 🔹 Каскады Сначала отвечает маленькая модель. Если задача слишком сложная - подключается большая. Так экономятся ресурсы, но качество может прыгать. 🔹 Спекулятивная декодировка Маленькая модель угадывает сразу несколько слов вперёд. Большая быстро проверяет данные и подтверждает. Скорость выше, но большая модель всё равно тратит много ресурсов. 🟢 Speculative Cascades Это комбинация: маленькая модель иногда отвечает полностью сама, а иногда используется как ускоритель для большой. В итоге получаем меньше затрат, больше скорости и то же качество. 🔥Что показали тесты (тестили на Gemma, T5): - быстрее, чем обычная спекулятивная декодировка - дешевле и качественнее, чем каскады - удобнее настраивать баланс «скорость ↔ качество» При том же уровне качества, что и у спекулятивной декодировки, новый метод работает быстрее (генерирует больше токенов за один вызов большой модели). А в задачах математических рассуждений получен явный апгрейд по скорости при сохранении или даже улучшении качества. LLM всё чаще используются в поиске, чатах, ассистентах. Чтобы они реально были полезными, их нужно ускорять и удешевлять. *Speculative cascades* помогают это сделать без потери качества. 🔗 Подробнее: https://research.google/blog/speculative-cascades-a-hybrid-approach-for-smarter-faster-llm-inference/ @ai_machinelearning_big_data #AI #LLM #Inference #SpeculativeDecoding #Cascades #GoogleResearch

⚛️🔬🚀 PsiQuantum привлекла рекордные $1 млрд для строительства квантового компьютера с 1 млн кубитов к 2028 году — это крупн
⚛️🔬🚀 PsiQuantum привлекла рекордные $1 млрд для строительства квантового компьютера с 1 млн кубитов к 2028 году — это крупнейший раунд финансирования в истории квантовых технологий. 📈 Теперь компания оценена в $7 млрд и напрямую конкурирует с Google и IBM в гонке за создание полнофункциональной машины. 💰 Среди инвесторов: BlackRock, Temasek, Baillie Gifford и венчурное подразделение Nvidia. Квантовые компьютеры рассматриваются как ключ к созданию новых материалов и разработке лекарств, с чем классические методы справиться не могут. Но реальная польза от них появится только тогда, когда кубиты будут достаточно стабильны, а коррекция ошибок станет рабочим стандартом. PsiQuantum делает ставку на фотонные кубиты — частицы света, которые можно производить на обычных полупроводниковых фабриках и использовать с меньшим количеством криогенного оборудования. Именно эта ставка может позволить компании обойти конкурентов. ⚠️ Вызовы - Полной коррекции ошибок пока нет - Ранее цель на 2024 год по готовой системе была сорвана - 1 млн физических кубитов нужен, чтобы получить лишь несколько надёжных логических кубитов для долгих программ 🌍 Контекст - Конкуренты активно растут: Quantinuum собрал $600M (оценка $10B), IQM — $300M - IonQ, Rigetti и D-Wave взлетели в капитализации до $22B (с <$5B в ноябре) - Nvidia участвует в проекте, несмотря на осторожные прогнозы (20 лет до работающих систем), делая ставку на гибридный путь: квантовые + GPU суперкомпьютеры 🏗️ Первую полную квантовую установку PsiQuantum планирует построить в Австралии при поддержке правительства (A$940M), а вторую — в Чикаго. 🔗 Подробнее: https://ft.com/content/0a16281f-6bb4-4e60-a6f0-3a9d6f8d764a #quantum #ai #nvidia #google #ibm #hardware #future

🦾 Регистрируемся на олимпиаду по ИИ и анализу данных — AIDAO. Главный приз — миллион рублей! ФКН НИУ ВШЭ и Яндекс Образовани
🦾 Регистрируемся на олимпиаду по ИИ и анализу данных — AIDAO. Главный приз — миллион рублей! ФКН НИУ ВШЭ и Яндекс Образования начинают отбор на международную олимпиаду. 🔹 Участвовать могут команды из российских и иностранных студентов. 🔹 Главный приз: 1 000 000 рублей и преимущества при поступлении в магистратуры ФКН ВШЭ. 🔹 Олимпиада пройдет в два этапа: онлайн-отбор и масштабный офлайн-финал в Москве. Там вас ждут 32 часа хакатона и живое общение с экспертами Яндекса и сотрудниками научных лабораторий ВШЭ. 🚀 Подробности и регистрация по ссылке #ai #ML #news

• معلومات تويتر 🐦🚨 ЕЩЁ ОДИН релиз от ByteDance появился на Hugging Face Hub Модель, ориентированная на создание видео, где главным элементом является человек, с контролем через разные модальности: текст, изображения, аудио. ✨ HuMo ✨ > на входи модель может принимать: текст + изображение, текст + аудио, текст + аудио > поддержка сохранения образа персонажа и синхронизации движений с аудио > модель основана на **Wan 2.1** и Whisper Large v3 https://huggingface.co/bytedance-research/HuMo @ai_machinelearning_big_data #AI #ByteDance #HuMo #VideoGeneration #Multimoda

🚀 Вечерний релиз: Qwen3-Next-80B-A3B - эффективная модель заточенная на работа работу с очень длинным контекстом! 🔹 80B пар
+1
🚀 Вечерний релиз: Qwen3-Next-80B-A3B - эффективная модель заточенная на работа работу с очень длинным контекстом! 🔹 80B параметров, но активируется только 3B на токен → тренировка и инференс до 10x дешевле и быстрее, чем у Qwen3-32B (особенно при 32K+ контексте). 🔹 Гибридная архитектура: Gated DeltaNet + Gated Attention → сочетает скорость и точность. 🔹 Ultra-sparse MoE: 512 экспертов, маршрутизируется 10 + 1 общий. 🔹 Multi-Token Prediction → ускоренное speculative decoding. 🔹 По производительности обходит Qwen3-32B и приближается к Qwen3-235B в рассуждениях и long-context задачах. 🟢Qwen3-Next-80B-A3B-Instruct показатели почти на уровне 235B flagship. 🟢 Qwen3-Next-80B-A3B-Thinking превосходит Gemini-2.5-Flash-Thinking. ▪ Попробовать: [chat.qwen.ai](https://chat.qwen.ai) ▪ Анонс: https://qwen.ai/blog?id=4074cca80393150c248e508aa62983f9cb7d27cd&from=research.latest-advancements-list ▪ HuggingFace: https://huggingface.co/collections/Qwen/qwen3-next-68c25fd6838e585db8eeea9d ▪ ModelScope: https://modelscope.cn/collections/Qwen3-Next-c314f23bd0264aKaggle: https://kaggle.com/models/qwen-lm/qwen3-next-80b Alibaba Cloud API: https://alibabacloud.com/help/en/model-studio/models#c5414da58bjgj @ai_machinelearning_big_data #AI #LLM #Qwen #DeepLearning #MoE #EfficientModels #LongContext #Reasonin

🔥 WFGY 2.0 — Semantic Reasoning Engine for LLMs (MIT) Это движок с открытым исходным кодом, цель которого — уменьшить галлюцинации и логические сбои в системах типа RAG / LLM, особенно когда: - источники OCR-текста плохо распознаются, - происходит «semantic drift» (когда ответ уходит от вопроса), - «ghost matches», когда извлечённый фрагмент кажется релевантным, но на самом деле нет. Обычно ошибки ловят уже в готовом сгенерированном тексте, из-за чего они часто повторяются. В Semantic Reasoning Engine всё наоборот: если система видит, что рассуждения «кривые» или сбились с курса, она останавливается, сбрасывается или ищет другой путь и отвечает только когда состояние стабильно. 🛡Авторы называют это semantic firewall - семантический «файрвол». Проверки встроены прямо в процесс мышления модели, а не поверх ответа с фильтрами или регексами. Это помогает избегать ошибок до того, как они попадут в вывод. 📌 Проект включает карту из 16 типичных ошибок LLM: - неверный поиск данных, - сбившаяся логика, - «провалы памяти», - путаница ролей агентов и другие. Для каждой есть простое текстовое исправление. Никаких SDK — достаточно вставить инструкции прямо в промпт. 🟢Как модель решает, правильные ли ответ генерируется: - ΔS (drift) - не уходит ли смысл слишком далеко от шага к шагу - λ (convergence) - сходится ли рассуждение к решению или крутится в цикле - Coverage — достаточно ли фактов и аргументов учтено Если все три условия выполнены, ответ считается «качественным». 🟢В тестах стабильность вывода выросла до 90–95% против обычных 70–85% у традиционных подходов. ▪ Github: https://github.com/onestardao/WFGY @ai_machinelearning_big_data #ai #llm #opensource #reasoning #hallucinations #promptengineering