Machinelearning

الذهاب إلى القناة على Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

إظهار المزيد

الشبكة:Machinelearning روسيا1 262 التكنولوجيات والتطبيقات326...

📈 نظرة تحليلية على قناة تيليجرام Machinelearning

تُعد قناة Machinelearning (@ai_machinelearning_big_data) في القطاع اللغوي الروسية لاعباً نشطاً. يضم المجتمع حالياً 297 311 مشتركاً، محتلاً المرتبة 326 في فئة التكنولوجيات والتطبيقات والمرتبة 1 262 في منطقة روسيا.

📊 مؤشرات الجمهور والحراك

منذ تأسيسه في невідомо، حقق المشروع نمواً سريعاً وجمع 297 311 مشتركاً.

بحسب آخر البيانات بتاريخ 15 يونيو, 2026، تحافظ القناة على نشاط مستقر. خلال آخر 30 يوماً تغيّر عدد الأعضاء بمقدار -6 639، وفي آخر 24 ساعة بمقدار -229، مع بقاء الوصول العام مرتفعاً.

حالة التحقق: غير موثّقة
معدل التفاعل (ER): يبلغ متوسط تفاعل الجمهور 8.06‎%. وخلال أول 24 ساعة من النشر يحصد المحتوى عادةً 5.69‎% من ردود الفعل نسبةً إلى إجمالي المشتركين.
وصول المنشورات: يحصل كل منشور على متوسط 23 972 مشاهدة. وخلال اليوم الأول يجمع عادةً 16 925 مشاهدة.
التفاعلات والاستجابة: يتفاعل الجمهور بانتظام؛ متوسط التفاعلات لكل منشور يبلغ 186.
الاهتمامات الموضوعية: يركز المحتوى على مواضيع رئيسية مثل openai, claude, api, gemini, контекст.

📝 الوصف وسياسة المحتوى

يصف المؤلف القناة بأنها مساحة للتعبير عن الآراء الذاتية:
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

بفضل وتيرة التحديث المرتفعة (أحدث البيانات بتاريخ 16 يونيو, 2026) تحافظ القناة على حداثتها ومستوى وصول مرتفع. وتُظهر التحليلات تفاعلاً نشطاً من الجمهور، ما يجعلها نقطة تأثير مهمة ضمن فئة التكنولوجيات والتطبيقات.

297 311

المشتركون

-22924 ساعات

-1 4417 أيام

-6 63930 أيام

23 972

عرض المشاهدات

~ 16 92524 ساعات

~ 18 98848 ساعات

8.06%

معدل المشاركة

~ 6

المشاركات في اليوم

Ads index

beta

أرشيف المشاركات

297 329

🚨 Очень интересная идея в новой работе Google DeepMind - как справиться с ростом ИИ-агентов, которые начинают действовать как самостоятельные игроки в экономике. Если оставить процесс без контроля, такие агенты могут создать собственную экономику, напрямую связанную с человеческой. Это сулит и выгоды, и риски. Авторы предлагают концепцию «песочницы» (sandbox economy) - контролируемого пространства, где агенты могут торговать и координироваться, не нанося вреда человеческим рынкам. Вместо выполнения одной задачи, такие агенты могут: ▪ торговать, вести переговоры и строить ценность без участия человека, ▪ переключаться между индустриями, формировать временные альянсы, ▪ координировать ресурсы в реальном времени. Первые стандарты вроде Agent2Agent и Model Context Protocol уже соединяют агентов между собой, закладывая основу глобальной экономики «машина-машина». Персональные AI-ассистенты вскоре смогут конкурировать и сотрудничать на этих рынках: торговаться за вычисления, доступ к данным или бронирование поездок - всё в интересах пользователей. Расчёты будут обеспечиваться цифровыми валютами и системами кредитов. 🟢Экономисты предупреждают: такие рынки будут развиваться быстрее человеческой реакции. Цены, сделки и бизнес-модели могут меняться не за месяцы, а за минуты. 🟢Предложения авторов - Использовать рынки и аукционы для честного распределения ресурсов. ▪Вводить миссионные цели — коллективные задачи, согласованные обществом. ▪Создавать систему удостоверений и репутации для агентов. ▪Применять смарт-контракты, аудит и прозрачные вычисления для доверия и контроля. ▪Разрабатывать гибридное регулирование - сочетание технических протоколов и институциональных мер. Если внедрение будет продумано, триллионы машинных часов можно будет направить на решение глобальных задач - от лечения болезней до строительства инфраструктуры. 💰 Но одно ясно уже сейчас: мы стоим на пороге крупнейшего события создания богатства в истории. ⚡️ Статья: https://arxiv.org/pdf/2509.10147 @ai_machinelearning_big_data #AI #AgentEconomy #DeepMind #AutonomousAgents

297 329

✔️ OpenAI выпустила Codex-CLI 0.36 с новым GPT-5-Codex Теперь система динамически выбирает время «размышлений»: на простые запросы отвечает почти мгновенно, а на сложных проектах может работать часами — вплоть до 7 часов подряд, выполняя рефакторинг, исправляя ошибки и доводя решение до финала. Одним из главных нововведений стала функция codex resume, позволяющая возобновлять старые сессии. Также обновили интерфейс: появилось анимированное онбординг-руководство, улучшены отображение статусов и обработка прерываний. Важным изменением стала и новая система авторизации с более надёжной работой API-ключей и кастомных провайдеров. По производительности GPT-5-Codex показывает заметный скачок. На бенчмарке SWE-bench модель набирает 74,5%, обгоняя GPT-5 high. На внутренних тестах по рефакторингу результат вырос с 34% до 51%, что говорит о серьёзном улучшении качества работы с большими кодовыми базами. OpenAi ✔️ Релиз TimesFM 2.5 от Google Google Research представила TimesFM 2.5 — обновлённую версию Time Series Foundation Model для прогнозирования временных рядов. В версии 2.5 разработчики улучшили точность по сравнению с 2.0 и значительно расширили максимальную длину контекста, что позволяет обрабатывать более сложные и длинные временные зависимости. Особое достижение — первое место в рейтинге GiFT-Eval: TimesFM 2.5 заняла лидирующую позицию сразу по всем метрикам среди zero-shot foundation-моделей, подтвердив статус одной из самых точных систем для анализа временных рядов. Github ✔️ OpenAI и Anthropic: инструменты используются по-разному и приносят разные результаты Согласно новому анализу от TipRanks, компании OpenAI и Anthropic показали, что их ИИ-инструменты применяются в существенно разных контекстах — и дают разные эффекты. OpenAI в основном используется для создания контента, разработки кода и поддержки творческих задач, где гибкость и масштабируемость — ключевые аргументы. Его модели помогают пользователям генерировать текст, автоматизировать рабочие процессы и решать задачи, требующие воображения и нестандартного подхода. Anthropic, напротив, чаще применяют в областях, где особенно важны точность, контроль бессознательных смещений и высокая надёжность — например, в юридических, медицинских или регулируемых средах. В таких сценариях делают упор на безопасность, на минимизацию ошибок и на возможность аудита и объяснений того, как пришёл к решению ИИ. Отчёт подчёркивает: разные компании и пользователи выбирают OpenAI или Anthropic не просто на основе производительности, но и в зависимости от ценностей — что важнее: скорость и творческий потенциал или строгие гарантии и прозрачность. Эксперты TipRanks полагают, что оба подхода — сильны в своих нишах. Поскольку спрос на ИИ-решения растёт, смешанные и гибридные модели применений, вероятно, станут всё более популярными: когда часть задач решается с помощью гибкого и креативного ИИ, а часть — с помощью инструментов повышенной эмпатии и осторожности. Отчет ✔️ Reve выпустили свой нейрофотошоп Reve представили AI-редактор изображений, который уже окрестили «текстовым фотошопом». В отличие от конкурентов, здесь почти нет цензуры, а ограничения на генерацию трудно заметить. Функция Image creator & remixer позволяет создавать и перерабатывать изображения на основе текстовых подсказок. Интерактивный drag-and-drop редактор даёт возможность перемещать, масштабировать и изменять объекты прямо мышкой — так, как в привычных графических редакторах. Вместо стандартного поля для ввода появился чат-ассистент, превращающий взаимодействие в диалог, что облегчает настройку и доработку картинок. Reve ✔️ Alphabet впервые достигла рыночной капитализации в $3 трлн Компании Alphabet, материнской структуры Google, впервые удалось преодолеть отметку в $3 трлн стоимости на бирже. Акции выросли на 4 % на фоне судебного решения по антимонопольному делу, по которому не потребовалось разделение бизнеса (Chrome и Android). Сильный рост показали облачная служба и заинтересованность инвесторов в AI-продуктах, особенно модели Gemini. Новость @ai_machinelearning_big_data #news #ai #ml

297 329

🚀 Совет, который спас OpenAI: “Всегда делай API” В первые годы OpenAI балансировала на грани: фундаментальные модели становились всё дороже, а продукта, который мог бы оплачивать эти расходы, так и не появлялось. GPT-3 выглядел впечатляюще, но в реальности был слишком «сырой», чтобы построить вокруг него работающий сервис. Сэм Альтман вспоминает: «Я поднимал градус срочности - нам нужен был продукт, а идей не было». И тогда в памяти всплыл совет Пола Грэма, основателя Y Combinator: 👉 «Всегда делай API. Что бы ни происходило - сделай API. Хорошие вещи придут сами». OpenAI без особых ожиданий открыла доступ к GPT-3 через API. «Может, кто-то найдёт применение», - подумали в компании. И действительно: первыми успехами стали сервисы для копирайтинга - Jasper, Copy.ai. Но самое любопытное оказалось в другом: часть пользователей начинала просто разговаривать с моделью часами напролёт. Это не было мейнстримом, но сигнал оказался настолько сильным, что команда поняла — вот он, настоящий продукт. 📅 30 ноября 2022 года OpenAI запустила ChatGPT как «исследовательский превью» на базе GPT-3.5. Всего за 5 дней им воспользовались более миллиона человек. 🔥 Из скучного API родился продукт, который изменил представление об искусственном интеллекте. И всё началось с одного простого совета. @ai_machinelearning_big_data #OpenAI #СэмАльтман #ChatGPT #стартапы

297 329

🚀 AI Journey Contest 2025 СТАРТОВАЛ! Регистрация открыта! До 30 октября включительно проходит международное онлайн-соревнование по ИИ AI Journey Contest 2025 с призовым фондом 6,5 млн рублей. ✨ Присоединяйся к сообществу лучших разработчиков со всего мира. Выбери один или несколько треков: 🤖 Agent-as-Judge: Создай универсального «судью» для оценки текстов, сгенерированных ИИ. 🧠 Human-centered AI Assistant: Разработай персонализированного ассистента на основе GigaChat. Бонус: Участникам предоставляются токены для API + возможность получить дополнительно 1 млн токенов! 💾 GigaMemory: Придумай механизм долговременной памяти для LLM. Регистрируйся по ссылке и приступай к созданию решений. Твой шанс выиграть денежный приз и заявить о себе на AI Journey - главной международной конференции по ИИ в России!

297 329

⚡️ Александр Мордвинцев, исследователь из Google, создал цифровые системы на основе клеточных автоматов, где каждая клетка взаимодействует только со своими соседями. Эти нейронные клеточные автоматы (Neural Cellular Automata) способны самособираться в заданные формы и даже восстанавливаться после повреждений. В *Quanta Magazine* рассказали о том, как учёные научились обучать искусственные "клетки" собираться в заданные формы. Это похоже на игру «Жизнь» (*Game of Life*), но наоборот. 🧩 Что такое Game of Life? Это простая компьютерная модель: есть сетка из клеток, у каждой клетки всего два состояния — «жива» или «мертва». Жизнь клетки зависит от соседей (например, если вокруг слишком много соседей, клетка умирает). Обычно мы задаём правила и просто смотрим, что получится. А теперь учёные сделали наоборот: сначала задаём цель (например, фигуру), а потом подбираем правила так, чтобы клетки сами в неё собрались. ⚙️ Что изменили учёные? 1. Непрерывные состояния - клетка не просто «вкл/выкл», а может быть наполовину активна. Это как лампочка с плавным регулятором яркости. 2. Скрытые переменные - у каждой клетки есть «внутренние параметры», которые влияют на её поведение. Представь, что у клетки есть «настроение» или «память», которое не видно исследователю напрямую. 3. Асинхронное обновление — клетки меняются в случайное время, а не все сразу. Это ближе к реальной жизни, где всё развивается не идеально синхронно. 💡 Зачем это нужно? - Восстановление после повреждений: если часть фигуры «сломать», клетки могут достроить её заново. - Децентрализация: нет главного управляющего - каждая клетка действует локально, но вместе они формируют систему. - Устойчивость к шуму: клетки учатся справляться с хаосом и случайностями, а не просто повторяют выученный рисунок. 🟠Какие есть ограничения? - Пока это работает для картинок и форм, но не для сложных живых организмов. - Чтобы система умела «регенерировать», её нужно специально тренировать. - Перенести эту идею в настоящие биологические клетки или роботов сложно — там много физических ограничений. 🟠 Где это можно применить? - Медицина - модели самовосстановления тканей. - Робототехника - рой роботов, которые без команды сверху сами собираются в нужную конструкцию. - Материалы будущего — «умные» кирпичики или детали, которые сами подстраиваются под окружение. - Новые вычислительные системы - компьютеры без центрального процессора, где решения рождаются распределённо. Учёные показали, что нейронные клеточные автоматы можно рассматривать как модель эволюции: геном не задаёт форму напрямую, а запускает процесс её построения, что делает системы гибкими и адаптивными. Главное отличие от природы в том, что эволюция не имеет цели, а автоматы обучают под задачу. Эти модели предлагают новый тип вычислений: каждая клетка взаимодействует только с соседями, что делает архитектуру распределённой и потенциально энергоэффективной. Уже есть впечатляющие результаты — от распознавания цифр и умножения матриц до решения задач вроде IQ-тестов и управления роями роботов, которые начинают вести себя как единый организм. В итоге работы Мордвинцева соединяют биологию, компьютеры и робототехнику, возвращая к идее, что жизнь и вычисления — две стороны одного процесса. 🟢 Полная статья: https://www.quantamagazine.org/self-assembly-gets-automated-in-reverse-of-game-of-life-20250910/ @ai_machinelearning_big_data #evolution #machinelearning #neuralnetworks #biology

297 329

🤖 Robbyant R1 — конкурент Tesla Optimus из Китая Ant Group показала своего первого гуманоида - R1. Это двуручный робот на колёсах, созданный для реальной работы: от готовки до экскурсовода. ⚙️ Характеристики: - вес — 110 кг - рост — 1.6–1.75 м - скорость — до 1.5 м/с - 34 степени свободы 🛠 Особенность подхода Ant не просто продаёт робота, а сразу упаковывает его в готовые сценарии для применения: «железо + софт + инструменты + сервисные команды». Это снижает сложности внедрения и обслуживания. Разрабы показали демку, как R1 готовит еду и водит экскурсии. Первые внедрения — например, в историческом музее. 🧠 За интеллект отвечает Bailing LLM - 300B mixture-of-experts модель, которая планирует действия для физического тела работа. Обучение идёт в симуляции, а затем переносится в реальный мир. Главная проблема таких роботов остаётся прежней: надёжный и безопасный embodied AI, который сможет справляться с хаотичными ситуациями - от грязной кухни до неожиданных взаимодействий с людьми. Ant Group вошла в гонку за роботов нового поколения, где уже играют Unitree и Tesla. @ai_machinelearning_big_data #ml #ai #robots

297 329

Топ навыков ML-инженера на примере реальной бизнес-задачи Предсказать отток клиентов — одна из самых распространенных и актуальных задач для любого бизнеса. На примере этой задачи можно рассмотреть все этапы работы ML-инженера: данные, признаки, модель, метрики и выводы для бизнеса. Чтобы увидеть полный цикл решения реальной задачи и понять, какие навыки нужны ML-инженеру в работе, приходите 16 сентября на практико-ориентированный вебинар от Кристины Желтовой — директора по разработке моделей в Газпромбанке. В ходе вебинара мы на примере задачи предсказания оттока клиентов разберём:

🟠Актуальность предсказания оттока клиентов для бизнеса 🟠Как работать с «сырыми» данными и подготовить их для обучения модели 🟠Как выбрать, построить и обучить базовую модель в Google Colab 🟠Как проверить, качество работы модели: разбор метрик и ошибок 🟠Какие ключевые навыки складываются в профессию ML-инженера.

🕗 Встречаемся 16 сентября в 19:00 МСК Обязательно ждем вас в лайве — вы сможете напрямую задать свои вопросы Кристине Желтовой и забрать с собой пример файла в Google Colab, с которым сможете продолжить погружаться в задачу после вебинара! 😶Зарегистрироваться на бесплатный вебинар

297 329

✂️ xAI уволила 500 универсальных аннотаторов данных и сделала ставку узких на специалистов. Компания планирует увеличить число AI-туторов в 10 раз и называет это стратегическим разворотом. Раньше универсальные аннотаторы размечали сырые данные, чистили корпуса и ранжировали ответы для обучения Grok. Теперь эту работу всё больше берёт на себя автоматизация. Фокус смещается на экспертов в STEM, финансах, медицине и безопасности. Они проектируют задачи для ии, оценивают ответы и тестируют поведение модели. Это дороже, но повышает экспертность ИИ. В итоге Grok должен получить прирост в математике, коде, финансах и медецине, но может потерять качество в повседневных темах, где раньше помогали универсальные аннотаторы. Вместо дешёвой массовой разметки от универсальных аннотаторов компания делает ставку на дорогих, но компетентных специалистов 🟠Источник: Business Insider businessinsider.com/elon-musk-xai-layoffs-data-annotators-2025-9 🟠Вакансия в Х: https://x.com/i/jobs/1845336351098667008 @ai_machinelearning_big_data #xAI #Grok #AI #DataAnnotation #AITutors #ElonMusk

297 329

🧠 mem-agent — агент с памятью в стиле Obsidian Лёгкая LLM-модель, которая умеет хранить знания в человеко-читаемой памяти (Markdown-файлы) и использовать их для ответов. Агент не просто отвечает на запросы, а действительно «помнит» факты и обновляет их по ходу работы. Это агент на 4B с локальной, совместимой памятью для Claude, ChatGPT и LM Studio. Как работает память: - Вся информация лежит в Markdown: memory/user.md и отдельные файлы для сущностей. - Связи между файлами сделаны как в Obsidian: [[entity]]. - Агент может извлекать факты, обновлять их или задавать уточняющие вопросы, если запрос неполный. Вместо огромных контекстов и упора в лимиты, Mem-Agent извлекает нужные фрагменты из локальных документов, сжимает их и передаёт агенту. Как обучали: - Базовая модель: Qwen3-4B-Thinking-2507. - Использовали метод онлайн-RL (GSPO). - Тестировали на md-memory-bench. Результаты: - mem-agent уверенно решает задачи памяти, близко к уровню больших моделей. - Даже в сжатых версиях (4-bit и 8-bit) сохраняет почти то же качество. Чем хорош: - Память можно читать и редактировать вручную. - Агент работает быстро и эффективно, даже в маленьком размере. - Удобен как компонент в более крупных системах (например, через MCP). 🟠Model: https://huggingface.co/driaforall/mem-agent 🟠Blog: https://huggingface.co/blog/driaforall/mem-agent 🟠Repo: https://github.com/firstbatchxyz/mem-agent-mcp @ai_machinelearning_big_data #LLM #AI #Agents #MemAgent #Dria #MCP #LocalAI

297 329

Не все баги чинятся Ctrl+Z! 😅 Но если рядом — правильная команда, а на экране — продуманный до мелочей код, который решит любые таски, то всё реально. Сбер поможет и с классными коллегами, и с интересными задачами — здесь все открытые вакансии. А здесь поздравление от Сбера: team.congratulate("С Днём программиста! 💚”)

297 329

🖥 Nvidia меняет стратегию и уходит от универсальных GPU. Теперь каждый чип будет заточен под конкретный этап LLM-инференса. Инференс делится на два шага: - Prefill - первая стадия. Требует огромной вычислительной мощности, но почти не использует память. - Decode - вторая стадия. Наоборот, сильно нагружает память, но вычислений нужно меньше. Раньше, например, R200 объединял в одном GPU и мощные вычислительные блоки, и много памяти. В итоге это было дорого и неэффективно: - при Prefill простаивает память, - при Decode — простаивают вычислительные блоки. 🟢Новый подход Nvidia — разные GPU под разные задачи: - Rubin CPX - оптимизирован для Prefill • 20 PFLOPS вычислений • 128 GB GDDR7 • 2 TB/s пропускная способность - R200 — GPU под Decode • 288 GB HBM4 • 20.5 TB/s памяти 📆 Планы компании: - **2024–2025**-— линейка Blackwell (B200, GB300): рост вычислений и памяти. - 2026–2027 - Rubin разделится: • VR200 — для Decode (максимум HBM). • CPX — для Prefill (много вычислений, дешёвая память). - 2027 — VR300 Ultra: 66.7 PFLOPS и 1024 GB HBM4E. Nvidia перестраивает линейку так, чтобы каждый GPU работал максимально эффективно именно под свой этап инференса. #Nvidia #GPU #AI #Blackwell #Rubin #LLM

297 329

📕 Свежий гайд от Anthropic: Writing effective tools for agents — with agents Anthropic описывает, как правильно создавать инструменты (tools) для AI-агентов: так, чтобы они были максимально полезными, эффективными и надёжными. Особый акцент сделан на том, как использовать самих агентов для прототипирования, тестирования и оптимизации инструментов. Как писать эффективные инструменты для агентов - Делай быстрые прототипы и сразу проверяй, как агент с ними работает. - Тестируй на реальных сценариях, а не на абстрактных примерах. - Анализируй логи и поведение агента, чтобы находить ошибки и непонятные места. - Избегай дублирования: один инструмент должен выполнять одну чёткую задачу. - Используй понятные имена и структуры (`machinelearning_create_task`, `mla_list_users`). - Возвращай только нужные данные, не перегружай ответ лишним. Добавляй фильтрацию и пагинацию. - Пиши описания так, чтобы их понял даже человек, который не в теме: чётко, без двусмысленностей, с примерами входа и выхода. Что это дает: - Улучшает способность AI-агентов решать реальные задачи. - Минимизирует ошибки: неверное использование инструментов, лишние токены, избыточные вызовы. - Повышает надёжность и предсказуемость поведения агентов. - Упрощает масштабирование — добавление новых инструментов и задач. 🟠 Полный гайд: https://www.anthropic.com/engineering/writing-tools-for-agents @ai_machinelearning_big_data #Anthropic #claude #aiagents #ai

297 329

⚡️В Москве прошла Big Tech Night — квартирник для разработчиков, инженеров и исследователей. Сбер стал ключевым партнёром и одним из самых активных участников. Хард-трек открыл Андрей Белевцев, старший вице-президент, руководитель блока «Технологическое развитие» Сбера. Он рассказал про последние тренды в генеративном искусственном интеллекте, Top of Mind-решения для бизнеса на основе GigaChat и AI-инструменты для разработчиков. А после — самое главное: живое общение! 🤝 До самого вечера гости нетворкили, спорили об AI-агентах и архитектуре интеллектуальных систем. Говорили по душам — о профессии, культуре и о том, о чём обычно молчат в презентациях.

297 329

🖥 HunyuanImage 2.1 теперь доступна в квантизованной версии! Это text-image модель, которая может генерировать изображения в 2K. Теперь модель можно запускать локально. Для необходимо минимум 24GB VRAM. 🟢Hugging Face: https://huggingface.co/tencent/HunyuanImage-2.1) 🟢Подробнее про модель: https://t.me/machinelearning_interview/2161 @ai_machinelearning_big_data #AI #HunyuanImage #StableDiffusion #ImageGeneration

297 329

⚡ Speculative Cascades — как ускорить работу LLM Google Research придумали новый способ сделать большие языковые модели быстрее и дешевле. Что это такое: 🔹 Каскады Сначала отвечает маленькая модель. Если задача слишком сложная - подключается большая. Так экономятся ресурсы, но качество может прыгать. 🔹 Спекулятивная декодировка Маленькая модель угадывает сразу несколько слов вперёд. Большая быстро проверяет данные и подтверждает. Скорость выше, но большая модель всё равно тратит много ресурсов. 🟢 Speculative Cascades Это комбинация: маленькая модель иногда отвечает полностью сама, а иногда используется как ускоритель для большой. В итоге получаем меньше затрат, больше скорости и то же качество. 🔥Что показали тесты (тестили на Gemma, T5): - быстрее, чем обычная спекулятивная декодировка - дешевле и качественнее, чем каскады - удобнее настраивать баланс «скорость ↔ качество» При том же уровне качества, что и у спекулятивной декодировки, новый метод работает быстрее (генерирует больше токенов за один вызов большой модели). А в задачах математических рассуждений получен явный апгрейд по скорости при сохранении или даже улучшении качества. LLM всё чаще используются в поиске, чатах, ассистентах. Чтобы они реально были полезными, их нужно ускорять и удешевлять. *Speculative cascades* помогают это сделать без потери качества. 🔗 Подробнее: https://research.google/blog/speculative-cascades-a-hybrid-approach-for-smarter-faster-llm-inference/ @ai_machinelearning_big_data #AI #LLM #Inference #SpeculativeDecoding #Cascades #GoogleResearch

297 329

Repost from Machine learning Interview

⚛️🔬🚀 PsiQuantum привлекла рекордные $1 млрд для строительства квантового компьютера с 1 млн кубитов к 2028 году — это крупнейший раунд финансирования в истории квантовых технологий. 📈 Теперь компания оценена в $7 млрд и напрямую конкурирует с Google и IBM в гонке за создание полнофункциональной машины. 💰 Среди инвесторов: BlackRock, Temasek, Baillie Gifford и венчурное подразделение Nvidia. Квантовые компьютеры рассматриваются как ключ к созданию новых материалов и разработке лекарств, с чем классические методы справиться не могут. Но реальная польза от них появится только тогда, когда кубиты будут достаточно стабильны, а коррекция ошибок станет рабочим стандартом. PsiQuantum делает ставку на фотонные кубиты — частицы света, которые можно производить на обычных полупроводниковых фабриках и использовать с меньшим количеством криогенного оборудования. Именно эта ставка может позволить компании обойти конкурентов. ⚠️ Вызовы - Полной коррекции ошибок пока нет - Ранее цель на 2024 год по готовой системе была сорвана - 1 млн физических кубитов нужен, чтобы получить лишь несколько надёжных логических кубитов для долгих программ 🌍 Контекст - Конкуренты активно растут: Quantinuum собрал $600M (оценка $10B), IQM — $300M - IonQ, Rigetti и D-Wave взлетели в капитализации до $22B (с <$5B в ноябре) - Nvidia участвует в проекте, несмотря на осторожные прогнозы (20 лет до работающих систем), делая ставку на гибридный путь: квантовые + GPU суперкомпьютеры 🏗️ Первую полную квантовую установку PsiQuantum планирует построить в Австралии при поддержке правительства (A$940M), а вторую — в Чикаго. 🔗 Подробнее: https://ft.com/content/0a16281f-6bb4-4e60-a6f0-3a9d6f8d764a #quantum #ai #nvidia #google #ibm #hardware #future

297 329

🦾 Регистрируемся на олимпиаду по ИИ и анализу данных — AIDAO. Главный приз — миллион рублей! ФКН НИУ ВШЭ и Яндекс Образования начинают отбор на международную олимпиаду. 🔹 Участвовать могут команды из российских и иностранных студентов. 🔹 Главный приз: 1 000 000 рублей и преимущества при поступлении в магистратуры ФКН ВШЭ. 🔹 Олимпиада пройдет в два этапа: онлайн-отбор и масштабный офлайн-финал в Москве. Там вас ждут 32 часа хакатона и живое общение с экспертами Яндекса и сотрудниками научных лабораторий ВШЭ. 🚀 Подробности и регистрация по ссылке #ai #ML #news

297 329

• معلومات تويتر 🐦🚨 ЕЩЁ ОДИН релиз от ByteDance появился на Hugging Face Hub Модель, ориентированная на создание видео, где главным элементом является человек, с контролем через разные модальности: текст, изображения, аудио. ✨ HuMo ✨ > на входи модель может принимать: текст + изображение, текст + аудио, текст + аудио > поддержка сохранения образа персонажа и синхронизации движений с аудио > модель основана на **Wan 2.1** и Whisper Large v3 https://huggingface.co/bytedance-research/HuMo @ai_machinelearning_big_data #AI #ByteDance #HuMo #VideoGeneration #Multimoda

297 329

🚀 Вечерний релиз: Qwen3-Next-80B-A3B - эффективная модель заточенная на работа работу с очень длинным контекстом! 🔹 80B параметров, но активируется только 3B на токен → тренировка и инференс до 10x дешевле и быстрее, чем у Qwen3-32B (особенно при 32K+ контексте). 🔹 Гибридная архитектура: Gated DeltaNet + Gated Attention → сочетает скорость и точность. 🔹 Ultra-sparse MoE: 512 экспертов, маршрутизируется 10 + 1 общий. 🔹 Multi-Token Prediction → ускоренное speculative decoding. 🔹 По производительности обходит Qwen3-32B и приближается к Qwen3-235B в рассуждениях и long-context задачах. 🟢Qwen3-Next-80B-A3B-Instruct показатели почти на уровне 235B flagship. 🟢 Qwen3-Next-80B-A3B-Thinking превосходит Gemini-2.5-Flash-Thinking. ▪ Попробовать: [chat.qwen.ai](https://chat.qwen.ai) ▪ Анонс: https://qwen.ai/blog?id=4074cca80393150c248e508aa62983f9cb7d27cd&from=research.latest-advancements-list ▪ HuggingFace: https://huggingface.co/collections/Qwen/qwen3-next-68c25fd6838e585db8eeea9d ▪ ModelScope: https://modelscope.cn/collections/Qwen3-Next-c314f23bd0264a ▪ Kaggle: https://kaggle.com/models/qwen-lm/qwen3-next-80b ▪ Alibaba Cloud API: https://alibabacloud.com/help/en/model-studio/models#c5414da58bjgj @ai_machinelearning_big_data #AI #LLM #Qwen #DeepLearning #MoE #EfficientModels #LongContext #Reasonin

297 329

🔥 WFGY 2.0 — Semantic Reasoning Engine for LLMs (MIT) Это движок с открытым исходным кодом, цель которого — уменьшить галлюцинации и логические сбои в системах типа RAG / LLM, особенно когда: - источники OCR-текста плохо распознаются, - происходит «semantic drift» (когда ответ уходит от вопроса), - «ghost matches», когда извлечённый фрагмент кажется релевантным, но на самом деле нет. Обычно ошибки ловят уже в готовом сгенерированном тексте, из-за чего они часто повторяются. В Semantic Reasoning Engine всё наоборот: если система видит, что рассуждения «кривые» или сбились с курса, она останавливается, сбрасывается или ищет другой путь и отвечает только когда состояние стабильно. 🛡Авторы называют это semantic firewall - семантический «файрвол». Проверки встроены прямо в процесс мышления модели, а не поверх ответа с фильтрами или регексами. Это помогает избегать ошибок до того, как они попадут в вывод. 📌 Проект включает карту из 16 типичных ошибок LLM: - неверный поиск данных, - сбившаяся логика, - «провалы памяти», - путаница ролей агентов и другие. Для каждой есть простое текстовое исправление. Никаких SDK — достаточно вставить инструкции прямо в промпт. 🟢Как модель решает, правильные ли ответ генерируется: - ΔS (drift) - не уходит ли смысл слишком далеко от шага к шагу - λ (convergence) - сходится ли рассуждение к решению или крутится в цикле - Coverage — достаточно ли фактов и аргументов учтено Если все три условия выполнены, ответ считается «качественным». 🟢В тестах стабильность вывода выросла до 90–95% против обычных 70–85% у традиционных подходов. ▪ Github: https://github.com/onestardao/WFGY @ai_machinelearning_big_data #ai #llm #opensource #reasoning #hallucinations #promptengineering