Machinelearning

Открыть в Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Больше

Сеть:Machinelearning Россия1 261 Технологии и приложения324...

📈 Аналитический обзор Telegram-канала Machinelearning

Канал Machinelearning (@ai_machinelearning_big_data) языкового сегмента Русский является активным участником. Сейчас сообщество объединяет 297 383 подписчиков, занимая 324 место в категории Технологии и приложения и 1 261 место в регионе Россия.

📊 Показатели аудитории и динамика

С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 297 383 подписчиков.

Согласно последним данным от 14 июня, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило -6 744, а за последние 24 часа — -170, при этом общий охват остаётся высоким.

Статус верификации: Не верифицирован
Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 8.03%. В первые 24 часа после публикации контент обычно набирает 5.69% реакций от общего числа подписчиков.
Охват публикаций: В среднем каждый пост получает 23 912 просмотров. В течение первых суток публикация набирает 16 939 просмотров.
Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 186.
Тематические интересы: Контент сосредоточен на ключевых темах, таких как openai, claude, api, gemini, контекст.

📝 Описание и контентная политика

Автор описывает ресурс как площадку для выражения субъективного мнения:
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

Благодаря высокой частоте обновлений (последние данные получены 15 июня, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.

297 383

Подписчики

-17024 часа

-1 4767 дней

-6 74430 день

23 912

Просмотры поста

~ 16 93924 часа

~ 18 95348 часов

8.03%

Коэффициент вовлеченности

~ 5

Постов в день

Ads index

beta

Архив постов

297 358

🤖 AI Studio — платформа для создания ИИ-агентов без навыков разработки Yandex B2B Tech обновила AI Studio: теперь на платформе можно собрать своих ИИ-агентов всего за несколько часов Что умеют: 🟠Голосовые агенты для контакт-центров на базе realtime API с ответами в реальном времени; 🟠AI Search для поиска по изображениям, таблицам и документам, а также по интернету; 🟠Составление мультиагентных сценариев (несколько агентов решают задачу вместе); 🟠Подключение агентов к внешним сервисам по шаблону через MCP Hub (уже можно интегрировать их с системами Контур.Фокус и amoCRM) 📌 Встроены готовые решения: SpeechSense для анализа звонков, Нейроюрист для юридических заключений и другие. AI Studio уже доступна для всех клиентов Yandex Cloud. @ai_machinelearning_big_data #ai #cloud #agents

297 358

✔️ Alibaba открыла исходный код модели Qwen3-VL. Это vision-language модель, которая умеет управлять графическими интерфейсами, писать код, строить диаграммы в Draw.io по макетам и распознавать объекты в самых разных областях — от повседневной жизни до узкоспециализированных сфер. Среди ключевых возможностей: точное определение событий в видео продолжительностью до двух часов, расширение поддержки OCR с 19 до 32 языков с улучшением качества на редких символах и наклонном тексте, работа с контекстом длиной 256 тысяч токенов с возможностью увеличения до миллиона, а также высокая точность в задачах обнаружения рисков в реальных условиях. HF ✔️ Google Research представил новую работу о моделях для временных рядов. Исследователи показали, что foundation-модели могут обучаться в стиле few-shot, то есть адаптироваться к новой задаче прямо «на лету», без отдельного переобучения. В основе подхода лежит TimesFM, расширенный методом in-context fine-tuning (TimesFM-ICF). Модель получает несколько примеров вместе с историей данных и учится делать прогнозы более точно. В экспериментах на 23 датасетах точность выросла на 6,8% по сравнению с базовой моделью, при этом качество оказалось сопоставимо с версиями, обученными специально под каждый набор данных. Теперь модели временных рядов можно использовать как LLM: им достаточно нескольких примеров в контексте, чтобы подстроиться под задачу. Это открывает путь к более гибкому и простому применению таких систем в бизнесе, финансах, энергетике и других областях. Google ✔️ Исследователи из MIT, OpenAI и Sakana AI предложили новый метод ASAL (Automated Search for Artificial Life), который автоматизирует поиск «искусственной жизни» с помощью foundation-моделей. Главная идея в том, что вместо ручного конструирования симуляций теперь можно задавать цель в виде текста, а модель будет находить или создавать такие системы, где возникают жизнеподобные явления. ASAL работает на разных субстратах - от классических Boids и Game of Life до Lenia, Particle Life и нейронных клеточных автоматов. В ходе экспериментов метод открыл новые формы поведения в Lenia и Boids, а также клеточные автоматы, способные демонстрировать открытое и сложное развитие, сравнимое с «Жизнью» Конвея. Это открывает путь к ускоренному исследованию искусственной жизни и автоматическому открытию новых «жизнеподобных» систем, которые раньше приходилось искать вручную. ✔️ Еще Qwen представила свою новую флагманскую модель Qwen3-Max, сразу доступную без ограниченного превью. Линейка включает две версии: Qwen3-Max-Instruct, ориентированную на кодинг и агентные задачи, и Qwen3-Max-Thinking, оснащённую инструментальным использованием и «heavy mode» для сложных сценариев. По результатам тестов Qwen3-Max выходит на уровень топовых моделей на таких бенчмарках, как SWE-Bench, Tau2-Bench, SuperGPQA, LiveCodeBench и AIME25. Модель построена на масштабном датасете и опирается на значительные вычислительные мощности как в предобучении, так и в RL. Компания позиционирует Qwen3-Max как новый флагман и открывает доступ сразу на нескольких платформах: в Qwen Chat, через API Alibaba Cloud и в блоге разработчиков. X ✔️ Отчёт Google DORA показал: 90% IT-специалистов уже используют ИИ в работе, что на 14% больше, чем год назад. В опросе участвовало почти 5 тысяч разработчиков, и в среднем они тратят около двух часов в день на взаимодействие с AI-инструментами. Доверие остаётся ограниченным: 46% доверяют «отчасти», 23% — «немного», и только 20% — «сильно». Это объясняется частыми мелкими исправлениями после автогенерации. Влияние на качество кода оценивается сдержанно: 31% видят лёгкое улучшение, 30% — «без изменений». Зато ощутим рост скорости за счёт снижения рутины. На рынке труда обстановка сложнее: вакансии для новичков сократились на 71% с 2022 года, а кандидаты подают сотни заявок, прежде чем получить работу. Report @ai_machinelearning_big_data #news #ai #ml

297 358

⚡️ Новая модель LFM2-2.6B - лидер в классе до 3B параметров. Ключевые особенности: - лёгкая и быстрая, всего 2.6B параметров - построена на архитектуре v2 (short convs + group query attention) - обучена на 10 трлн токенов, поддерживает контекст до 32k LFM2-2.6B - компактная, но мощная моделька для широкого спектра задач. 🟠Blog post: https://liquid.ai/blog/introducing-lfm2-2-6b-redefining-efficiency-in-language-models 🟠HF: https://huggingface.co/LiquidAI/LFM2-2.6B 🟠Model Bundle on LEAP: https://leap.liquid.ai/models?model=lfm2-2.6b @ai_machinelearning_big_data #AI #LLM #LFM2 #OpenSourceAI #Multilingual

297 358

Создавай, обучай и внедряй LLM-проекты вместе с экспертами из Газпромбанка и X5 Tech🚀 Курс «LLM-инженер» — это практическая программа для ML-инженеров и разработчиков, которые хотят выйти за рамки экспериментов и научиться создавать рабочие системы на базе больших языковых моделей. Создан GIGASCHOOL, совместно с крупнейшей магистратурой по искусственному интеллекту AI Talent Hab. Ты научишься: ➡️использовать методы RLHF (включая DPO, PPO); ➡️настраивать модели с помощью fine-tuning, LoRA / QLoRA, PEFT; ➡️снижать ресурсоёмкость через квантование и дистилляцию; ➡️запускать и адаптировать open-source модели под реальные задачи с помощью vLLM; ➡️разрабатывать интеллектуальных агентов и мультиагентные системы на LangGraph; ➡️строить RAG-системы с векторными базами (FAISS) и отслеживать метрики качества через Langfuse. Тебя будут обучать лиды и хеды ИИ-команд: - Желтова Кристина, директор по разработке моделей в Газпромбанке; - Потехин Александр, NLP Lead X5 Tech; - Андреева Дарья, ML Engineer (NLP) X5 Tech. ▪️252 часа теории и практики; ▪️диплом о профессиональной подготовке; ▪️старт 15 октября|18 недель онлайна с заранее продуманными каникулами; ▪️35 117 ₽/мес (рассрочка); ▪️повышение цены — 25 сентября. Смотри программу и регистрируйся по ссылке

297 358

🖥 Huawei строит план, чтобы догнать Nvidia за 3 года - ставка не на мощность отдельного чипа, а на масштабирование кластеров. Идея проста: собрать тысячи Ascend-чипов в **SuperPod**-стойки с новой шиной UnifiedBus, чтобы они работали как единый ускоритель. В 2026 году Huawei обещает SuperPod 950 с 8,192 чипами, что даст: - в 6,7 раза больше вычислительной мощности, - в 15 раз больше памяти, - в 62 раза выше пропускную способность, чем у Nvidia NVL144. К 2028-му скорость связи между чипами хотят поднять до 4 Тбит/с (у Nvidia сейчас 1,8). В будущем Huawei говорит даже о кластерах из миллиона чипов. ⚠️ Но главное слабое место — производство. После санкций компания лишилась доступа к фабрикам TSMC. Попытка сделать 5нм чип Ascend 910D провалилась: слишком мало годных кристаллов выходит с пластин. Последний реальный прорыв — 7нм чип в Mate 60 Pro в 2023 году. У Китайцев есть амбиции и архитектура, но нет надёжного производства. Это и есть главный барьер на пути к конкуренции с Nvidia. 🟠Новость: bloomberg.com/news/articles/2025-09-23/huawei-plans-three-year-campaign-to-overtake-nvidia-in-ai-chips @ai_machinelearning_big_data #Huawei #Nvidia #AIChips #SuperPod

297 358

Positive Technologies приглашает на онлайн-презентацию нового продукта — PT Data Security Решение помогает защитить критически важные данные компании, снижает риски утечек и обеспечивает соответствие требованиям регуляторов. На онлайн-трансляции вы первыми узнаете: — Какие задачи и риски сегодня определяют настоящее и будущее рынка защиты данных. — Какие вызовы стоят перед компаниями на рынке защиты данных. — О новом подходе Positive Technologies к защите данных. 📅 8 октября, 15:00 мск 📍 Онлайн 👉 Регистрация

297 358

✔️ OpenAI активно переманивает инженеров из Apple для работы над своим первым железом, которое планируется к выпуску в 2026–27 годах. В 2025 году в OpenAI перешло более двадцати специалистов Apple. Компания привлекает их миллионными пакетами акций и менее бюрократичной культурой. Среди новых сотрудников - дизайнер звуковых волн для Siri Сайрус Ирани и бывший топ-менеджер Apple Watch Эрик де Йонг. Причины ухода называют одни и те же: медленные продуктовые обновления Apple и слабая динамика акций. Ситуация настолько встревожила Купертино, что было отменено выездное совещание в Китае, чтобы удержать ключевых сотрудников ближе к офису. Новость ✔️ Qwen представила новую модель Qwen3-TTS-Flash для преобразования текста в речь. Разработчики называют её самой стабильной в линейке. Модель поддерживает 14 выразительных голосов и умеет работать с 10 языками, включая русский. Задержка генерации составляет всего 97 миллисекунд — примерно одна десятая секунды, что открывает путь к полноценным голосовым ассистентам в реальном времени. Qwen3-TTS-Flash ✔️ OpenAI объявила о заключении стратегического партнёрства с Nvidia, которое уже называют историческим. Главное в сделке - Nvidia инвестирует до 100 миллиардов долларов, предоставляя инфраструктуру для обучения и запуска моделей OpenAI. Речь идёт о строительстве датацентров совокупной мощностью не менее 10 гигаватт, что эквивалентно миллионам GPU. Таким образом Nvidia становится ключевым поставщиком вычислительных мощностей для компании Сэма Альтмана. Первый кластер на базе платформы NVIDIA Vera Rubin планируется запустить во второй половине 2026 года. Openai ✔️Инженеры-биомедики из Duke University разработали платформу TuNa-AI, которая сочетает искусственный интеллект и робототехнику для создания и оптимизации наночастиц, используемых в разработке лекарств. В отличие от существующих моделей, ограниченных фиксированными соотношениями материалов, TuNa-AI может исследовать как состав, так и количество ингредиентов, что позволяет повысить стабильность и эффективность наночастиц. В рамках первых испытаний система показала значимые результаты. Успешность формирования наночастиц увеличилась на 42,9%. При использовании препарата венетоклакс, применяемого в лечении лейкоза, удалось улучшить его растворимость и эффективность подавления раковых клеток. В другом эксперименте содержание канцерогенного вспомогательного вещества удалось сократить на 75%, сохранив при этом эффективность химиотерапии и улучшив распределение препарата в организме. ✔️ И еще про Qwen, китайцы представили модель Qwen-Image-Edit-2509, которую уже называют «убийцей» Nano Banana. Она умеет редактировать сразу несколько изображений и комбинировать их в единый результат. Модель лучше сохраняет контекст, лица и целостность объектов, а встроенный ControlNet позволяет менять позы персонажей для точного управления сценой. Qwen-Image-Edit @ai_machinelearning_big_data #news #ai #ml

297 358

🚀 День релизов: Qwen выпустили Qwen3-Omni — первый нативный end-to-end *omni-modal AI* Модель обрабатывает текст, изображения, аудио и видео в одной модели. На бенчмарках выглядит так, как будто все модальности работают одинаково качественно. ⚡️ Особенности - Первое место на 22 из 36 аудио- и мультимодальных бенчмарков - Поддержка: 119 языков текста, - Минимальная задержка — 211 мс - Обработка аудио до 30 минут длиной - ПОзволяет гибко настраивать через системные промпты - Встроенный tool calling 🌟 Open-source релизы Компания выложила три версии: - Qwen3-Omni-30B-A3B-Instruct - Qwen3-Omni-30B-A3B-Thinking - Qwen3-Omni-30B-A3B-Captioner 👉 Попробовать можно здесь: 💬 Chat: https://chat.qwen.ai/?models=qwen3-omni-flash 💻 GitHub: https://github.com/QwenLM/Qwen3-Omni 🤗 Hugging Face: https://huggingface.co/collections/Qwen/qwen3-omni-68d100a86cd0906843ceccbe 🤖 ModelScope: https://modelscope.cn/collections/Qwen3-Omni-867aef131e7d4f 🎬 Demo: https://huggingface.co/spaces/Qwen/Qwen3-Omni-Demo @ai_machinelearning_big_data #qwen #opensource #llm #ml

297 358

🚀 Новая китайская модель LongCat-Flash-Thinking 🧠 Это модель для рассуждений, которая показала SOTA-результаты среди open-source решений. ⚡ Основное: - Архитектура MoE, 560B параметров, из них 27B активируются. - Эффективность: требует на **64,5% меньше токенов**( чем другим открытым моделям того же класса), чтобы достичь топ-результатов на AIME25 (с нативным использованием инструментов,). - Контекст: 128k, обучение с усилением на задачах рассуждений и кода, многоэтапное пост-тюнинг обучение с мультиагентным синтезом. - Инфраструктура: асинхронный RL даёт 3x ускорение по сравнению с синхронными фреймворками. ⚙️ Оптимизации для продакшена: - Свои оптимизированные ядра для работы с MoE и специальные приёмы распределённого обучения, - KV-cache reduction, квантование, chunked prefill, - статическая/эластичная маршрутизация, peer-to-peer cache transfer, heavy-hitter replication и PD-disaggregation. - Поддержка SGLang и vLLM для эффективного деплоя. 📊 Бенчмарки: - Лидирует в tool use (**τ²-Bench, VitaBench**) - Хорошие результаты по instruction following (**IFEval, COLLIE, Meeseeks-zh**). Китайцы стабильно удерживают лидерство в reasoning-моделях. 🟠 HF: https://huggingface.co/meituan-longcat/LongCat-Flash-Thinking @ai_machinelearning_big_data #AI #LLM #Reasoning #MoE #DeepLearning #OpenSource

297 358

🚀 Не стройте ракету, пока не собрали бумажный самолёт Один из главных рисков в запуске IT-продукта — застрять в бесконечной доработке и не выйти на рынок. В комьюнити Короче, Капитан делают по-другому. Челлендж: 12 запусков за 12 месяцев. ✅ Разработка и запуск — за 1 месяц ✅ Минимальные вложения (средний бюджет на продвижение — $150) ✅ Честный разбор: что получилось, а что — нет Формула проста: 1 запуск = 1 функция = решение 1 проблемы Три главных правила: ⚡️Проверенный спрос, а не догадки ⚡️ Быстрый запуск без перфекционизма ⚡️ Только США и ЕС — там платят за удобство Канал Короче, Капитан показывает запуск, продвижение и доход по каждому продукту в реальном времени. Без иллюзий, без теорий — только работающие подходы и реальные цифры. 👉 Подписаться: @its_capitan Реклама. ИП Зуев, ИНН 360408359441, erid: 2Vtzqx3W8bW

297 358

🐳 А вот и обновленная DeepSeek-V3.1-Terminus Она даёт более стабильные и полные результаты на тестах по сравнению с предыдущей версией. Доступна в приложении и в веб-версии и через API. 🔗 Открытые веса: https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus @ai_machinelearning_big_data #DeepSeek #opensource #llm

297 358

⚡️ Вышли новые версии Qwen3-Next-80B в формате FP8! 📌 Модели: - Qwen3-Next-80B-A3B-Instruct-FP8: 80B, обученная в формате Instruct. Сочетает MoE-архитектуру и FP8-квантование, при большом размере работает быстро и кушает меньше памяти, поддерживает длинный контекст - до 262k токенов (с расширением до миллиона) и оптимизирована для сложных задач рассуждения и работы с большими документами. - Qwen3-Next-80B-A3B-Thinking-FP8 — Thinking модель, с акцентом на рассуждения, и решение логических задач. Гибридное внимание: Gated DeltaNet + Gated Attention → работа с супердлинными контекстами. Thinking-версия** показывает топ-результаты на задачах рассуждений, обгоняя не только Qwen3-30B/32B, но и закрытую Gemini-2.5-Flash-Thinking - FP8-точность → бысрый инференс при сохранении качества. - Полная совместимость с Transformers, vLLM и SGLang. - Подходит для продакшн-задач, где важны скорость и эффективность. 🟠Hugging Face: https://huggingface.co/collections/Qwen/qwen3-next-68c25fd6838e585db8eeea9d 🟠ModelScope: https://modelscope.cn/collections/Qwen3-Next-c314f23bd0264a @ai_machinelearning_big_data #qwen #opensource #llm #ml

297 358

🔥 Марк Цукерберг:

> «Мы будем тратить деньги очень агрессивно. Даже если мы потеряем пару сотен миллиардов — это будет неприятно, но лучше так, чем остаться позади в гонке за супер-интеллектом».

Эти слова показывают, насколько серьёзно Цукерберг и его компания воспринимают гонку ИИ. 💸 Капитальные вложения не сокращаются — наоборот, компании наращивают расходы. 👉 Сигнал для всего рынка: крупнейшие игроки готовы рисковать колоссальными суммами ради лидерства в ИИ. 📌Полное интервью @ai_machinelearning_big_data #ai #ml #airace #money #zuck

297 358

🦾 Y-Hand M1 — универсальная рука для человекоподобных роботов Компания Yuequan Bionic представила Y-Hand M1 - самую универсальную и ловкую антропоморфную руку с рекордной степенью свободы движений. Что умеет: - Вести ручку по бумаге - Открывать бутылки - Резать бумагу - Выполнять мелкие бытовые задачи почти как человек 🔧 Технические характеристики: - 38 степеней свободы, нагрузка до 28.7 кг - Точность позиционирования кончика пальца — 0.04 мм - Полное сжатие пяти пальцев за 0.2 секунды - Репликация суставов пальцев с помощью собственных магнитоэлектрических искусственных мышц ⚡️ По сути, это шаг к тому, чтобы роботы получили руки, которые по ловкости максимально близки к человеческим. @ai_machinelearning_big_data #ai #robots

297 358

✔️ OpenAI готовит к запуску в 2026 году собственный AI-Pin. Ранее Сэм Альтман говорил, что первый продукт компании не будет очками, но теперь они рассматриваются как часть будущей линейки. В разработке участвует Джони Айв — культовый дизайнер Apple, который ранее критиковал носимые устройства и особенно Humane AI Pin. Обсуждался также вариант внутриушного девайса, но он пока исключен. Если слухи подтвердятся, OpenAI выйдет на рынок персональных AI-устройств, где уже экспериментируют Humane, Meta и другие. theverge ✔️ TikTok продолжит работу в США — Вашингтон и Пекин заключили сделку. 80% компании перейдет к американским инвесторам (Oracle, Silver Lake, Andreessen Horowitz), а 20% останется у ByteDance. Управление возьмет американский совет директоров при надзоре правительства США. Китай согласился передать хранение данных и безопасность американскому партнеру. Но главный вопрос — кто управляет алгоритмами ранжирования, формирующими ленты миллионов пользователей, — пока не решен. (Reuters) reuters ✔️ IBM на конференции Think 2025 представила концепцию generative computing. По мнению компании, взаимодействие с ИИ через промты — ненадежный и устаревший метод. Новый подход делает работу моделей стабильнее: управление контекстом, уровни абстракции, встроенные правила безопасности и контроль случайности. Среди ключевых технологий — aLoRAs, позволяющая переписывать и проверять запросы, и open-source инструмент Mellea, превращающий размытые промты в структурированные программы. Tipranks ✔️ Radware выявила уязвимость ShadowLeak в агенте Deep Research от ChatGPT. Она позволяла извлекать данные из Gmail через скрытые инструкции в письмах. Пользователи не замечали подвоха: агент автоматически выполнял вредоносные команды. OpenAI закрыла дыру и поблагодарила исследователей за находку. Этот случай показал серьезные риски «нулевых кликов», когда атака происходит без участия пользователя и без видимых признаков. (The Verge) theverge ✔️ InclusionAI выпустила Ring-flash-2.0 — открытую reasoning-модель, развитие Ling-flash-2.0. Модель на 100B параметров, но при инференсе активирует лишь ~6,1B. Внутри алгоритм IcePop, устраняющий нестабильность MoE и сокращающий разрыв между обучением и инференсом. Модель обучена в три этапа (SFT, RLVR, RLHF), показывает SOTA-результаты в математике, коде и логике, выдавая 200+ токенов/с на 4 GPU H20. Доступна по MIT-лицензии. (HF) HF ✔️ xAI представила Grok 4 Fast — модель, ориентированную на скорость и дешевизну. Модель мультимодальная, поддерживает контекст 2M токенов. Тарифы: $0.20 за 1M входных токенов и $0.50 за 1M выходных. В 20 раз дешевле GPT-5-high и при производительности на уровне Gemini 2.5 Pro, стоит в 25 раз дешевле. X @ai_machinelearning_big_data #news #ai #ml

297 358

🏭 Microsoft строит самый мощный в мире датацентр для ИИ — Fairwater AI в Висконсине. Запуск — начало 2026 года. Он будет оснащён сотнями тысяч GPU NVIDIA GB200 и обеспечит производительность в 10 раз выше, чем у самого быстрого суперкомпьютера сегодня. 📍 Факты: - Кампус: около 127 гектаров, 3 здания, примерно 111 000 м² (бывший Foxconn) - Хранилище: длиной с 5 футбольных полей - Охлаждение: замкнутый жидкостный контур, 172 гигантских вентилятора, второй по величине водоохлаждающий чиллер - Сеть: InfiniBand + Ethernet по 800 Гбит/с, топология fat-tree без блокировок - Рэк: 72 GPU GB200 как один ускоритель → 865 тыс. токенов/сек - Память: 14 ТБ в пуле на рэк, 1,8 ТБ/с скорость обмена между GPU 🌍 В глобальном масштабе Microsoft объединяет Fairwater с 400+ датацентрами в 70 регионах в единую сеть AI WAN, чтобы десятки тысячи GPU могли работать синхронно над одной задачей. Это инфраструктура планетарного уровня. 🟠 Подробности @ai_machinelearning_big_data

297 358

🤖Как применять LLM для построения ИИ-ассистентов На научной конференции «ИИ-ЗАМАН» в Казани технологическая платформа Авито подробно рассказала о своем пути к созданию масштабной многоагентной системы. Исследователь данных Виктория Берестова объяснила, как компания переосмыслила подход к автоматизации, отказавшись от громоздких запрограммированных сценариев в пользу гибких LLM-ассистентов. 🟠 В основе перехода — архитектура MAS (Multi-Agent System), где каждый агент выполняет узкоспециализированную роль, подобно юристу или техническому эксперту в большой команде. Это решает ключевую проблему: вместо одного медленного и дорогого универсального помощника работают множество маленьких и эффективных. Система сама решает, какой специализированный агент лучше справится с задачей. 🟠 Экономика такого подхода оказалась выгоднее классических решений. Платформа научилась оптимизировать ресурсы, заменяя дорогие универсальные модели дешевыми специализированными без потери качества. Для еще большей эффективности работает система предварительной фильтрации: простые запросы обрабатываются автоматически, без запуска тяжелых моделей. 🟠 Результат — единый ИИ-помощник, объединивший более 100 рабочих сценариев для тысяч сотрудников. Вместо десятков интерфейсов работники теперь получают помощь через естественный диалог. 🟠Компания уже давно развивает собственные генеративные модели: собственная текстовая A-Vibe и мультимодальная A-Vision уже принесли Авито 670 млн рублей дополнительной выручки в 2024 году. Также в компании объявили о создании своего R&D-отдела под руководством Kaggle Grandmaster Александра Рыжкова. Исследования сфокусированы на пяти направлениях: генеративные модели, компьютерное зрение, голосовые технологии, защита от дипфейков и 3D-технологии. @ai_machinelearning_big_data #news #ai

297 358

🧬🤖 Paper2Agent: оживляем научные статьи Open-source инструмент от исследователей из Stanford, который превращает статические статьи в интерактивных AI-ассистентов. 📌 Как это работает: - Paper2MCP анализирует статью и её код( если есть), извлекает ключевые методы и превращает их в инструменты внутри MCP-сервера. - Agent layer подключает этот сервер к чат-агенту (например, Claude Code или Chatgpt). Поле чего, у каждой статьи появляется свой ИИ-ассистент, который: - объясняет папиру на простом языке; - запускает код без ручного копания в репозиториях, зависимостях и API-ключах; - объединяет данные и пайплайны из разных работ. Каждый MCP-сервер включает: - Tools — функции (например, прогноз изменения экспрессии генов). - Resources — текст, код, датасеты. - Prompts — шаблоны для пошаговых сценариев. Фактически Paper2Agent помогает конвертировать научные работы в полноценные рабочие инструменты. Чтобы повторить методы их статьи, приходилось вручную ставить окружения, импортировать десятки модулей и гадать с входными данными. Paper2Agent позволяет это сделать через диалоговый интерфейс. 🟠Github @ai_machinelearning_big_data #ai #ml #aiagent

297 358

🚀 SakanaAI представил Robust Agentic CUDA Kernel Optimization Это новый подход, где LLM помогает оптимизировать CUDA-ядра для PyTorch. • Слияние операций ускоряет forward/backward-проходы, результаты выше стандартных Torch-базлайнов • Полный пайплайн: PyTorch → генерация CUDA-кода → эволюционная оптимизация во время работы • Проверка через LLM: модели автоматически отмечают неправильные ядра (дает +30% к производительности) • robust-kbench — собственный бенчмарк, где измеряют не только скорость, но и корректность работы LLM Авторы пишут о 2.5x ускорении над PyTorch eager и даже 6x в линейных операциях ❗️ Но большинство примеров — это тесты на слияние операций с неотюненной базой, так что цифры спорные. К тому же PyTorch 2.5 уже внедряет похожие оптимизации ), поэтому такие рекорды могут быстро обесцениться. Это интересный подход к самообучающимся AI-компиляторам, но заявленные ускорения стоит проверять на праактике. 🟢Github: https://github.com/SakanaAI/robust-kbench 🟢Статья: https://arxiv.org/abs/2509.14279 @ai_machinelearning_big_data #AI #CUDA #PyTorch #SakanaAI #LLM #Optimizatio

297 358

🤖 AI-агенты уже способны обрабатывать заявки, собирать отчёты и делать другие задачи без участия человека. Но многие компании не решаются их внедрять — опасаются, что нужно самим закупать серверы и нанимать разработчиков редкой специализации. На вебинаре MTC Web Services вы узнаете, как самостоятельно создавать AI-агентов — с помощью кода или без. Эксперты расскажут, как доработали Langflow под реальные задачи. А также покажут несколько кейсов, как AI-агенты уже помогают компаниям в работе. На вебинаре вы узнаете: ▪️ Как создать AI-агента с помощью кода: плюсы и минусы ▪️ Как создать AI-агента без кода: плюсы и минусы ▪️ Какие no-code инструменты есть на рынке ▪️ Почему мы выбрали Langflow и что изменили ▪️ Кейсы AI-агентов в MWS GPT Руководители и владельцы бизнеса ⏩️ Узнаете, как запустить AI-агентов без большого бюджета ИТ-специалисты ⏩️ Разберётесь, как быстро интегрировать агентов в ваши системы Менеджеры ⏩️ Поймёте, какие рутинные задачи можно делегировать и как собрать агента без разработчика ℹ️ Кроме того, всем зарегистрировавшимся участникам разошлют памятку по no-code решениям для создания AI-агентов после вебинара. Регистрируйтесь по ссылке и до встречи онлайн!