uz
Feedback
Machinelearning

Machinelearning

Kanalga Telegram’da o‘tish

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Ko'proq ko'rsatish

📈 Telegram kanali Machinelearning analitikasi

Machinelearning (@ai_machinelearning_big_data) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 297 182 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 326-o'rinni va Rossiya mintaqasida 1 262-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 297 182 obunachiga ega bo‘ldi.

15 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni -6 639 ga, so‘nggi 24 soatda esa -229 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

  • Tasdiqlash holati: Tasdiqlanmagan
  • Jalb etish (ER): Auditoriya o‘rtacha 8.06% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 5.69% ini tashkil etuvchi reaksiyalarni to‘playdi.
  • Post qamrovi: Har bir post o‘rtacha 23 972 marta ko‘riladi; birinchi sutkada odatda 16 925 ta ko‘rish yig‘iladi.
  • Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 186 ta reaksiya keladi.
  • Tematik yo‘nalishlar: Kontent openai, claude, api, gemini, контекст kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Yuqori yangilanish chastotasi (oxirgi ma’lumot 16 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

297 182
Obunachilar
-22924 soatlar
-1 4417 kunlar
-6 63930 kunlar
Postlar arxiv
✔️ Mistral AI представила Mistral 3 - новое семейство открытых ИИ-моделей, рассчитанных на работу где угодно: от ноутбуков и
+1
✔️ Mistral AI представила Mistral 3 - новое семейство открытых ИИ-моделей, рассчитанных на работу где угодно: от ноутбуков и смартфонов до облаков и edge-устройств. Линейка включает флагманскую Mistral Large 3 и компактные Ministral-модели - все под лицензией Apache 2.0 с коммерческим использованием. Модели оптимизированы для широкого спектра задач: от работы на устройствах с ограниченными ресурсами до корпоративных нагрузок. - Mistral Small 3 вышла на уровень свыше 81 % на MMLU — для компактной модели это очень высокий показатель при низких задержках. - Mistral Medium 3.1 заняла верхние позиции в LM Arena: первое место в категории English (no style control), второе — в общем зачёте, плюс топ-3 в задачах кодирования и длинных запросов. - Medium 3.1 показывает около 90 % качества «тяжёлых» моделей, но при существенно меньших ресурсных затратах — одно из лучших соотношений цена/производительность на рынке. https://mistral.ai/news/mistral-3 @ai_machinelearning_big_data #mistral #ml

🤖 Китайская компания **EngineAI (Zhòngqíng)** представила полноразмерного гуманоидного робота **T800**. «Всё реальная съёмка - без CGI, без AI, без ускорения видео.» Основные характеристики робота: - рост 173 см - 29 степеней свободы (без учёта кистей) - пиковый крутящий момент суставов - 450 Н·м Функции и возможности: - система кругового обзора 360° - активное охлаждение суставов ног - аккумулятор на 4–5 часов работы @ai_machinelearning_big_data #ai #robots

📌NVIDIA на NeurIPS 2025. NVIDIA анонсировала, о чем расскажет на конференции NeurIPS, которая началась сегодня и пройдет до
+2
📌NVIDIA на NeurIPS 2025. NVIDIA анонсировала, о чем расскажет на конференции NeurIPS, которая началась сегодня и пройдет до 7 декабря в Сан-Диего. 🟡Автономный транспорт. NVIDIA DRIVE Alpamayo-R1, или сокращенно AR1. Это первая в мире открытая ризонинг-VLA модель специально для исследований в области автопилотов. Модель построена на базе NVIDIA Cosmos Reason и отлично поддается дообучению с помощью RL. Alpamayo-R1 будет доступна на GitHub и Hugging Face, а фреймворк AlpaSim для тестов уже опубликован. 🟡Инструменты для создания физических роботов и симуляций. Cosmos Cookbook - руководство с рецептами для физического ИИ и генерации синтетических данных и оценки моделей. LidarGen - "модель мира", которая генерирует данные лидаров для симуляций. Omniverse NuRec Fixer - инструмент мгновенного исправления артефактов в нейронных реконструкциях а робототехнике и БПЛА. ProtoMotions3 - открытый фреймворк на базе Isaac Lab, позволяющий тренировать цифровых людей с невероятно реалистичной физикой. 🟡Но не только железом и роботами живет NVIDIA. MultiTalker Parakeet - модель для ASR нескольких спикеров даже в быстром темпе и с перекрытиями. В паре с ней идет Sortformer - инструмент для диаризации, т. е. разделения спикеров в аудиопотоке в реальном времени. Ну и, конечно, NeMo Gym - библиотека для создания сред обучения с RL в комплекте с NeMo Data Designer, комплексом для создания и проверки синтетических наборов данных. 🟡И, наконец, о чистой науке. К конференции NVIDIA подготовила более 70 научных работ. Вот лишь несколько жемчужин из этого списка: Audio Flamingo 3. Это большая аудио-языковая модель, которая может "понимать" и анализировать аудиозаписи длительностью до 10 минут. Minitron-SSM. Техника прунинга, которая позволила уменьшить модель Nemotron-H 8B с 8 до 4 млрд. параметров, при этом удвоив скорость инференса. ProRL, или Prolonged Reinforcement Learning. Концепция, которая доказала, что продление процесса RL выводит модели на совершенно новый уровень в ризонинге. @ai_machinelearning_big_data #news #ai #ml

⚡️Ozon Profit расширяет сбор и разметку данных для ML по всей России Краудсорсинговая платформа Ozon Profit, которая изначально фокусировалась на онлайн-задачах, теперь позволяет собирать данные и проводить проверки в офлайне по всей России. Это полезно для проектов, чьи ML-модели требуют физической верификации. Компании могут отправлять исполнителей для фотофиксации витрин, проверки цен и качества сервиса в любом городе. Параллельно за год в 5 раз вырос объем чисто онлайн-проектов по разметке изображений, текстов и видео, а также анализу тональности обращений — критически важных задач для обучения моделей. Сейчас в офлайне исполнители выезжают на точку для сбора данных, а в онлайне занимаются разметкой данных, анализом эмоций в комментариях, модерацией. Сегодня на платформе зарегистрировано более 100 000 исполнителей. @ai_machinelearning_big_data #news #ml

✔️ Дженсен Хуанг потребовал тотальной автоматизации внутри Nvidia. CEO Nvidia обратился к сотрудникам с директивой использовать ИИ-инструменты для решения абсолютно любой задачи, где это технически возможно. Хуанг считает, что компания должна не только давать миру железо для вычислений, но и сама служить эталоном ИИ-эффективности. Особое внимание он уделил инструментам разработки, настаивая на их тотальном внедрении в инженерные процессы. Несмотря на автоматизацию, компания продолжает расти. За год штат Nvidia увеличился с 29,6 до 36 тысяч человек, и для покрытия текущих задач требуется нанять еще около 10 тысяч специалистов. NVIDIA не первая, кто требует от сотрудников использования ИИ - Google и Microsoft также начали привязывать использование нейросетей к KPI сотрудников. techspot.com ✔️ В тестовой версии ChatGPT для Android нашли признаки рекламы. Разработчик Тибор Блахо обнаружил в тестовой версии ChatGPT для Android отсылки на рекламный функционал. Строки содержат формулировки: «рекламная функция», «поисковая реклама» и «карусель поисковой рекламы», что указывает на то, что OpenAI, возможно, разрабатывает функцию показа рекламы в ChatGPT. Tibor Blaho в сети X ✔️ Pinokio обновился до версии 5.0. Мажорное обновление платформы Pinokio, позиционирует пятую версию как «Vercel для localhost». Инструмент позволяет разворачивать на macOS, Windows и Linux любые веб-серверы, CLI-приложения и ИИ-модели в один клик. Система полностью автоматизирует рутину по настройке окружения, самостоятельно подтягивая необходимые пакетные менеджеры. Pinokio может создавать лаунчеры для любых проектов с помощью ИИ-агентов. Интерфейс стал универсальным, добавлена поддержка интерактивных терминалов и режим Cells для параллельной работы с фронтендом, бэкендом и логами в одном окне. В новой версии появился «локальный интернет»: Pinokio присваивает запущенным приложениям короткие HTTPS-домены и делает их доступными для других устройств в сети, автоматически активируя сервисы при входящем запросе. Автор Pinokio в сети X ✔️ Пятая часть научных рецензий на ICLR были полностью написаны ИИ. Организаторы конференции ICLR опубликовали результаты проверки контента, проведенной совместно с Pangram Labs. Анализ массива из 75 800 отзывов показал, что почти 16 тыс. рецензий (около 21%) были полностью сгенерированы ИИ, а не написаны людьми. Проблема затронула и сами научные статьи: 199 поданных рукописей были распознаны как полностью написанные ИИ, а еще в 9% работ доля сгенерированного текста превысила 50%. Хотя регламент ICLR допускает использование ИИ-инструментов для правки текста или генерации кода при условии явного указания, создание синтетических рецензий подрывает доверие к процессу ревью. В ответ на инцидент организаторы вводят обязательный автоматизированный скрининг всех материалов на использование ИИ. nature.com ✔️ Slop Evader: расширение, которое очищает поиск от ИИ-контента. Проект позиционируется как попытка вернуть пользователям достоверный интернет эпохи до ChatGPT. Расширение использует Google Search API для жесткой фильтрации выдачи, отсекая любые материалы, опубликованные после 30 ноября 2022 года. Автор называет этот подход тактикой «выжженной земли»: по ее мнению, это единственный надежный способ гарантировать, что контент создан человеком, в условиях тотального ИИ-слопа. Slop Evader работает с YouTube, Reddit, Stack Exchange и архивами других крупных платформ. Очевидный технический недостаток полной потери доступа к актуальным новостям является осознанной частью концепции. Создатель расширения надеется, что растущий запрос пользователей на «человеческий» контент в итоге вынудит поисковые системы внедрить маркировку генеративных материалов. 404media.co @ai_machinelearning_big_data #news #ai #ml

+1
🔥 Kling Omni (O1) только что вышел - и первые тесты впечатляют. Это как nano-banana pro, только для видео: бери любой материал и превращай его во что угодно. Модель: - удаляет объекты, - меняет стиль сцен, - перерисовывает ролик целиком, - и при этом держит персонажей одинаковыми в любых ракурсах. OpenArt включили безлимит - можно спокойно экспериментировать. Главное отличие: больше не нужно править каждый кадр вручную. Меняешь целое видео одним промптом — экономишь время и не тратишь кредиты на повторные генерации. O1 ощущается как живой креативный напарник: - удаляет объекты, - меняет стиль сцен, - перерисовывает ролик целиком, - и при этом держит персонажей одинаковыми в любых ракурсах. Новый стандарт AI-видео. https://app.klingai.com/global/omni/new @ai_machinelearning_big_data #Kling #KlingO1 #KlingOmni #AIvideo #AIGeneration

⚡️ Runway представили новый видеогенератор **Gen-4.5** - заметный шаг вперёд по качеству и управляемости видео. Что улучшили: - более детализированное и чистое изображение - реалистичную динамику и движения объектов - улучшенную физику, освещение и поведение материалов - точное следование промпту, включая сложные сцены Gen-4.5 уверенно работает с быстрыми движениями, сложными ракурсами и умеет контролировать камеру, композицию, звук и другие параметры сцены. Поддерживаются разные стили-— от фотореализма до пластилиновой анимации. Что может: - Image-to-Video - Video-to-Video - Keyframes - Управление движением камеры Runway заявляет, что скорость и потребление ресурсов сопоставимы с Gen-4, но качество заметно выше. На сайте модель пока помечена как *soon*, цены ещё не отображаются, API пока недоступен. Доступ пользователям будут открывать постепенно. По метрикам тоже впечатляет: Gen-4.5 набрала 1 247 Elo в рейтинге *Artificial Analysis Text-to-Video*, установив новый рекорд и обойдя все существующие AI-модели для генерации видео. Анонс: https://app.runwayml.com/video-tools/ @ai_machinelearning_big_data #runway #runwayml #gen45 #gen4_5 #videogen #ai_

⚡️ Отличный ресурс, если хотите глубже понять, как работает параллельное исполнение на GPU. Документация NVIDIA PTX раскрывае
⚡️ Отличный ресурс, если хотите глубже понять, как работает параллельное исполнение на GPU. Документация NVIDIA PTX раскрывает низкоуровневую модель выполнения: устройство команд, иерархию потоков, блоков, варпов, регистров и видов памяти. Это базовый материал, без которого сложно разобраться, почему ядра GPU ведут себя именно так, как ведут, и как правильно писать высокопроизводительный код под CUDA. Ссылка: https://docs.nvidia.com/cuda/parallel-thread-execution @ai_machinelearning_big_data #nvidia

🚨 95% внедрений ИИ проваливаются. Почему это происходит и как не оказаться среди них? Статистика с полей внедрения ИИ продол
🚨 95% внедрений ИИ проваливаются. Почему это происходит и как не оказаться среди них? Статистика с полей внедрения ИИ продолжает поражать неподготовленные умы. MIT (Massachusetts Institute of Technology) пишет, что только 5% инициатив приносят измеримую пользу. Benedict Evans тушат огонь бензином добавляют: 50% (половина, Карл!) компаний просто бросает попытки. Почему? Большинство компаний искренне верит, что для успеха достаточно подключить LLM. Помните Незнайку на Луне? Сделаем ракету 🚀– полетим на Марс! Ну или выберем модель, подключим API, сделаем агента – и Великий Волшебный ИИ всё сделает за нас. А на практике всё ломается не на стороне моделей, а на: ● сопротивлении людей (ИИ заберёт мою работу! 😨) ● неподготовленном ИТ-ландшафте ● бардаке в процессах Другими словами, дело не в технологиях. Модели уже достаточно зрелые. Они работают. Но они не решают базовые вопросы: какую задачу выбрать? как встроить ИИ в процессы? что делать с людьми? как посчитать эффект? кто будет этим управлять? что делать дальше? Что дальше? Чтобы выйти из категории «95% провалов» и попасть в те самые 5% компаний, которые действительно получают бизнес-ценность от ИИ, нужен другой подход. Именно вокруг этого построена концепция AIM и роль AI Business Partner (AIBP) – лидера, который связывает людей, процессы и технологии в единую рабочую систему. Именно этой теме команда создателей AIM посвятит открытый вебинар, который пройдет 2 декабря в 19:00 (МСК). На вебинаре мы разберем: 1. Почему внедрения ИИ проваливаются – на конкретных примерах из реальных проектов. 2. Как выглядит работающий подход к внедрению ИИ в процессы на основе методологии AIM. 3. Кто такой AIBP, где его взять и как им стать. Если вам важно понимать не только технологии, но и то, как сделать ИИ рабочим инструментом для бизнеса – этот вебинар точно для вас. 💡 👉 Регистрация и подробности в боте: https://t.me/aim_education_bot Реклама: ИП: Новикова Алина Сергеевна ИНН:262810436353 erid: 2VtzqxiJFwF

🚀 Релиз DeepSeek-V3.2 и DeepSeek-V3.2-Speciale - модели нового поколения, созданные в первую очередь для reasoning и работы
+3
🚀 Релиз DeepSeek-V3.2 и DeepSeek-V3.2-Speciale - модели нового поколения, созданные в первую очередь для reasoning и работы в агентных системах. Что нового: - DeepSeek-V3.2 - официальный преемник V3.2-Exp. Доступна в приложении, на сайте и через API. - DeepSeek-V3.2-Speciale - улучшенная версия с акцентом на продвинутое многошаговое рассуждение. Пока что работает только через API. Обе модели делают упор на глубокие цепочки рассуждений и поведение, нацеленное на агентные сценарии: планирование, решение задач, сложные выводы и работу со структурированными данными. 🏆 Производительность • V3.2 - баланс скорости и качества, уровень примерно GPT-5 • V3.2-Speciale - топовый reasoning, конкурирует с Gemini-3.0-Pro. • Speciale - лидер на IMO, CMO, ICPC. 🤖 Новый подход к обучению агентов • Синтезированы большие тренировочные данные для 1800+ сред и 85k сложных инструкций. • V3.2 - первая модель DeepSeek, у которой мышление встроено прямо в tool-use. 💻 API • V3.2 использует тот же интерфейс, что V3.2-Exp. • Speciale доступна через временный endpoint, работать будет до 15 декабря 2025. 📦 DeepSeek-V3.2 Model: https://huggingface.co/deepseek-ai/DeepSeek-V3.2 📦 DeepSeek-V3.2-Speciale Model: https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale 📄 Tech report: https://huggingface.co/deepseek-ai/DeepSeek-V3.2/resolve/main/assets/paper.pdf @ai_machinelearning_big_data #deepseek, #deepseekv3, #ai, #нейросети, #искусственныйинтеллект, #llm

⚡️ KlingAI запустит новую омни-модель на этой неделе. Kling AI — это сервис для генерации видео китайской компании Kuaishou (
⚡️ KlingAI запустит новую омни-модель на этой неделе.
Kling AI — это сервис для генерации видео китайской компании Kuaishou (Kwai). Наибольшую известность он получил как аналог OpenAI Sora, способный создавать по текстовому описанию видеоролики с поддержкой консистентности персонажей и продвинутыми инструментами.
@ai_machinelearning_big_data #news #ai #ml

API для ML-моделей: как перевести эксперименты в продакшн Вы создали отличную модель — точность впечатляет, метрики в норме,
API для ML-моделей: как перевести эксперименты в продакшн Вы создали отличную модель — точность впечатляет, метрики в норме, но она так и живёт в ноутбуке. На открытом уроке вы узнаете, как интегрировать ML-модели в рабочий стек и превратить прототип в часть системы. Мы разберём, как на практике обернуть модель в API, провести валидацию входных параметров и настроить безопасность. Покажем, как автоматизировать документацию и упростить поддержку решений. Вы научитесь строить API, которые выдерживают реальные нагрузки, защищены от атак и готовы к CI/CD пайплайнам. ➡️ Присоединяйтесь к открытому уроку в преддверии старта курса “MLOps”. Пора сделать ваши модели частью инфраструктуры, а не просто красивыми графиками: https://otus.pw/MrVk/?erid=2W5zFHU57pt Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.

🚀 GELab-Zero - первый полноценный open-source стек “Model + Infra” для GUI-агентов. Это открытая альтернатива закрытым систе
+3
🚀 GELab-Zero - первый полноценный open-source стек “Model + Infra” для GUI-агентов. Это открытая альтернатива закрытым системам уровня GUI Agent MCP: готовая модель, готовая инфраструктура и новый бенчмарк, собранный под реальные задачи. Что внутри: • SOTA-модель 4B - лёгкая, быстрая, запускается локально. • One-Click инфраструктура - без ADB и сложных зависимостей. • AndroidDaily - новый бенчмарк, основанный на рабочих пользовательских сценариях. Производительность: • Лучшие результаты на открытых тестах - модель обходит гораздо более крупные системы вроде GUI-Owl-32B на ScreenSpot, AndroidWorld и OSWorld. • 73.4% точности на AndroidDaily - существенно выше, чем UI-TARS-1.5 (47%), Gemini-2.5-pro-thinking (36.6%) и GPT-4o (19.6%). Идея простая: скачивайте, запускайте локально, ломайте, улучшайте. Открытый стек для GUI-агентов наконец доступен. 🟠HuggingFace: https://huggingface.co/stepfun-ai/GELab-Zero-4B-preview 🟠GitHub: https://github.com/stepfun-ai/gelab-zero 🟠Blog: https://opengelab.github.io/index.html @ai_machinelearning_big_data #AI, #Agents, #GUIAgents, #GELabZero, #OpenSource, #MachineLearning, #DeepLearning

🌟 MedSAM-3: адаптация SAM 3 для медицины. MedSAM-3 - исследовательский проект, который переносит возможности сегментации по
+1
🌟 MedSAM-3: адаптация SAM 3 для медицины. MedSAM-3 - исследовательский проект, который переносит возможности сегментации по текстовым запросам из общего домена в медицинский. Несмотря на мощь оригинальной SAM 3, тесты показали ее слабую применимость к клиническим данным: базовая модель часто путает анатомические структуры и не понимает специфические термины. MedSAM-3 решает эту проблему, позволяя врачам выделять объекты на снимках МРТ, КТ, УЗИ и гистопатологии с помощью естественного языка. Например, по запросу «сегментируй опухоль молочной железы». В основе - дизайн SAM 3 с двойным трансформером. На обучении заморозили энкодеры изображений и текста, чтобы сохранить сильные визуальные приоритеты оригинала, а вот компоненты детектора прошли SFT на медицинских датасетах. Это позволило сохранить мощный базис оригинальной SAM 3, но добавить ей понимание медицинской специфики. В посттрейн-тестах наилучшую производительность показала конфигурация MedSAM-3 T+I, где текстовые подсказки были объединены с ограничивающими рамками. Такой подход позволил тестовой модели обойти классический U-Net и первую версию MedSAM на бенчмарках BUSI (Dice score - 0.7772) и Kvasir-SEG. 🟡Помимо самой модели, разработчики собрали агентный фреймворк MedSAM-3 Agent. Он использует мультимодальную LLM (в экспериментах - Gemini 3 Pro) в качестве планировщика, который анализирует запрос, выстраивает цепочку рассуждений и итеративно управляет процессом сегментации. В эксперименте c Gemini 3 Pro, на том же тестовом наборе BUSI, метрика Dice выросла с 0.7772 до 0.8064. ⚠️ Проект пока на стадии техотчета, но разработчики обещают опубликовать код и веса модели в ближайшее время. Так что тем, кто занимается ИИ в медицине - рекомендуем следить за репозиторием на Github. 📌Лицензирование: Apache 2.0 License. 🟡Arxiv 🖥Github @ai_machinelearning_big_data #AI #ML #Segmentation #MedSAM3

⚡️ Как линейная регрессия помогает решать задачи в AI и аналитике Недавно увидел крутой разбор линейной регрессии — и наконец
+5
⚡️ Как линейная регрессия помогает решать задачи в AI и аналитике Недавно увидел крутой разбор линейной регрессии — и наконец понял, что она нужна не только тем тем, кто работает с большими данными. Метод применяется в реально жизненных кейсах. Например, с ним можно: ✔️ прогнозировать спрос и цены на продукты ✔️ измерять эффект от запуска фич ✔️ быстро собирать базовые ML-модели Эти карточки я взял в канале «Зачем мне эта математика». Там такие темы разбирают наглядно: показывают графики, раскладывают формулы по шагам и связывают всё это с кейсами из аналитики и разработки. А ещё там рассказывают много неожиданных фактов и каждую неделю публикуют задачи. В комментах можно обсудить вопросы и задать вопросы редакции. Так что если хотите влюбиться в математику и понять, как устроены технологии вокруг нас — подписывайтесь и следите. Реклама. ООО «ФРОМ СКРЭТЧ», ИНН 9724205560, erid: 2Vtzqxf17nH

🤖 Unitree R1 и G1 демонстрируют свои навыки на одной сцене Выбери своего БОЙЦА: ❤️ Новый, более доступный и компактный R1 или 🔥 Мощный и уже зарекомендовавший себя на рынке G1, который остаётся флагманом линейки. @ai_machinelearning_big_data #ai #robots

⚡️ В Ai Toolkit появилась поддержка обучения LoRA для Z-Image Turbo. Ostris, разработчик популярного пакета для обучения дифф
⚡️ В Ai Toolkit появилась поддержка обучения LoRA для Z-Image Turbo. Ostris, разработчик популярного пакета для обучения диффузионных моделей добавил поддержку обучения для Z-Image Turbo с помощью De-Distill адаптера.
AI Toolkit — это универсальный набор инструментов для обучения диффузионных моделей на потребительском оборудовании. Он может запускаться как в GUI, так и в командной строке. Набор разработан так, чтобы быть простым в использовании, но при этом обладать всеми возможными функциями.
По первым тестам, обучение возможно на 12+ VRAM, а обучение персонажа на 17 изображениях длительностью 3000 шагов на RTX 5090 занимает примерно полтора часа. Подробный гайд по процессу автор тулкита обещает выпустить в ближайшие дни. @ai_machinelearning_big_data #news #ai #ml

✍️ ML Global Recap: итоги ключевых научных конференций года 11 декабря Яндекс проводит встречу для тех, кто следит за трендам
✍️ ML Global Recap: итоги ключевых научных конференций года 11 декабря Яндекс проводит встречу для тех, кто следит за трендами в машинном обучении. Эксперты расскажут, что важного происходило в этом году на главных мировых конференциях и что нас ждет дальше. Ребята знают, о чем говорят. Команда в курсе всех ключевых событий отрасли: NeurIPS, ICLR, ACL, Interspeech, CIKM и ACM RecSys – весь год по косточкам разбирали тренды и статьи с мероприятий. А на некоторых даже выступали. Например, на ACM RecSys представили устный доклад по Yambda (попасть в oral секцию на конференцию такого уровня – задача со звездочкой) Значимые выводы с конференций и основные тенденции представят руководители ключевых команд Яндекса. 🎯 Все детали тут.

🙂 Идея для стартапа: GPU-Сауна @ai_machinelearning_big_data
🙂 Идея для стартапа: GPU-Сауна @ai_machinelearning_big_data

✔️ ШАД Яндекса начал обучать ученых. В Школе анализа данных, где готовят специалистов по ИИ, началось обучение по применению ИИ в естественно-научных исследованиях. На программу подали заявки ученые из 37 регионов - больше всего запросов получили от экспертов в областях физики, медицины и химии. В итоге зачислили 50 молодых исследователей: от магистрантов до кандидатов наук из Москвы, Петербурга, Уфы, Иркутска, Владивостока и Екатеринбурга. Участники изучают основы ИИ и сразу применяют инструменты в своих задачах. С каждой командой работает эксперт ШАДа: помогает выбрать методы и спланировать эксперимент. Если проекту нужны тяжелые вычисления, подключаются мощности Yandex Cloud. ✔️ ИИ научили считывать активность скрытых мышц кисти по видео. Команда из Institute of Science Tokyo анонсировала фреймворк PianoKPM Net, способный с высокой точностью определять активность мышц рук без использования нательных датчиков. Обычно для этого требуется инвазивная и дорогая электромиография, но новая архитектура реконструирует паттерны мышечных сокращений, анализируя только видеозапись. В основе системы - уникальный датасет, собранный на базе 12 часов игры профессиональных пианистов, где визуальные данные синхронизированы с реальными сигналами мышц. Технология превращает обычную камеру в диагностический инструмент, что важно для реабилитационной медицины, спортивной аналитики и создания продвинутых интерфейсов «человек-компьютер». Авторы планируют выложить датасет и модель в открытый доступ. techxplore.com ✔️ ИИ-проект Джеффа Безоса купил стартап General Agents. Project Prometheus поглотил разработчика агентного ИИ General Agents. Сделка прошла в закрытом режиме еще летом и сопровождалась переходом команды инженеров из DeepMind и Tesla в структуру Prometheus. Цель Prometheus: создание ИИ-систем для поддержки сложных производств автомобилестроения и космической отрасли. Главный актив General Agents - технология Ace для автономного управления интерфейсами и приложениями. Хотя изначально Ace создавался для автоматизации рутинны на ПК, в рамках Prometheus эти наработки, судя по всему, будут масштабированы для индустриальных сценариев. wired.com ✔️ OpenAI и Google резко ограничили лимиты в Sora и Nano Banana Pro. Глава направления Sora в OpenAI Билл Пиблз сообщил, что бесплатные аккаунты теперь ограничены всего 6 видеогенерациями в сутки, так как текущие графические процессоры буквально плавятся от запросов. Это ограничение не выглядит временным: компания прямо предлагает докупать генерации по мере необходимости, хотя условия для подписчиков ChatGPT Plus и Pro пока остались прежними. Google приняла аналогичные меры, урезав бесплатный доступ к инструменту Nano Banana Pro до 2 изображений в день. Техгигант предупредил, что лимиты могут меняться динамически и без уведомлений. Кроме того, под ограничения попал и доступ бесплатных пользователей к модели Gemini 3 Pro. theverge.com ✔️ Perplexity добавила функцию долгосрочной памяти. ИИ-поисковик получил функцию "persistent memory", которая позволяет запоминать предпочтения, интересы и детали предыдущих диалогов. Теперь система автоматически создает "постоянный контекст" пользователя, а ответы становятся персонализированными и требуют меньше уточняющих запросов. Perplexity извлекает факты из хранилища памяти и напрямую использует их при формировании ответа. Этот контекстный слой работает поверх любой выбранной модели без потери накопленных знаний о пользователе. Функция полностью управляема: сбор данных можно отключить в настройках, а в режиме инкогнито история не сохраняется. perplexity.ai @ai_machinelearning_big_data #news #ai #ml