Machine learning Interview

رفتن به کانال در Telegram

ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz

نمایش بیشتر

شبکه:Machinelearning روسيا21 939 فناوری و برنامه‌ها4 569...

📈 تحلیل کانال تلگرام Machine learning Interview

کانال Machine learning Interview (@machinelearning_interview) در بخش زبانی روسی بازیگری فعال است. در حال حاضر جامعه شامل 30 034 مشترک است و جایگاه 4 569 را در دسته فناوری و برنامه‌ها و رتبه 21 939 را در منطقه روسيا دارد.

📊 شاخص‌های مخاطب و پویایی

از زمان ایجاد در невідомо، پروژه رشد سریعی داشته و 30 034 مشترک جذب کرده است.

بر اساس آخرین داده‌ها در تاریخ 11 ژوئن, 2026، کانال فعالیت پایداری دارد. در ۳۰ روز گذشته تغییر اعضا برابر 39 و در ۲۴ ساعت گذشته برابر 8 بوده و همچنان دسترسی گسترده‌ای حفظ شده است.

وضعیت تأیید: تأیید نشده
نرخ تعامل (ER): میانگین تعامل مخاطب 18.49% است و در ۲۴ ساعت نخست پس از انتشار، محتوا معمولاً 8.84% واکنش نسبت به کل مشترکان کسب می‌کند.
دسترسی پست‌ها: هر پست به طور میانگین 5 554 بازدید دریافت می‌کند. در اولین روز معمولاً 2 656 بازدید جمع‌آوری می‌شود.
واکنش‌ها و تعامل: مخاطبان به‌طور فعال حمایت می‌کنند؛ میانگین واکنش به هر پست 39 است.
علایق موضوعی: محتوا بر موضوعات کلیدی مانند claude, llm, контекст, hermes, nvidia تمرکز دارد.

📝 توضیح و سیاست محتوایی

نویسنده این فضا را محل بیان دیدگاه‌های شخصی توصیف می‌کند:
“ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz”

به لطف به‌روزرسانی‌های پرتکرار (آخرین داده در تاریخ 12 ژوئن, 2026)، کانال همواره به‌روز و دارای دسترسی بالاست. تحلیل‌ها نشان می‌دهد مخاطبان به‌طور فعال با محتوا تعامل دارند و آن را به نقطه اثرگذاری مهم در دسته فناوری و برنامه‌ها تبدیل کرده‌اند.

30 034

مشترکین

+824 ساعت

-117 روز

+3930 روز

5 554

نمایش های پست

~ 2 65624 ساعت

~ 3 84048 ساعت

18.49%

نرخ مشارکت

~ 1

پست های در روز

Ads index

beta

آرشیو پست ها

30 034

🗣 11AI — новый голосовой ассистент от ElevenLabs ElevenLabs представили 11AI — голосового помощника нового поколения на базе их модели озвучки Eleven v3. 🧠 Ассистент: • Отвечает в реальном времени • Говорит с живыми паузами и интонацией • Поддерживает глубокий поиск через Perplexity • Интегрируется с Notion, Slack и другими рабочими инструментами • Позволяет выбрать один из 5000 голосов или загрузить свой https://11.ai/ #neural #нейросети

30 034

Hunyuan-GameCraft: интерактивная генерация динамичных игровых видео Hunyuan-GameCraft — новая система, позволяющая создавать игровые видеоролики с высокой динамичностью и точным управлением. • Единое представление управления Объединяет нажатия клавиш и движения мыши в общее пространство камеры для плавных переходов ✅ • Гибридная история-условная стратегия обучения Расширяет видеопоследовательности авторегрессивно, сохраняя контекст сцены ✔️ • Дистилляция модели для реального времени Сокращает вычислительные затраты без потери качества длительных роликов ⏱️ • Обширный датасет Обучено на более чем 1 000 000 записей из 100+ AAA-игр и дообучено на синтетических данных 🎮 Результат: более реалистичные, согласованные во времени и управляемые видеоролики по сравнению с традиционными методами. 🔗 Подробнее: https://huggingface.co/papers/2506.17201

30 034

Хотите внедрить AI на основе LLM в свой проект или сервис, но не знаете, как это сделать? ✅ Пройдите тестирование на новый курс от Otus - LLM Driven Development Курс охватывает полный цикл разработки и внедрения больших языковых моделей — от основ архитектуры AI и подготовки данных до тонкостей MLOps, мониторинга и оптимизации. Сфокусируйтесь на прикладных знаниях архитектуры LLM и их интеграции с современными фреймворками, такими как LangChain и LlamaIndex, обеспечивая практическое применение через проектную работу и домашние задания. 🎁 Только до 30 июня — скидка 10% при полной оплате курса. 🔗 Пройдите тестирование чтобы зафиксировать условия https://tglink.io/d46c54f73be2?erid=2W5zFGXijGC #реклама О рекламодателе

30 034

📚 AutoTrain Advanced — обучение ML-моделей без кода. Hugging Face представили инструмент, который упрощает тонкую настройку моделей машинного обучения до нескольких кликов. Проект поддерживает широкий спектр задач — от классификации текста до дообучения LLM с техниками вроде SFT и DPO. Система работает как в облаке через Spaces, так и локально — нужно лишь подготовить данные в правильном формате. Для запуска не требуется глубоких знаний ML: конфигурация описывается в YAML-файле, а обучение начинается одной командой. 🤖 GitHub @machinelearning_interview

30 034

🧠 Можно ли предсказать успех идеи до её реализации? Да — с помощью LLM. Исследование предлагает использовать языковые модели для оценки перспектив научных идей ещё до их реализации — и это серьёзно повышает эффективность исследований. 🔧 Как это работает: • Построен бенчмарк из 1 585 пар идей (прошедших верификацию людьми) + 6 000 обучающих пар из конференц-статей • Используется дообученный GPT-4.1 в связке с retrieval‑агентом • Агент генерирует запросы, ищет статьи, суммирует полные работы и фильтрует по релевантности • GPT-4.1 дообучается на исторических данных по успешности идей 📌 Дообученная LLM обходит экспертов: 64.4% точности против 48.9% у людей 📌 Система в целом достигает 77% точности Она устойчива к поверхностным факторам: новизне идеи, сложности формулировки и т.д. 📌 Самое интересное: Модель предсказывает успех неопубликованных, AI-сгенерированных идей с точностью 63.6% 🧠 Это не просто фильтрация мусора — это шаг к автоматическому прогнозированию научного прорыва. Читать

30 034

🛡️ Fault Tolerant Llama — обучение LLM в условиях экстремальной нестабильности, без чекпоинтов Исследовательская команда продемонстрировала обучение языковой модели в условиях, приближённых к худшему сценарию: сотни имитированных отказов происходили каждые 15 секунд, а чекпоинты полностью отключены. Цель — проверить, как себя поведёт система с полной поддержкой fault-tolerance. 🧰 Что использовалось: • torchft — отказоустойчивая реализация DDP для PyTorch • torchtitan — фреймворк для масштабируемого обучения с параллелизмом • Кластер от Crusoe Cloud: 300 GPU NVIDIA L40S • Модель: LLaMA 3, 1B параметров 🏗️ Конфигурация: • 30 узлов × 10 GPU = 30 изолированных replica-групп • Внутригрупповая коммуникация: NCCL • Межгрупповая: Gloo (быстрая переинициализация, важно для отказов) • TorchFT координирует состояние с помощью глобального Lighthouse и локальных менеджеров 🔄 Восстановление без чекпоинтов: Обычно сбой = загрузка чекпоинта. Здесь: сбой = локальная перезагрузка группы, автоматическая синхронизация с другими группами. Каждый возвращающийся узел получает актуальные веса через peer-to-peer от соседей и снова включается в обучение — без полной остановки, без потери прогресса. 📉 Результаты: • Более 1200 успешных восстановлений • Обучение остаётся стабильным, модель не деградирует • Пики на графике — это просто "возвращенцы", не сбой всей системы 📦 Почему это важно: ✔️ Подходит для нестабильных сетей и распределённых сред ✔️ Убирает зависимость от чекпоинтов ✔️ Поддерживает гибкие конфигурации: TP, PP, DiLoCo и др. 📌 Подробнее

30 034

Вебинар Стэнфорда — Agentic AI: Эволюция использования языковых моделей Стэнфорд выложил, пожалуй, лучший однострочный часовой разбор о том, как создавать ИИ-агентов. 📌 Видео

30 034

Repost from Machinelearning

✔️ GitHub Copilot вводит плату за продвинутые запросы с 18 июня 2025 года. GitHub объявил о начале тарификации премиум-запросов в Copilot для всех платных планов с 18 июня 2025 года. Теперь пользователи будут получать ежемесячный лимит таких запросов, а неиспользованные остатки сгорают в конце месяца. Премиум-запросы требуются для работы с мощными моделями вроде GPT-4.5 или Claude Opus 4, где каждый запрос умножается на коэффициент сложности (GPT-4.5 «съедает» 50 единиц за раз). Для бесплатного тарифа доступ ограничен: 2000 автодополнений кода и 50 премиум-запросов в месяц, причем все чаты считаются как "премиум". Платные планы предлагают неограниченный доступ к базовым моделям (GPT-4.1, GPT-4o), но дополнительные запросы сверх лимита обойдутся в $0.04 за штуку. Если лимит исчерпан, можно переключиться на базовые модели — правда, их скорость зависит от нагрузки. github.com ✔️ OpenAI разрабатывает меры безопасности для биологических исследований с применением ИИ. OpenAI предупредила, что ее будущие модели могут представлять повышенный риск создания биологического оружия. Чтобы предотвратить злоупотребления, OpenAI разрабатывает комплексную систему ограничений: обучение моделей игнорировать опасные запросы, автоматический мониторинг подозрительной активности, проверку экспертов и «Red Teams», тестирующие уязвимости. Компания сотрудничает с лабораториями и правительствами, чтобы улучшить безопасность синтеза ДНК и создать системы раннего обнаружения патогенов. Для тех, кто работает с ИИ в научных целях, планируется отдельный доступ к мощным инструментам, при условии строгого контроля. В июле OpenAI проведет саммит по биозащите, чтобы объединить усилия государств и частного сектора в борьбе с новыми угрозами. openai.com ✔️ Wix покупает вайбкодинг-платформу Base44 за $80 млн. Wix, популярный конструктор сайтов, приобрел Base44 — платформу вайбкодинга, позволяющую создавать приложения через текстовые запросы. Сделка оценивается в $80 млн, с возможными доплатами до 2029 года в зависимости от роста пользователей или выручки. Base44 останется независимой, сохранив текущие инструменты: управление базами данных, аутентификацию, облачное хранение и хостинг. Платформа, насчитывающая 40 тыс. пользователей, недавно добавила чат-бота на основе ИИ для упрощения разработки. techradar.com ✔️ Google использует миллиарды видео с YouTube для обучения ИИ. YouTube подтвердил, что Google использует его архив из 20 млрд. видео для тренировки ИИ-моделей, включая Veo 3. Компания утверждает, что задействует лишь часть контента, соблюдая договоры с авторами, но не уточняет деталей. Создатели, чьи ролики могут попадать в обучающие наборы, не могут отключить такую опцию. Эксперты опасаются, что это создаст конфликт интересов: ИИ, обученный на их материалах, может конкурировать с самими авторами. Некоторые уже выразили недовольство, подчеркнув, что не знали о таком использовании своего контента. При этом ежедневно на YouTube добавляется несколько десятков миллионов новых видео - это потенциальный «корм» для алгоритмов. Вопрос регулирования ИИ и защиты прав авторов остаётся открытым, хотя YouTube ссылается на прозрачность своих политик. cnbc.com ✔️ MiniMax выпустила видеомодель Hailuo 02. MiniMax, в рамках пятидневного марафона релизов "MiniMax Week" представила второе поколение видео-модели Hailuo 02, улучшенной за счет архитектуры NCR. Модель выросла в 3 раза по количеству параметров, при этом разработчики обещают улучшенное качество и разнообразие контента, но технические детали NCR пока не неизвестны. Hailuo 02 справляется со сложными сценариями и по данным бенчмарка Artificial Analysis Video Arena она уступила только Bytedance Seedance, но обошла Google Veo 3. Доступны 3 варианта генераций: 768p на 6/10 секунд и 1080p на 6 секунд. Цена в API за 6-секундный ролик в 768p — $0,28, а 1080p — $0,49. Модель доступна через веб-интерфейс, мобильное приложение или API. mp.weixin.qq.com @ai_machinelearning_big_data #news #ai #ml

30 034

🧠 Ragbits — продвинутый фреймворк для RAG-приложений от deepsense.ai Ragbits — это модульная и типизированная платформа для создания RAG-систем (Retrieval-Augmented Generation) с фокусом на гибкость, масштабируемость и быструю интеграцию. 🔧 Основные возможности: • Поддержка 100+ LLM через litellm, включая локальные и облачные модели • Совместимость с Qdrant, PgVector, Weaviate и другими векторными БД • Загрузка и обработка 20+ форматов (PDF, HTML, Markdown, презентации и др.) • CLI-инструменты: ragbits ingest, ragbits ask, ragbits test • Поддержка Observability (OpenTelemetry), promptfoo, streamlit UI и RAG-chain 🚀 Примеры использования:


from ragbits.document_search import DocumentSearch

search = DocumentSearch()
await search.ingest("https://arxiv.org/pdf/2406.12345.pdf")
result = await search.search("Какой основной вклад в этой статье?")

📦 Установка:


pip install ragbits
create-ragbits-app myapp

💡 Почему стоит попробовать: • Мгновенный старт благодаря готовым шаблонам • Продвинутая настройка пайплайна и логики агентов • Подходит для продакшн-систем, исследований и ML-экспериментов 🔗 GitHub

30 034

Repost from Machinelearning

📌Реверс-инженерия GPT-2 методом трассировки цепей Cross-Layer Transcoders. Goodfire AI, вдохновившись примером Anthropic в интерпретации внутренних процессов Claude, воспроизвели методы трассировки цепей межслойных транскодеров (Cross-Layer Transcoders, CLT) на GPT-2 Small, чтобы проверить их способность раскрывать известные механизмы трансформеров. Выбор на GPT-2 Small пал не случайно, эта модель небольшая и уже была ранее подвергнута ручному реверс-инжинирингу.

Cross-Layer Transcoders выжимают из модели разреженные признаки, которые объясняют работу MLP-слоев. Визуализируют это через графы атрибуции — это карты влияния признака на выход модели.

Натренировали на 100M токенов из FineWeb, получили ~590K признаков. Точность CLT-реплики модели составила 59%, что близко к оригинальным статьям. Тестировали на задаче сравнения чисел («больше, чем»), идеальном полигоне, где уже известны ключевые механизмы.

Задача "Больше, чем" (ориг. "greater-than") взята из статьи Michael Hanna, она заставляет предсказывать большие числа для второго года в диапазоне дат.

▶️ Главный эксперимент: Промпт «The war lasted from the year 1711 to 17». CLT построил граф, где признаки с токена «11» (последняя цифра года) активнее всего влияли на предсказание. Дальше, выделили топ-160 признаков, для каждого построили логит-атрибуции — теплокарты, показывающие, как признак влияет на выходные годы (ZZ) при разных входных (YY). ▶️ Что нашли: 🟢Признаки «больше, чем»: Feature 425104 (слой 8) активируется на больших числах в хронологии (даты, войны). Но его теплокарта продвигает выходы >60, независимо от входа, а вот Feature 461858 работает только для YY=6–14 и продвигает ZZ=10–30. Похоже, CLT подсветил кучу узкоспециализированных «сравнивателей», а не универсальные нейроны, как в ручных исследованиях. 🟢Сюрпризы: Feature 399423 — вообще не про числа. Он кодирует четность и контраст: активируется на «and» в «pros and cons», а в задаче продвигает четные ZZ при нечетных YY. Абстракция уровня «противоположность» — такого в прошлых работах не видели. 🟢Странности: Feature 402486 вообще саботирует задачу: продвигает малые числа. Или Feature 349410 — работает только для YY=11, хотя ее max-активации показывают числа до 30. ▶️ Выводы: CLT автоматически находит интерпретируемые признаки, даже такие неочевидные, как абстрактная четность. Но их «разреженный» мир выглядит иначе, чем ручная трассировка цепей: тут больше узких признаков-«спецов» (Feature 461858 для диапазона 10–30) и меньше универсальных механизмов. Возможно, дело в методе: CLT смотрит изолированные вклады фич, а в полной модели они взаимодействуют. В общем, эксперименты с CLT показал, что под капотом языковых моделей не только четкие «сравниватели чисел», но и куча скрытых паттернов вроде детекторов контраста или любителей чисел, кратных 5. И да, полуавтономный анализ иногда видит то, что люди упускают. 🔜 Читать полную статью @ai_machinelearning_big_data #AI #ML #LLM #Research #CLT

30 034

🌀 Align Your Flow — новый прорыв в генерации изображений Исследователи Nvidia предложили метод, который объединяет преимущества diffusion‑, flow‑ и consistency‑моделей, но без их главного минуса — большого числа шагов генерации. 📌 В чём проблема: • Diffusion и flow‑модели выдают отличные результаты, но требуют десятки/сотни шагов • Consistency-модели ускоряют генерацию (1–2 шага), но резко теряют в качестве при увеличении шагов 🔬 Решение: Flow Maps • Обобщают подходы diffusion и consistency • Связывают любые уровни шума за один шаг • Работают эффективно при любом числе шагов 🧪 Что нового в работе: • Два непрерывных loss-функционала для обучения flow map • Поддержка автонавигации: слабая модель помогает сильной при дистилляции • Дополнительный прирост через adversarial finetuning, при этом сохраняется разнообразие семплов 📈 Результаты: • SOTA на ImageNet (64×64 и 512×512) — даже с компактными нейросетями • Текст‑к‑картинке (text-to-image) версия превзошла все не-GAN модели в few-step генерации 🧠 Вывод: Align Your Flow — это следующий шаг после diffusion и consistency. Меньше шагов, меньше вычислений — при том же или лучшем качестве. 📎 Отличный кандидат для продвинутых генераторов и real-time inference. https://huggingface.co/papers/2506.14603

30 034

🚀 Moonshot AI выпускает Kimi Dev 72B — новую открытую модель для кодинга и софт-инжиниринга! ▪️ Результат 60.4% на SWE Bench Verified — новый рекорд среди open-source моделей ▪️ Обходит GPT-4.1 и уступает только Gemini 2.5 Pro ▪️ Уже доступна на Hugging Face и GitHub Kimi Dev 72B — свежий прорыв для разработчиков, ищущих мощную и открытую LLM для Кодина! - GitHub: https://github.com/MoonshotAI/Kimi-Dev - HuggingFace: https://huggingface.co/moonshotai/Kimi-Dev-72B

30 034

Repost from Machinelearning

🌟MiniMax-M1: открытя reasoning‑LLM с контекстом 1M MiniMax-M1 — первая в мире open-weight гибридная reasoning‑LLM c 1M контекстом (8× DeepSeek R1) и гибридной архитектурой MoE + lightning attention. • 456 млрд параметров (45,9 млрд активируются на токен), сверхэффективная генерация — 25% FLOPs DeepSeek R1 на 100K токенов • Обучение через RL с новым алгоритмом CISPO, решающим реальные задачи от математики до кодинга • На обучение было потрачено $534K, две версии — 40K/80K “thinking budget” • Обходит DeepSeek R1 и Qwen3-235B на бенчмарках по математике и кодингу, • Топ результат на задачах для software engineering и reasoning Бенчмарки:

AIME 2024: 86.0 (M1-80K) vs 85.7 (Qwen3) vs 79.8 (DeepSeek R1)

SWE-bench Verified: 56.0 vs 34.4 (Qwen3)

OpenAI-MRCR (128k): 73.4 vs 27.7 (Qwen3)

TAU-bench (airline): 62.0 vs 34.7 (Qwen3)

LongBench-v2: 61.5 vs 50.1 (Qwen3)

➡️ Попробовать можно здесь ▪Hugging Face: https://huggingface.co/collections/MiniMaxAI/minimax-m1-68502ad9634ec0eeac8cf094 ▪GitHub: https://github.com/MiniMax-AI/MiniMax-M1 ▪Tech Report: https://github.com/MiniMax-AI/MiniMax-M1/blob/main/MiniMax_M1_tech_report.pdf @ai_machinelearning_big_data #llm #reasoningmodels #minimaxm1

30 034

🧠 Модели обучают сами себя: Anthropic представила метод ICM Исследователи из Anthropic разработали новый подход — Internal Coherence Maximization (ICM), позволяющий языковым моделям тонко настраивать себя без участия человека. 🔍 Как работает: Модель оценивает последовательность своих ответов, находит противоречия и улучшает собственные ответы путём самокоррекции. Это позволяет добиться более логичных и целостных рассуждений — без аннотаций и ручной разметки. 📊 Результаты: • На бенчмарках *TruthfulQA* и *GSM8K* ICM показывает не хуже, а иногда даже лучше, чем классическое супервизированное дообучение • В субъективных оценках "полезности" — модели с ICM воспринимаются убедительнее • ICM также может генерировать мощные reward-модели для RLHF ⚠️ Ограничения: • Сложности с новыми концепциями • Неустойчивость на очень длинных текстах 📌 Вывод: ICM — это шаг к более автономному и последовательному ИИ, который учится рассуждать, проверять и улучшать себя сам. Без учителя. 📌 Подробнее

30 034

В эпоху бума нейросетей неудивительно, что в топ высокооплачиваемых профессий, по версии «Хабра», попали ML-инженеры, дата-сайентисты и аналитики. Освойте одну из топовых специальностей и станьте тем, за кем охотятся компании, в онлайн-магистратуре «Прикладной анализ данных и машинное обучение» от Skillfactory и МИФИ. Это привычная магистратура со всеми льготами очных студентов (отсрочка от армии, студенческий билет, обучение 198 р/месяц при господдержке), только учиться будете онлайн в удобное время. Программа рассчитана на два года. За это время вы получите фундаментальные знания с фокусом на практику от преподавателей МИФИ и экспертов из крупных компаний. Погрузитесь в Data Science и Machine Learning и выберете направление — ML или MLOps. Финальной точкой станет диплом государственного образца одного из лучших университетов России как подтверждение вашей квалификации. Чтобы поступить, нужен диплом о высшем образовании или студенческий билет последних курсов вуза. Вступительные — мотивационное письмо и экзамен с общими и профильными вопросами. Набор в магистратуру уже идет. Количество мест ограничено. Оставляйте заявку по ссылке Реклама. ООО "СКИЛФЭКТОРИ". ИНН 9702009530. erid: 2W5zFJbeKJQ

30 034

🚀 Вышли модели Qwen3 в формате MLX! Теперь можно запускать Qwen3 локально — быстро, эффективно и с разной точностью: - 4-bit - 6-bit - 8-bit - BF16 🔧 Модели специально оптимизированы под MLX framework — минимальный объём, максимальная производительность, полная совместимость с Apple Silicon. 🧪 Идеально подходит для локального inference и интеграции в MLX‑проекты. 📦 Попробовать: • Hugging Face: huggingface.co/collections/Qwen/qwen3-67dd247413f0e2e4f653967f • ModelScope: modelscope.cn/collections/Qwen3-9743180bdc6b48 #Qwen3 #MLX #LLM #AppleSilicon #AI

30 034

Repost from Machinelearning

🌟 SEAL: Еще одна попытка создать пайплайн самообучающихся LLM. SEAL - это методика от MiT, позволяющая LLM самостоятельно генерировать обучающие данные и настраивать параметры обучения, чтобы адаптироваться к новым задачам. Вместо традиционного файнтюна на внешних данных модель учится рефлексировать: анализировать контекст, создавать из него синтетические данные и применять их для корректировки собственных весов через механизм усиленного обучения. SEAL, по сути, это два разделенных цикла: 🟢Внешний цикл использует RL, чтобы научить модель генерировать «самоизменения» (инструкции на естественном языке, описывающие, какие данные использовать и как настраивать параметры). 🟢Внутренний цикл реализует эти изменения: модель дообучается на сгенерированных данных, а затем тестирует результат на конкретной задаче. За коррекцию отвечает RL-алгоритм ReSTEM, который оценивает эффективность изменений и обновляет стратегию генерации инструкций. Для экономии ресурсов используются легковесные адаптеры LoRA, которые модифицируют только часть параметров модели. Этот процесс повторяется, постепенно формируя у модели навык преобразования исходных данных в полезные обучающие сигналы. SEAL протестили на 2 задачах: интеграции новых знаний и few-shot обучении. В первом случае модель генерирует логические следствия из текста, дообучается на них и улучшает точность ответов на вопросы без доступа к исходному тексту. Во втором случае SEAL выбирает оптимальные аугментации данных и гиперпараметры для обучения на примерах задач ARC-AGI. В обоих сценариях SEAL превзошел подходы с фиксированными шаблонами (ICL, TTT+Self Edit без RL и) и даже синтетическими данными от GPT-4.1. Метод скорее академический и по большей части экспериментальный, у него есть ограничения: 🟠При последовательном применении изменений модель склонна к «катастрофическому забыванию» — потере знаний, усвоенных ранее; 🟠Сопутствующие вычислительные затраты, так как каждая итерация требует дообучения и тестирования модели. ▶️В репозитории проекта разработчики выложили код, данные и инструкции для двух направлений: 🟢Включение новых фактических знаний; 🟢Адаптация к новым задачам на основе примеров. 📌Лицензирование: MIT License. 🟡Страница проекта 🟡Arxiv 🖥GitHub @ai_machinelearning_big_data #AI #ML #LLM #SEAL #RL #MiT

30 034

🧠 Anthropic представила мультиагентную систему для Claude В новой функции Research агент‑координатор (LeadResearcher) создаёт субагентов, которые параллельно ищут, анализируют и структурируют информацию. Это мощный шаг к превращению LLM в полноценный исследовательский инструмент. 📌 Почему это важно: • Субагенты работают независимо и параллельно • Каждый из них имеет свой контекст и специализацию • Главный агент объединяет результаты и выдаёт финальный отчёт • CitationAgent добавляет корректные ссылки 📊 Результат: Внутренние тесты показали: Claude с мультиагентной системой превзошёл одиночную модель на +90 % при анализе компаний S&P 500. 💡 Модель теперь не просто отвечает — она планирует, координирует и исследует. ⚠️ Минусы: • в 4× больше токенов • в 15× дороже • не годится для задач с общей памятью (например, программирование) 🔍 Но если нужно глубокое исследование — Claude Research действительно экономит часы и дни человеческой работы. 📌 Читать

30 034

🔥 Успех в IT = скорость + знания + окружение Здесь ты найдёшь всё это — коротко, по делу и без воды. Пока другие ищут, где “подглядеть решение”, ты уже используешь самые свежие инструменты! AI: t.me/ai_machinelearning_big_data Python: t.me/pythonl Linux: t.me/linuxacademiya Собеседования DS: t.me/machinelearning_interview C++ t.me/cpluspluc Docker: t.me/DevopsDocker Хакинг: t.me/linuxkalii Devops: t.me/DevOPSitsec Data Science: t.me/data_analysis_ml Javascript: t.me/javascriptv C#: t.me/csharp_ci Java: t.me/java_library Базы данных: t.me/sqlhub Python собеседования: t.me/python_job_interview Мобильная разработка: t.me/mobdevelop Golang: t.me/Golang_google React: t.me/react_tg Rust: t.me/rust_code ИИ: t.me/vistehno PHP: t.me/phpshka Android: t.me/android_its Frontend: t.me/front Big Data: t.me/bigdatai МАТЕМАТИКА: t.me/data_math Kubernets: t.me/kubernetc Разработка игр: https://t.me/gamedev Haskell: t.me/haskell_tg Физика: t.me/fizmat 💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy Папка ML: https://t.me/addlist/2Ls-snqEeytkMDgy Папка FRONTEND: https://t.me/addlist/mzMMG3RPZhY2M2Iy 😆ИТ-Мемы: t.me/memes_prog 🇬🇧Английский: t.me/english_forprogrammers 🧠ИИ: t.me/vistehno 🎓954ГБ ОПЕНСОРС КУРСОВ: @courses 📕Ит-книги бесплатно: https://t.me/addlist/BkskQciUW_FhNjEy Подпишись, если хочешь быть в числе тех, кого зовут в топовые проекты!

30 034

Repost from Machinelearning

✔️ В Пекине запустят первый в мире 4S-центр для роботов с воплощенным ИИ. По аналогии с автосалонами, робототехнический 4S будет предлагать полный цикл: продажи (Sales), сервис (Service), запчасти (Spare parts) и консультации/анализ (Surveys). Планируется зона с демонстрацией роботов в реалистичных сценариях – можно будет всё пощупать руками и увидеть их возможности в деле. Плюс создадут быструю сеть поставки комплектующих по стране и соберут профильную команду для сборки, ремонта и обслуживания машин. Первыми партнерами станут несколько лидеров сферы: UBTECH и Galaxea. Откроется центр в августе на базе промпарка в районе Ичжуан на юге столицы. english.news.cn ✔️ Браузер Dia выходит в бета-версию. The Browser Company открыл доступ к бета-версии браузера Dia (по инвайтам). Dia позиционируется как решение, где ИИ глубоко интегрирован в самую суть взаимодействия, он встроен прямо в рабочий процесс пользователя, избавляя от необходимости постоянно ходить на сайты ChatGPT или Claude. Dia построен на Chromium, так что интерфейс многим знаком. Главная фича — умная адресная строка: она работает и как поиск, и как чат-бот с ИИ. Помощник умеет искать в сети, суммировать загруженные файлы, автоматически переключаться между режимами. Можно даже спросить его о содержимом всех открытых вкладок или попросить составить черновик на их основе. Настройки производятся через диалог с ботом: можно задать тон, стиль письма, параметры для кода. Опция History (по желанию) позволяет браузеру использовать недельную историю просмотров как контекст для ответов. А функция Skills помогает создавать мини-скрипты — ярлыки для сложных настроек или действий. techcrunch.com ✔️ Mistral запускает вычислительную альтернативу облачным гигантам. Mistral AI анонсировала Mistral Compute - инфраструктурную платформу для разработки и запуска ИИ. Это полноценный приватный стек: от GPU и систем оркестрации до API и сервисов. На выбор любой формат, от bare-metal до полностью управляемой PaaS. Mistral Compute нацелен дать государствам, компаниям и научным центрам, ищущих альтернативу решениям из США или Китая, возможность самим строить ИИ-среду под свои нужды и полностью ею владеть. Платформа использует новейшие архитектуры NVIDIA, с доступом к десяткам тысяч GPU. Она создана командой с огромным опытом в HPC и обучении топовых ИИ-моделей. Ключевые акценты: устойчивость и суверенитет данных, инфраструктура соответствует строгим европейским нормам и работает на декарбонизированной энергии. mistral.ai ✔️ ByteDance анонсировала text-to-video модель Seedance 1.0. Seedance 1.0 - новая генеративная модель для создания видео, которая, по утверждениям ByteDance, превосходит конкурентов в точности выполнения запросов, качестве движений и резкости изображения. В тестах на Artificial Analysis она лидирует в задачах text-to-video и image-to-video, обходя Google Veo 3, Kuaishou Kling 2.0 и OpenAI Sora. Модель справляется с длинными сценами, сохраняя стабильность персонажей и переходов между ракурсами, но пока не поддерживает добавление звука. Seedance 1.0 генерирует 5-секундный Full HD-ролик за 41 секунду — это быстрее аналогов, хотя новый Google Veo 3 Fast может нивелировать это преимущество. Инструмент планируют внедрить в платформы Doubao и Jimeng. Целевая аудитория — от профессиональных видеомейкеров до обычных пользователей. seed.bytedance.com ✔️ Midjourney открыла публичное тестирование своей видеомодели. Midjourney объявила о начале открытого тестирования модели генерации видео по текстовым запросам. Задача тестирования собрать обратную связь для улучшения алгоритма. Создатели пригласили сообщество принять участие в онлайн-рейтинге сгенерированных роликов, присоединиться можно по ссылке. Пока некоторые образцы выглядят достойно и сохраняют фирменный стиль Midjourney, но в целом результаты пока нестабильны. Компания подчеркивает: это не финальная версия модели, а лишь первый шаг. Дополнительные сессии тестирования уже запланированы, но дату релиза и цену пока не раскрывают. midjourney.com @ai_machinelearning_big_data #news #ai #ml