Machine learning Interview

Kanalga Telegram’da o‘tish

ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz

Ko'proq ko'rsatish

Tarmoq:Machinelearning Rossiya21 939 Texnologiyalar & Aralashmalar4 569...

📈 Telegram kanali Machine learning Interview analitikasi

Machine learning Interview (@machinelearning_interview) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 30 034 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 4 569-o'rinni va Rossiya mintaqasida 21 939-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 30 034 obunachiga ega bo‘ldi.

11 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni 39 ga, so‘nggi 24 soatda esa 8 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

Tasdiqlash holati: Tasdiqlanmagan
Jalb etish (ER): Auditoriya o‘rtacha 18.49% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 8.84% ini tashkil etuvchi reaksiyalarni to‘playdi.
Post qamrovi: Har bir post o‘rtacha 5 554 marta ko‘riladi; birinchi sutkada odatda 2 656 ta ko‘rish yig‘iladi.
Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 39 ta reaksiya keladi.
Tematik yo‘nalishlar: Kontent claude, llm, контекст, hermes, nvidia kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz”

Yuqori yangilanish chastotasi (oxirgi ma’lumot 12 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

30 034

Obunachilar

+824 soatlar

-117 kunlar

+3930 kunlar

5 554

Post ko'rishlar

~ 2 65624 soatlar

~ 3 84048 soatlar

18.49%

Muloqot nisbati

~ 1

Kuniga postlar

Ads index

beta

Postlar arxiv

30 034

🗣 11AI — новый голосовой ассистент от ElevenLabs ElevenLabs представили 11AI — голосового помощника нового поколения на базе их модели озвучки Eleven v3. 🧠 Ассистент: • Отвечает в реальном времени • Говорит с живыми паузами и интонацией • Поддерживает глубокий поиск через Perplexity • Интегрируется с Notion, Slack и другими рабочими инструментами • Позволяет выбрать один из 5000 голосов или загрузить свой https://11.ai/ #neural #нейросети

30 034

Hunyuan-GameCraft: интерактивная генерация динамичных игровых видео Hunyuan-GameCraft — новая система, позволяющая создавать игровые видеоролики с высокой динамичностью и точным управлением. • Единое представление управления Объединяет нажатия клавиш и движения мыши в общее пространство камеры для плавных переходов ✅ • Гибридная история-условная стратегия обучения Расширяет видеопоследовательности авторегрессивно, сохраняя контекст сцены ✔️ • Дистилляция модели для реального времени Сокращает вычислительные затраты без потери качества длительных роликов ⏱️ • Обширный датасет Обучено на более чем 1 000 000 записей из 100+ AAA-игр и дообучено на синтетических данных 🎮 Результат: более реалистичные, согласованные во времени и управляемые видеоролики по сравнению с традиционными методами. 🔗 Подробнее: https://huggingface.co/papers/2506.17201

30 034

Хотите внедрить AI на основе LLM в свой проект или сервис, но не знаете, как это сделать? ✅ Пройдите тестирование на новый курс от Otus - LLM Driven Development Курс охватывает полный цикл разработки и внедрения больших языковых моделей — от основ архитектуры AI и подготовки данных до тонкостей MLOps, мониторинга и оптимизации. Сфокусируйтесь на прикладных знаниях архитектуры LLM и их интеграции с современными фреймворками, такими как LangChain и LlamaIndex, обеспечивая практическое применение через проектную работу и домашние задания. 🎁 Только до 30 июня — скидка 10% при полной оплате курса. 🔗 Пройдите тестирование чтобы зафиксировать условия https://tglink.io/d46c54f73be2?erid=2W5zFGXijGC #реклама О рекламодателе

30 034

📚 AutoTrain Advanced — обучение ML-моделей без кода. Hugging Face представили инструмент, который упрощает тонкую настройку моделей машинного обучения до нескольких кликов. Проект поддерживает широкий спектр задач — от классификации текста до дообучения LLM с техниками вроде SFT и DPO. Система работает как в облаке через Spaces, так и локально — нужно лишь подготовить данные в правильном формате. Для запуска не требуется глубоких знаний ML: конфигурация описывается в YAML-файле, а обучение начинается одной командой. 🤖 GitHub @machinelearning_interview

30 034

🧠 Можно ли предсказать успех идеи до её реализации? Да — с помощью LLM. Исследование предлагает использовать языковые модели для оценки перспектив научных идей ещё до их реализации — и это серьёзно повышает эффективность исследований. 🔧 Как это работает: • Построен бенчмарк из 1 585 пар идей (прошедших верификацию людьми) + 6 000 обучающих пар из конференц-статей • Используется дообученный GPT-4.1 в связке с retrieval‑агентом • Агент генерирует запросы, ищет статьи, суммирует полные работы и фильтрует по релевантности • GPT-4.1 дообучается на исторических данных по успешности идей 📌 Дообученная LLM обходит экспертов: 64.4% точности против 48.9% у людей 📌 Система в целом достигает 77% точности Она устойчива к поверхностным факторам: новизне идеи, сложности формулировки и т.д. 📌 Самое интересное: Модель предсказывает успех неопубликованных, AI-сгенерированных идей с точностью 63.6% 🧠 Это не просто фильтрация мусора — это шаг к автоматическому прогнозированию научного прорыва. Читать

30 034

🛡️ Fault Tolerant Llama — обучение LLM в условиях экстремальной нестабильности, без чекпоинтов Исследовательская команда продемонстрировала обучение языковой модели в условиях, приближённых к худшему сценарию: сотни имитированных отказов происходили каждые 15 секунд, а чекпоинты полностью отключены. Цель — проверить, как себя поведёт система с полной поддержкой fault-tolerance. 🧰 Что использовалось: • torchft — отказоустойчивая реализация DDP для PyTorch • torchtitan — фреймворк для масштабируемого обучения с параллелизмом • Кластер от Crusoe Cloud: 300 GPU NVIDIA L40S • Модель: LLaMA 3, 1B параметров 🏗️ Конфигурация: • 30 узлов × 10 GPU = 30 изолированных replica-групп • Внутригрупповая коммуникация: NCCL • Межгрупповая: Gloo (быстрая переинициализация, важно для отказов) • TorchFT координирует состояние с помощью глобального Lighthouse и локальных менеджеров 🔄 Восстановление без чекпоинтов: Обычно сбой = загрузка чекпоинта. Здесь: сбой = локальная перезагрузка группы, автоматическая синхронизация с другими группами. Каждый возвращающийся узел получает актуальные веса через peer-to-peer от соседей и снова включается в обучение — без полной остановки, без потери прогресса. 📉 Результаты: • Более 1200 успешных восстановлений • Обучение остаётся стабильным, модель не деградирует • Пики на графике — это просто "возвращенцы", не сбой всей системы 📦 Почему это важно: ✔️ Подходит для нестабильных сетей и распределённых сред ✔️ Убирает зависимость от чекпоинтов ✔️ Поддерживает гибкие конфигурации: TP, PP, DiLoCo и др. 📌 Подробнее

30 034

Вебинар Стэнфорда — Agentic AI: Эволюция использования языковых моделей Стэнфорд выложил, пожалуй, лучший однострочный часовой разбор о том, как создавать ИИ-агентов. 📌 Видео

30 034

Repost from Machinelearning

✔️ GitHub Copilot вводит плату за продвинутые запросы с 18 июня 2025 года. GitHub объявил о начале тарификации премиум-запросов в Copilot для всех платных планов с 18 июня 2025 года. Теперь пользователи будут получать ежемесячный лимит таких запросов, а неиспользованные остатки сгорают в конце месяца. Премиум-запросы требуются для работы с мощными моделями вроде GPT-4.5 или Claude Opus 4, где каждый запрос умножается на коэффициент сложности (GPT-4.5 «съедает» 50 единиц за раз). Для бесплатного тарифа доступ ограничен: 2000 автодополнений кода и 50 премиум-запросов в месяц, причем все чаты считаются как "премиум". Платные планы предлагают неограниченный доступ к базовым моделям (GPT-4.1, GPT-4o), но дополнительные запросы сверх лимита обойдутся в $0.04 за штуку. Если лимит исчерпан, можно переключиться на базовые модели — правда, их скорость зависит от нагрузки. github.com ✔️ OpenAI разрабатывает меры безопасности для биологических исследований с применением ИИ. OpenAI предупредила, что ее будущие модели могут представлять повышенный риск создания биологического оружия. Чтобы предотвратить злоупотребления, OpenAI разрабатывает комплексную систему ограничений: обучение моделей игнорировать опасные запросы, автоматический мониторинг подозрительной активности, проверку экспертов и «Red Teams», тестирующие уязвимости. Компания сотрудничает с лабораториями и правительствами, чтобы улучшить безопасность синтеза ДНК и создать системы раннего обнаружения патогенов. Для тех, кто работает с ИИ в научных целях, планируется отдельный доступ к мощным инструментам, при условии строгого контроля. В июле OpenAI проведет саммит по биозащите, чтобы объединить усилия государств и частного сектора в борьбе с новыми угрозами. openai.com ✔️ Wix покупает вайбкодинг-платформу Base44 за $80 млн. Wix, популярный конструктор сайтов, приобрел Base44 — платформу вайбкодинга, позволяющую создавать приложения через текстовые запросы. Сделка оценивается в $80 млн, с возможными доплатами до 2029 года в зависимости от роста пользователей или выручки. Base44 останется независимой, сохранив текущие инструменты: управление базами данных, аутентификацию, облачное хранение и хостинг. Платформа, насчитывающая 40 тыс. пользователей, недавно добавила чат-бота на основе ИИ для упрощения разработки. techradar.com ✔️ Google использует миллиарды видео с YouTube для обучения ИИ. YouTube подтвердил, что Google использует его архив из 20 млрд. видео для тренировки ИИ-моделей, включая Veo 3. Компания утверждает, что задействует лишь часть контента, соблюдая договоры с авторами, но не уточняет деталей. Создатели, чьи ролики могут попадать в обучающие наборы, не могут отключить такую опцию. Эксперты опасаются, что это создаст конфликт интересов: ИИ, обученный на их материалах, может конкурировать с самими авторами. Некоторые уже выразили недовольство, подчеркнув, что не знали о таком использовании своего контента. При этом ежедневно на YouTube добавляется несколько десятков миллионов новых видео - это потенциальный «корм» для алгоритмов. Вопрос регулирования ИИ и защиты прав авторов остаётся открытым, хотя YouTube ссылается на прозрачность своих политик. cnbc.com ✔️ MiniMax выпустила видеомодель Hailuo 02. MiniMax, в рамках пятидневного марафона релизов "MiniMax Week" представила второе поколение видео-модели Hailuo 02, улучшенной за счет архитектуры NCR. Модель выросла в 3 раза по количеству параметров, при этом разработчики обещают улучшенное качество и разнообразие контента, но технические детали NCR пока не неизвестны. Hailuo 02 справляется со сложными сценариями и по данным бенчмарка Artificial Analysis Video Arena она уступила только Bytedance Seedance, но обошла Google Veo 3. Доступны 3 варианта генераций: 768p на 6/10 секунд и 1080p на 6 секунд. Цена в API за 6-секундный ролик в 768p — $0,28, а 1080p — $0,49. Модель доступна через веб-интерфейс, мобильное приложение или API. mp.weixin.qq.com @ai_machinelearning_big_data #news #ai #ml

30 034

🧠 Ragbits — продвинутый фреймворк для RAG-приложений от deepsense.ai Ragbits — это модульная и типизированная платформа для создания RAG-систем (Retrieval-Augmented Generation) с фокусом на гибкость, масштабируемость и быструю интеграцию. 🔧 Основные возможности: • Поддержка 100+ LLM через litellm, включая локальные и облачные модели • Совместимость с Qdrant, PgVector, Weaviate и другими векторными БД • Загрузка и обработка 20+ форматов (PDF, HTML, Markdown, презентации и др.) • CLI-инструменты: ragbits ingest, ragbits ask, ragbits test • Поддержка Observability (OpenTelemetry), promptfoo, streamlit UI и RAG-chain 🚀 Примеры использования:


from ragbits.document_search import DocumentSearch

search = DocumentSearch()
await search.ingest("https://arxiv.org/pdf/2406.12345.pdf")
result = await search.search("Какой основной вклад в этой статье?")

📦 Установка:


pip install ragbits
create-ragbits-app myapp

💡 Почему стоит попробовать: • Мгновенный старт благодаря готовым шаблонам • Продвинутая настройка пайплайна и логики агентов • Подходит для продакшн-систем, исследований и ML-экспериментов 🔗 GitHub

30 034

Repost from Machinelearning

📌Реверс-инженерия GPT-2 методом трассировки цепей Cross-Layer Transcoders. Goodfire AI, вдохновившись примером Anthropic в интерпретации внутренних процессов Claude, воспроизвели методы трассировки цепей межслойных транскодеров (Cross-Layer Transcoders, CLT) на GPT-2 Small, чтобы проверить их способность раскрывать известные механизмы трансформеров. Выбор на GPT-2 Small пал не случайно, эта модель небольшая и уже была ранее подвергнута ручному реверс-инжинирингу.

Cross-Layer Transcoders выжимают из модели разреженные признаки, которые объясняют работу MLP-слоев. Визуализируют это через графы атрибуции — это карты влияния признака на выход модели.

Натренировали на 100M токенов из FineWeb, получили ~590K признаков. Точность CLT-реплики модели составила 59%, что близко к оригинальным статьям. Тестировали на задаче сравнения чисел («больше, чем»), идеальном полигоне, где уже известны ключевые механизмы.

Задача "Больше, чем" (ориг. "greater-than") взята из статьи Michael Hanna, она заставляет предсказывать большие числа для второго года в диапазоне дат.

▶️ Главный эксперимент: Промпт «The war lasted from the year 1711 to 17». CLT построил граф, где признаки с токена «11» (последняя цифра года) активнее всего влияли на предсказание. Дальше, выделили топ-160 признаков, для каждого построили логит-атрибуции — теплокарты, показывающие, как признак влияет на выходные годы (ZZ) при разных входных (YY). ▶️ Что нашли: 🟢Признаки «больше, чем»: Feature 425104 (слой 8) активируется на больших числах в хронологии (даты, войны). Но его теплокарта продвигает выходы >60, независимо от входа, а вот Feature 461858 работает только для YY=6–14 и продвигает ZZ=10–30. Похоже, CLT подсветил кучу узкоспециализированных «сравнивателей», а не универсальные нейроны, как в ручных исследованиях. 🟢Сюрпризы: Feature 399423 — вообще не про числа. Он кодирует четность и контраст: активируется на «and» в «pros and cons», а в задаче продвигает четные ZZ при нечетных YY. Абстракция уровня «противоположность» — такого в прошлых работах не видели. 🟢Странности: Feature 402486 вообще саботирует задачу: продвигает малые числа. Или Feature 349410 — работает только для YY=11, хотя ее max-активации показывают числа до 30. ▶️ Выводы: CLT автоматически находит интерпретируемые признаки, даже такие неочевидные, как абстрактная четность. Но их «разреженный» мир выглядит иначе, чем ручная трассировка цепей: тут больше узких признаков-«спецов» (Feature 461858 для диапазона 10–30) и меньше универсальных механизмов. Возможно, дело в методе: CLT смотрит изолированные вклады фич, а в полной модели они взаимодействуют. В общем, эксперименты с CLT показал, что под капотом языковых моделей не только четкие «сравниватели чисел», но и куча скрытых паттернов вроде детекторов контраста или любителей чисел, кратных 5. И да, полуавтономный анализ иногда видит то, что люди упускают. 🔜 Читать полную статью @ai_machinelearning_big_data #AI #ML #LLM #Research #CLT

30 034

🌀 Align Your Flow — новый прорыв в генерации изображений Исследователи Nvidia предложили метод, который объединяет преимущества diffusion‑, flow‑ и consistency‑моделей, но без их главного минуса — большого числа шагов генерации. 📌 В чём проблема: • Diffusion и flow‑модели выдают отличные результаты, но требуют десятки/сотни шагов • Consistency-модели ускоряют генерацию (1–2 шага), но резко теряют в качестве при увеличении шагов 🔬 Решение: Flow Maps • Обобщают подходы diffusion и consistency • Связывают любые уровни шума за один шаг • Работают эффективно при любом числе шагов 🧪 Что нового в работе: • Два непрерывных loss-функционала для обучения flow map • Поддержка автонавигации: слабая модель помогает сильной при дистилляции • Дополнительный прирост через adversarial finetuning, при этом сохраняется разнообразие семплов 📈 Результаты: • SOTA на ImageNet (64×64 и 512×512) — даже с компактными нейросетями • Текст‑к‑картинке (text-to-image) версия превзошла все не-GAN модели в few-step генерации 🧠 Вывод: Align Your Flow — это следующий шаг после diffusion и consistency. Меньше шагов, меньше вычислений — при том же или лучшем качестве. 📎 Отличный кандидат для продвинутых генераторов и real-time inference. https://huggingface.co/papers/2506.14603

30 034

🚀 Moonshot AI выпускает Kimi Dev 72B — новую открытую модель для кодинга и софт-инжиниринга! ▪️ Результат 60.4% на SWE Bench Verified — новый рекорд среди open-source моделей ▪️ Обходит GPT-4.1 и уступает только Gemini 2.5 Pro ▪️ Уже доступна на Hugging Face и GitHub Kimi Dev 72B — свежий прорыв для разработчиков, ищущих мощную и открытую LLM для Кодина! - GitHub: https://github.com/MoonshotAI/Kimi-Dev - HuggingFace: https://huggingface.co/moonshotai/Kimi-Dev-72B

30 034

Repost from Machinelearning

🌟MiniMax-M1: открытя reasoning‑LLM с контекстом 1M MiniMax-M1 — первая в мире open-weight гибридная reasoning‑LLM c 1M контекстом (8× DeepSeek R1) и гибридной архитектурой MoE + lightning attention. • 456 млрд параметров (45,9 млрд активируются на токен), сверхэффективная генерация — 25% FLOPs DeepSeek R1 на 100K токенов • Обучение через RL с новым алгоритмом CISPO, решающим реальные задачи от математики до кодинга • На обучение было потрачено $534K, две версии — 40K/80K “thinking budget” • Обходит DeepSeek R1 и Qwen3-235B на бенчмарках по математике и кодингу, • Топ результат на задачах для software engineering и reasoning Бенчмарки:

AIME 2024: 86.0 (M1-80K) vs 85.7 (Qwen3) vs 79.8 (DeepSeek R1)

SWE-bench Verified: 56.0 vs 34.4 (Qwen3)

OpenAI-MRCR (128k): 73.4 vs 27.7 (Qwen3)

TAU-bench (airline): 62.0 vs 34.7 (Qwen3)

LongBench-v2: 61.5 vs 50.1 (Qwen3)

➡️ Попробовать можно здесь ▪Hugging Face: https://huggingface.co/collections/MiniMaxAI/minimax-m1-68502ad9634ec0eeac8cf094 ▪GitHub: https://github.com/MiniMax-AI/MiniMax-M1 ▪Tech Report: https://github.com/MiniMax-AI/MiniMax-M1/blob/main/MiniMax_M1_tech_report.pdf @ai_machinelearning_big_data #llm #reasoningmodels #minimaxm1

30 034

🧠 Модели обучают сами себя: Anthropic представила метод ICM Исследователи из Anthropic разработали новый подход — Internal Coherence Maximization (ICM), позволяющий языковым моделям тонко настраивать себя без участия человека. 🔍 Как работает: Модель оценивает последовательность своих ответов, находит противоречия и улучшает собственные ответы путём самокоррекции. Это позволяет добиться более логичных и целостных рассуждений — без аннотаций и ручной разметки. 📊 Результаты: • На бенчмарках *TruthfulQA* и *GSM8K* ICM показывает не хуже, а иногда даже лучше, чем классическое супервизированное дообучение • В субъективных оценках "полезности" — модели с ICM воспринимаются убедительнее • ICM также может генерировать мощные reward-модели для RLHF ⚠️ Ограничения: • Сложности с новыми концепциями • Неустойчивость на очень длинных текстах 📌 Вывод: ICM — это шаг к более автономному и последовательному ИИ, который учится рассуждать, проверять и улучшать себя сам. Без учителя. 📌 Подробнее

30 034

В эпоху бума нейросетей неудивительно, что в топ высокооплачиваемых профессий, по версии «Хабра», попали ML-инженеры, дата-сайентисты и аналитики. Освойте одну из топовых специальностей и станьте тем, за кем охотятся компании, в онлайн-магистратуре «Прикладной анализ данных и машинное обучение» от Skillfactory и МИФИ. Это привычная магистратура со всеми льготами очных студентов (отсрочка от армии, студенческий билет, обучение 198 р/месяц при господдержке), только учиться будете онлайн в удобное время. Программа рассчитана на два года. За это время вы получите фундаментальные знания с фокусом на практику от преподавателей МИФИ и экспертов из крупных компаний. Погрузитесь в Data Science и Machine Learning и выберете направление — ML или MLOps. Финальной точкой станет диплом государственного образца одного из лучших университетов России как подтверждение вашей квалификации. Чтобы поступить, нужен диплом о высшем образовании или студенческий билет последних курсов вуза. Вступительные — мотивационное письмо и экзамен с общими и профильными вопросами. Набор в магистратуру уже идет. Количество мест ограничено. Оставляйте заявку по ссылке Реклама. ООО "СКИЛФЭКТОРИ". ИНН 9702009530. erid: 2W5zFJbeKJQ

30 034

🚀 Вышли модели Qwen3 в формате MLX! Теперь можно запускать Qwen3 локально — быстро, эффективно и с разной точностью: - 4-bit - 6-bit - 8-bit - BF16 🔧 Модели специально оптимизированы под MLX framework — минимальный объём, максимальная производительность, полная совместимость с Apple Silicon. 🧪 Идеально подходит для локального inference и интеграции в MLX‑проекты. 📦 Попробовать: • Hugging Face: huggingface.co/collections/Qwen/qwen3-67dd247413f0e2e4f653967f • ModelScope: modelscope.cn/collections/Qwen3-9743180bdc6b48 #Qwen3 #MLX #LLM #AppleSilicon #AI

30 034

Repost from Machinelearning

🌟 SEAL: Еще одна попытка создать пайплайн самообучающихся LLM. SEAL - это методика от MiT, позволяющая LLM самостоятельно генерировать обучающие данные и настраивать параметры обучения, чтобы адаптироваться к новым задачам. Вместо традиционного файнтюна на внешних данных модель учится рефлексировать: анализировать контекст, создавать из него синтетические данные и применять их для корректировки собственных весов через механизм усиленного обучения. SEAL, по сути, это два разделенных цикла: 🟢Внешний цикл использует RL, чтобы научить модель генерировать «самоизменения» (инструкции на естественном языке, описывающие, какие данные использовать и как настраивать параметры). 🟢Внутренний цикл реализует эти изменения: модель дообучается на сгенерированных данных, а затем тестирует результат на конкретной задаче. За коррекцию отвечает RL-алгоритм ReSTEM, который оценивает эффективность изменений и обновляет стратегию генерации инструкций. Для экономии ресурсов используются легковесные адаптеры LoRA, которые модифицируют только часть параметров модели. Этот процесс повторяется, постепенно формируя у модели навык преобразования исходных данных в полезные обучающие сигналы. SEAL протестили на 2 задачах: интеграции новых знаний и few-shot обучении. В первом случае модель генерирует логические следствия из текста, дообучается на них и улучшает точность ответов на вопросы без доступа к исходному тексту. Во втором случае SEAL выбирает оптимальные аугментации данных и гиперпараметры для обучения на примерах задач ARC-AGI. В обоих сценариях SEAL превзошел подходы с фиксированными шаблонами (ICL, TTT+Self Edit без RL и) и даже синтетическими данными от GPT-4.1. Метод скорее академический и по большей части экспериментальный, у него есть ограничения: 🟠При последовательном применении изменений модель склонна к «катастрофическому забыванию» — потере знаний, усвоенных ранее; 🟠Сопутствующие вычислительные затраты, так как каждая итерация требует дообучения и тестирования модели. ▶️В репозитории проекта разработчики выложили код, данные и инструкции для двух направлений: 🟢Включение новых фактических знаний; 🟢Адаптация к новым задачам на основе примеров. 📌Лицензирование: MIT License. 🟡Страница проекта 🟡Arxiv 🖥GitHub @ai_machinelearning_big_data #AI #ML #LLM #SEAL #RL #MiT

30 034

🧠 Anthropic представила мультиагентную систему для Claude В новой функции Research агент‑координатор (LeadResearcher) создаёт субагентов, которые параллельно ищут, анализируют и структурируют информацию. Это мощный шаг к превращению LLM в полноценный исследовательский инструмент. 📌 Почему это важно: • Субагенты работают независимо и параллельно • Каждый из них имеет свой контекст и специализацию • Главный агент объединяет результаты и выдаёт финальный отчёт • CitationAgent добавляет корректные ссылки 📊 Результат: Внутренние тесты показали: Claude с мультиагентной системой превзошёл одиночную модель на +90 % при анализе компаний S&P 500. 💡 Модель теперь не просто отвечает — она планирует, координирует и исследует. ⚠️ Минусы: • в 4× больше токенов • в 15× дороже • не годится для задач с общей памятью (например, программирование) 🔍 Но если нужно глубокое исследование — Claude Research действительно экономит часы и дни человеческой работы. 📌 Читать

30 034

🔥 Успех в IT = скорость + знания + окружение Здесь ты найдёшь всё это — коротко, по делу и без воды. Пока другие ищут, где “подглядеть решение”, ты уже используешь самые свежие инструменты! AI: t.me/ai_machinelearning_big_data Python: t.me/pythonl Linux: t.me/linuxacademiya Собеседования DS: t.me/machinelearning_interview C++ t.me/cpluspluc Docker: t.me/DevopsDocker Хакинг: t.me/linuxkalii Devops: t.me/DevOPSitsec Data Science: t.me/data_analysis_ml Javascript: t.me/javascriptv C#: t.me/csharp_ci Java: t.me/java_library Базы данных: t.me/sqlhub Python собеседования: t.me/python_job_interview Мобильная разработка: t.me/mobdevelop Golang: t.me/Golang_google React: t.me/react_tg Rust: t.me/rust_code ИИ: t.me/vistehno PHP: t.me/phpshka Android: t.me/android_its Frontend: t.me/front Big Data: t.me/bigdatai МАТЕМАТИКА: t.me/data_math Kubernets: t.me/kubernetc Разработка игр: https://t.me/gamedev Haskell: t.me/haskell_tg Физика: t.me/fizmat 💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy Папка ML: https://t.me/addlist/2Ls-snqEeytkMDgy Папка FRONTEND: https://t.me/addlist/mzMMG3RPZhY2M2Iy 😆ИТ-Мемы: t.me/memes_prog 🇬🇧Английский: t.me/english_forprogrammers 🧠ИИ: t.me/vistehno 🎓954ГБ ОПЕНСОРС КУРСОВ: @courses 📕Ит-книги бесплатно: https://t.me/addlist/BkskQciUW_FhNjEy Подпишись, если хочешь быть в числе тех, кого зовут в топовые проекты!

30 034

Repost from Machinelearning

✔️ В Пекине запустят первый в мире 4S-центр для роботов с воплощенным ИИ. По аналогии с автосалонами, робототехнический 4S будет предлагать полный цикл: продажи (Sales), сервис (Service), запчасти (Spare parts) и консультации/анализ (Surveys). Планируется зона с демонстрацией роботов в реалистичных сценариях – можно будет всё пощупать руками и увидеть их возможности в деле. Плюс создадут быструю сеть поставки комплектующих по стране и соберут профильную команду для сборки, ремонта и обслуживания машин. Первыми партнерами станут несколько лидеров сферы: UBTECH и Galaxea. Откроется центр в августе на базе промпарка в районе Ичжуан на юге столицы. english.news.cn ✔️ Браузер Dia выходит в бета-версию. The Browser Company открыл доступ к бета-версии браузера Dia (по инвайтам). Dia позиционируется как решение, где ИИ глубоко интегрирован в самую суть взаимодействия, он встроен прямо в рабочий процесс пользователя, избавляя от необходимости постоянно ходить на сайты ChatGPT или Claude. Dia построен на Chromium, так что интерфейс многим знаком. Главная фича — умная адресная строка: она работает и как поиск, и как чат-бот с ИИ. Помощник умеет искать в сети, суммировать загруженные файлы, автоматически переключаться между режимами. Можно даже спросить его о содержимом всех открытых вкладок или попросить составить черновик на их основе. Настройки производятся через диалог с ботом: можно задать тон, стиль письма, параметры для кода. Опция History (по желанию) позволяет браузеру использовать недельную историю просмотров как контекст для ответов. А функция Skills помогает создавать мини-скрипты — ярлыки для сложных настроек или действий. techcrunch.com ✔️ Mistral запускает вычислительную альтернативу облачным гигантам. Mistral AI анонсировала Mistral Compute - инфраструктурную платформу для разработки и запуска ИИ. Это полноценный приватный стек: от GPU и систем оркестрации до API и сервисов. На выбор любой формат, от bare-metal до полностью управляемой PaaS. Mistral Compute нацелен дать государствам, компаниям и научным центрам, ищущих альтернативу решениям из США или Китая, возможность самим строить ИИ-среду под свои нужды и полностью ею владеть. Платформа использует новейшие архитектуры NVIDIA, с доступом к десяткам тысяч GPU. Она создана командой с огромным опытом в HPC и обучении топовых ИИ-моделей. Ключевые акценты: устойчивость и суверенитет данных, инфраструктура соответствует строгим европейским нормам и работает на декарбонизированной энергии. mistral.ai ✔️ ByteDance анонсировала text-to-video модель Seedance 1.0. Seedance 1.0 - новая генеративная модель для создания видео, которая, по утверждениям ByteDance, превосходит конкурентов в точности выполнения запросов, качестве движений и резкости изображения. В тестах на Artificial Analysis она лидирует в задачах text-to-video и image-to-video, обходя Google Veo 3, Kuaishou Kling 2.0 и OpenAI Sora. Модель справляется с длинными сценами, сохраняя стабильность персонажей и переходов между ракурсами, но пока не поддерживает добавление звука. Seedance 1.0 генерирует 5-секундный Full HD-ролик за 41 секунду — это быстрее аналогов, хотя новый Google Veo 3 Fast может нивелировать это преимущество. Инструмент планируют внедрить в платформы Doubao и Jimeng. Целевая аудитория — от профессиональных видеомейкеров до обычных пользователей. seed.bytedance.com ✔️ Midjourney открыла публичное тестирование своей видеомодели. Midjourney объявила о начале открытого тестирования модели генерации видео по текстовым запросам. Задача тестирования собрать обратную связь для улучшения алгоритма. Создатели пригласили сообщество принять участие в онлайн-рейтинге сгенерированных роликов, присоединиться можно по ссылке. Пока некоторые образцы выглядят достойно и сохраняют фирменный стиль Midjourney, но в целом результаты пока нестабильны. Компания подчеркивает: это не финальная версия модели, а лишь первый шаг. Дополнительные сессии тестирования уже запланированы, но дату релиза и цену пока не раскрывают. midjourney.com @ai_machinelearning_big_data #news #ai #ml