Machinelearning

Открыть в Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Больше

Сеть:Machinelearning Россия1 262 Технологии и приложения326...

📈 Аналитический обзор Telegram-канала Machinelearning

Канал Machinelearning (@ai_machinelearning_big_data) языкового сегмента Русский является активным участником. Сейчас сообщество объединяет 297 311 подписчиков, занимая 326 место в категории Технологии и приложения и 1 262 место в регионе Россия.

📊 Показатели аудитории и динамика

С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 297 311 подписчиков.

Согласно последним данным от 15 июня, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило -6 639, а за последние 24 часа — -229, при этом общий охват остаётся высоким.

Статус верификации: Не верифицирован
Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 8.06%. В первые 24 часа после публикации контент обычно набирает 5.69% реакций от общего числа подписчиков.
Охват публикаций: В среднем каждый пост получает 23 972 просмотров. В течение первых суток публикация набирает 16 925 просмотров.
Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 186.
Тематические интересы: Контент сосредоточен на ключевых темах, таких как openai, claude, api, gemini, контекст.

📝 Описание и контентная политика

Автор описывает ресурс как площадку для выражения субъективного мнения:
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

Благодаря высокой частоте обновлений (последние данные получены 16 июня, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.

297 311

Подписчики

-22924 часа

-1 4417 дней

-6 63930 день

23 972

Просмотры поста

~ 16 92524 часа

~ 18 98848 часов

8.06%

Коэффициент вовлеченности

~ 6

Постов в день

Ads index

beta

Архив постов

297 301

🦾 Google DeepMind показала, как роботы учатся работать вместе с помощью обучения с подкреплением. Учёные из UCL, Google DeepMind и Intrinsic представили новый AI-алгоритм RoboBallet — систему, которая позволяет нескольким роботизированным манипуляторам работать синхронно и без столкновений в сложной производственной среде,. 🔹 В эксперименте участвовали 8 роботов, каждый из которых мог выполнять 40 разных задач в одном общем пространстве. 🔹 Роботы могли брать любую задачу в любом порядке — система сама решала, кому что поручить и как построить безопасные траектории. 🔹 Алгоритм обучался в симуляции, а затем сразу работал в новых условиях без дообучения (*zero-shot*). Пока решение работает только для задач перемещения (reaching), без учёта порядка выполнения или разных типов роботов. Однако архитектура гибкая — в будущем возможно добавление сложных задач, зависимостей и разнообразных роботов. Один алгоритм смог координировать целую команду, делая роботов гибкими и слаженными даже там, где они раньше не работали. 🟢 Подробнее: https://www.science.org/doi/10.1126/scirobotics.ads1204 @ai_machinelearning_big_data #google #robots #ai #rl

297 301

💰 Google TPUs - главный конкурент NVIDIA? Аналитики считают: если бы Google выделила бизнес по TPU-чипам вместе с лабораторией DeepMind, то объединённая компания могла бы стоить около $900 млрд. Пока этого не произойдёт, но сама цифра показывает масштаб. 📌 Что такое TPU и почему они важны 🟢Чипы, созданные специально для машинного обучения 🟢Их производительность — до 42,5 экзафлопс 🟢Сами чипы сопоставимы с NVIDIA по скорости и энергоэффективности 🟢 За полгода активность разработчиков в Google Cloud выросла на 96% , благодаря собственному железу 🔥 Новые поколения чипов - 6-е поколение Trillium уже пользуется высоким спросом - 7-е поколение Ironwood станет первым TPU, ориентированным на крупномасштабный inference — этап, когда модели реально используются после обучения Anthropic и xAI активно рассматривают переход на TPU, так как улучшенная поддержка через JAX делает их использование на больших масштабах заметно проще. Google уже заключила сделку с Fluidstack (Нью-Йорк) и ведёт переговоры с другими облачными провайдерами, которые раньше работали в основном с NVIDIA (например, Crusoe и **CoreWeave**). В итоге Google выходит в прямую конкуренцию с NVIDIA — и впервые за долгое время у «зелёного гиганта» появился серьёзный соперник. 🟢Новость: marketwatch. com/story/google-may-be-sitting-on-a-900-billion-gem-that-could-disrupt-nvidias-dominance-20662ec6 @ai_machinelearning_big_data #google #nvidia #tpu #deeplearning

297 301

На конференции South Hub ИИ-эксперты технологической платформы Авито озвучили тезис о переходе к новой эре — третьей революции знаний в истории человечества. Ее двигатель — открытые большие языковые модели, которые запустили аналог «золотой лихорадки». Андрей Рыбинцев, управляющий директор по ИИ «Авито», так описал ситуацию: «Теперь каждый энтузиаст, исследователь в университете, стартап может попробовать поэкспериментировать с большими языковыми моделями». На смену традиционным интерфейсам приходит принцип «озвучил проблему — получил решение». Это обесценивает целые категории софта: в перспективе один диалоговый агент заменит тысячи отдельных приложений. Профессия разработчика пересобирается с нуля. Вместо написания кода он становится архитектором, который ставит задачи ИИ-инструментам. Прототипирование, требовавшее недель командной работы, теперь укладывается в одни выходные. Главный сигнал — полная капитуляция технологического скептицизма. Даже самые осторожные эксперты признают революционный масштаб изменений. Как отметил технический директор «Авито» Андрей Венжега: «Настолько много может измениться сейчас, что наши рассуждения могут оказаться через два года очень наивными». Единственный точный прогноз: через пару лет сегодняшние представления о будущем покажутся до смешного устаревшими. Подкаст доступен на Youtube | VK-видео | Rutube | Аудиоверсия Подпишитесь на полезные каналы Авито

297 301

🎬 OpenAI снимает полнометражный мультфильм с помощью ИИ OpenAI поддерживает проект Critterz — первый полнометражный анимационный фильм, созданный преимущественно с применением генеративного ИИ. 📌 Задача проекта — доказать, что кино можно снимать в несколько раз быстрее и дешевле, чем в Голливуде: - вместо привычных 3 лет производство займёт всего 9 месяцев - бюджет — менее $30 млн (значительно меньше, чем обычно стоит производство подобных анимационных фильмов) - премьера намечена на Каннский кинофестиваль в мае 2026 года, после чего планируется мировой прокат Команда собирается привлечь живых актёров для озвучивания персонажей и нанять художников, которые подготовят эскизы. Эти материалы будут загружаться в инструменты OpenAI — включая GPT-5 и модели генерации изображений. ⚡️ Основная ставка делается на быстрые итерации: эскиз → генерация → правка → повторная генерация. Такой процесс должен заменить долгие и дорогие ручные пайплайны классической анимации. 🟢 Подробнее @ai_machinelearning_big_data #ai #openai #genai 🟢 Подробнее @ai_machinelearning_big_data #ai #openai #genai

297 301

🇪🇺 NEWS: ASML инвестирует €1.3B в Mistral Европейский чип-гигант ASML вложит €1.3 млрд в Series C раунд Mistral (€1.7B) и станет крупнейшим акционером стартапа. 💰 Оценка Mistral — €10 млрд ($11.7B) pre-money. Что значит *pre-money*? Это стоимость компании до привлечения новых инвестиций. То есть инвесторы договорились, что Mistral стоит €10 млрд, и только потом добавили ещё €1.7 млрд свежих денег. После этих вложений итоговая стоимость компании становится €11.7 млрд post-money. 🟢 Главное Союз лидеров: крупнейший поставщик оборудования для чипов (ASML) объединяется с самой быстрорастущей AI-лабораторией Европы (Mistral). Суверенность: Европа строит собственный стек — от чипов до моделей, снижая зависимость от США и Китая. Ресурсы для Mistral: свежие деньги для роста, доступ к управлению, громкая оценка для привлечения талантов и заключения крупных контрактов. 🟢Технический аспект ASML (Нидерланды) — единственный в мире производитель EUV-литографии (*Extreme Ultraviolet Lithography* — технология печати микросхем с использованием сверхкоротких волн ультрафиолета). Один аппарат стоит ~$180M и используется TSMC и Intel. Даже небольшие улучшения в производительности приносят огромные деньги. Модели Mistral могут помочь: - предсказывать дрейф инструментов, - ускорять калибровку, - выявлять дефекты в метрологических данных, - оптимизировать оптическую коррекцию и настройку масок. Сделка — это стратегический союз, который даёт Европе шанс закрепить лидерство и в AI, и в полупроводниках. 🟢 Подробнее @ai_machinelearning_big_data #ai #news #mistral #investments

297 301

🤖 XLeRobot — домашний робот за $660, который управляется с гейпада Xbox. XLeRobot — это открытый проект, который позволяет собрать настоящего двухрукого мобильного робота своими руками. Автор — студент Rice University Gaotian Wang, в проектеон сделал упор на доступность и практичность. 💡 Основное: - Цена сборки ≈ $660 — полноценный робот с двумя руками и колесной базой. - Можно собрать упрощённую версия за $250 на базе LeKiwi + SO-100, которая собирается быстрее. - В комплекте: URDF-модели, симуляция, управление через VR, Joy-Con или Xbox-геймпад. - Подходит для экспериментов в симуляции и переноса в реальный мир (**Sim2Real**). взаимодействия с окружающей средой. 📈 Популярность: проект уже собрал 1.7k+ звёзд и десятки форков на GitHub. XLeRobot — это недорогая и открытая платформа для тех, кто хочет попробовать себя в робототехнике, исследовать управление, симуляцию и AI-алгоритмы на реальном роботе. 🟢Репозиторий: github.com/Vector-Wangel/XLeRobot @ai_machinelearning_big_data #robotics #opensource #AI

297 301

📌BED-LLM: адаптивный сбор информации для LLM. Исследователи из Оксфорда и Apple представили BED-LLM, новый подход для улучшения способности LLM разумно и адаптивно собирать информацию от пользователя или другого внешнего источника. Суть подхода заключается в применении последовательного Байесова экспериментального дизайна к процессу генерации вопросов. Вместо промптинга система максимизирует ожидаемый прирост информации при каждом следующем вопросе. Алгоритм итеративно выбирает запросы, которые дают максимальную информацию о целевом параметре. Критический момент — правильная конструкция совместной модели распределения целевой переменной и ответов с учетом вопросов. Выбор между парой «приор-правдоподобие» и «данные-оценка» кардинально влияет на производительность. Итоговый выбор пал на на первом варианте, как более подходящем для случаев, когда пространство целевых гипотез сложнее пространства возможных ответов. Ключевая фишка BED-LLM в фильтрации гипотез с учетом истории диалога. Система не полагается только на контекстное обучение. Вместо этого алгоритм сначала сэмплирует кандидатов из распределения модели, а затем отфильтровывает несовместимые с историей варианты через проверку правдоподобия. 🟡Тесты Чтобы проверить метод в деле, его протестировали на классической игре "20 вопросов". В задаче по угадыванию знаменитостей результат на Mistral-Large поднялся с 14% при использовании стандартных промптов (Naive QA) до 91% с фреймворком BED-LLM. Упрощенный подход, основанный на максимизации энтропии показал промежуточный результат в 68%. Схожая картина и с другими моделями: Qwen2.5-72B при угадывании животных достигла 94% точности с BED-LLM против 85% у энтропии и всего 45% у Naive QA. А GPT-4o в тесте со знаменитостями показала рост с 45% до 86%. Второй тест метода провели на более абстрактной задаче - выявлении кинопредпочтений пользователя. Здесь вместо угадывания конкретного объекта модель должна была составить профиль вкусов пользователя, задавая ему вопросы с несколькими вариантами ответа. Качество рекомендаций, сгенерированных на основе этого профиля, оценивалось по шкале от 1 до 5. И здесь BED-LLM стабильно опережал конкурентов, выходя в лидеры уже к третьему вопросу.

Интересное наблюдение: простое использование предсказательной энтропии вместо полного ожидаемого прироста информации значительно ухудшает результаты. Многие предыдущие теории делали именно такое упрощение, считая энтропию правдоподобия константой. Эксперименты с BED показали, что это неоправданное допущение - вариативность ожидаемой условной неопределенности между вопросами может быть решающей для выбора хороших запросов.

🟡Arxiv @ai_machinelearning_big_data #AI #ML #Research #BayesianDesign

297 301

🔥 Успех в IT = скорость + знания + окружение Здесь ты найдёшь всё это — коротко, по делу и без воды. Пока другие ищут, где “подглядеть решение”, ты уже используешь самые свежие инструменты! Мл: t.me/machinelearning_ru Python: t.me/pythonl Linux: t.me/linuxacademiya Собеседования DS: t.me/machinelearning_interview C++ t.me/cpluspluc Docker: t.me/DevopsDocker Хакинг: t.me/linuxkalii Devops: t.me/DevOPSitsec Data Science: t.me/data_analysis_ml Javascript: t.me/javascriptv C#: t.me/csharp_1001_notes Java: t.me/java_library Базы данных: t.me/sqlhub Python собеседования: t.me/python_job_interview Мобильная разработка: t.me/mobdevelop Golang: t.me/Golang_google React: t.me/react_tg Rust: t.me/rust_code ИИ: t.me/vistehno PHP: t.me/phpshka Android: t.me/android_its Frontend: t.me/front Big Data: t.me/bigdatai МАТЕМАТИКА: t.me/data_math Kubernets: t.me/kubernetc Разработка игр: https://t.me/gamedev Haskell: t.me/haskell_tg Физика: t.me/fizmat 💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy Папка ML: https://t.me/addlist/2Ls-snqEeytkMDgy Папка FRONTEND: https://t.me/addlist/mzMMG3RPZhY2M2Iy 😆ИТ-Мемы: t.me/memes_prog 🇬🇧Английский: t.me/english_forprogrammers 🧠ИИ: t.me/vistehno 🎓954ГБ ОПЕНСОРС КУРСОВ: @courses 📕Ит-книги бесплатно: https://t.me/addlist/BkskQciUW_FhNjEy Подпишись, если хочешь быть в числе тех, кого зовут в топовые проекты!

297 301

📌Почему языковые модели галлюцинируют. OpenAI опубликовали исследование о причинах галлюцинации LLM. Галлюцинации - это не мистический сбой в сознании ИИ, а вполне предсказуемый побочный эффект его обучения. Представьте, что перед моделью стоит задача бинарной классификации - определить, является ли предложенное утверждение корректным или нет. Математическая выкладка в исследовании проста: уровень ошибок генерации как минимум в 2 раза превышает уровень ошибок классификации. Если модель не способна надежно отличить факт от вымысла, она неизбежно будет этот вымысел генерировать. 🟡Все начинается еще на претрейне. Даже на идеально чистых данных статистические цели обучения подталкивают модель к генерации ошибок. Особенно это касается фактов, которые редко встречаются в обучающей выборке. В работе вводится понятие singleton rate — доля фактов, которые появились в данных лишь один раз. Теоретический расклад показывает, что уровень галлюцинаций модели будет как минимум равен этой доле. Проще говоря, если 20% фактов о днях рождения в датасете встретились единожды, модель будет выдумывать дни рождения как минимум в 20% случаев. 🟡Эксперименты это подтверждают. Модель DeepSeek-V3, на просьбу назвать день рождения одного из авторов статьи, трижды выдала неверные даты: 03-07, 15-06 и 01-01. Ни одна из них не была даже близка к правильной (осенью). В другом тесте, где нужно было сосчитать количество букв D в слове DEEPSEEK, та же DeepSeek-V3 выдавала 2 или 3, а модели компании Марка Цукерберга и Claude 3.7 Sonnet доходили до 6 и 7. При этом базовые модели после претрейна часто показывают отличную калибровку. Например, у предобученной GPT-4 ожидаемая ошибка калибровки составляла всего 0.007, что говорит о высокой статистической адекватности ее предсказаний. Кто бы сомневался. 🟡Почему галлюцинации не исчезают после пост-тренинга и RLHF? Ответ на этот вопрос - в системе оценки. Большинство современных бенчмарков поощряют угадывание. Модели, по сути, постоянно находятся в режиме сдачи экзамена, где за правильный ответ дают 1 балл, а за пустой бланк или ответ я не знаю - 0. В такой системе оптимальная стратегия при неуверенности - только угадать. Любой шанс на правильный ответ лучше, чем гарантированный ноль. Эту гипотезу подтвердили анализом популярных оценочных наборов. В GPQA, MMLU-Pro, Omni-MATH, SWE-bench и HLE используется строго бинарная система оценки (правильно/неправильно). Возможности получить частичный балл за честное признание в незнании там просто нет. Из 10 рассмотренных в исследовании популярных бенчмарков только один, WildBench, присуждает частичные баллы за ответы формата я не знаю. Остальные же фактически наказывают модель за отказ галлюцинировать, создавая эпидемию штрафов за неуверенность и поощряя ее выдавать правдоподобную ложь. 🟡Что делать инженерам. OpenAI предлагает встраивать явные целевые уровни уверенности в рубрики, вводить поведенческую калибровку и оценивать модели по секциям с разными порогами уверенности. Еще рекомендуют включают мониторинг singleton-rate на корпусе, измерение вероятности важных ответов, комбинирование RAG с верификацией фактов и изменение лидербордов чтобы ответы я не знаю не штрафовались автоматически. 🔜 Читать статью полностью @ai_machinelearning_big_data #AI #ML #LLM #Research #OpenAI

297 301

✔️ Anthropic ужесточила региональные ограничения. Доступ к ИИ-моделям Anthropic будет запрещен организациям, которые более чем на 50% прямо или косвенно принадлежат компаниям из юрисдикций с ограниченным доступом. Новое правило действует независимо от того, где зарегистрирована и оперирует дочерняя структура. Обновление условий - ответ на лазейку, которая позволяла обходить ограничения через регистрацию филиалов в других странах. В Anthropic заявляют, что компании, подконтрольные авторитарным режимам, могут быть принуждены к сотрудничеству со спецслужбами и передаче данных. anthropic.com ✔️ OpenAI планирует производство собственных ИИ-чипов в партнерстве с Broadcom. OpenAI со следующего года запускает производство кастомных чипов. Проект реализуется совместно с Broadcom для того, чтобы снизить зависимость от Nvidia и обеспечить растущие потребности в вычислительных мощностях. Ранее глава Broadcom, Хок Тан упоминал о новом клиенте, который разместил заказ на $10 млрд. По данным нескольких источников, этим клиентом и является OpenAI. Сообщается, что чипы будут использоваться исключительно для внутренних операций компании и не поступят в свободную продажу. ft.com ✔️ Kimi Ai обновила модель K2. Новая версия м индексом 0905 получила двукратное увеличение контекстного окна со 128K до 256K токенов, улучшение агентных возможностей для написания кода, повышение качества генерации фронтенд-кода и увеличение скорости работы API до 60-100 токенов в секунду. Kimi K2 — это открытая модель с архитектурой MoE на 1 триллион общих и 32 миллиарда активных параметров. Версия 0905 уже доступна в официальных приложениях Kimi, а также для самостоятельного развертывания через репозитории Hugging Face и ModelScope. Kimi Ai в сети Х ✔️ Google Photos получил Veo 3 для Image-to-video. Google обновляет сервис Photos, интегрируя в него модель генеративного видео Veo 3. Теперь пользователи, пока только в США, могут превращать статичные изображения в короткие четырехсекундные ролики без звука. Функция находится во вкладке «Создать», где предлагаются опции «Легкое движение» и «Мне повезет!». Помимо оживления снимков, ИИ позволяет стилизовать фотографию под 3D-анимацию и также сохранить ее в формате видео. Для владельцев бесплатных аккаунтов установлено ежедневное ограничение на количество генераций, а подписчики планов Ultra и Pro получают расширенные лимиты. blog.google ✔️ RoboBallet: ИИ для автоматической координации промышленных роботов. Google DeepMind, Intrinsic и University College London разработали метод RoboBallet, предназначенный для автоматизации программирования групп промышленных роботов, который решает проблему трудоемкой ручной настройки. В основе - графовая нейронная сеть, обученная с подкреплением на миллионах симуляций. Роботы, задачи и препятствия представляются в виде узлов графа, что позволяет системе моделировать сложные взаимосвязи и находить оптимальные, бесконфликтные траектории движения для каждого манипулятора. Для работы системе достаточно CAD-файлов и общего описания задачи. В лабораторных тестах RoboBallet превзошел на 25% традиционные подходы и решения. Эффективность системы масштабируется: при увеличении числа роботов с 4 до 8, среднее время выполнения задачи сократилось на 60%. Несмотря на результаты, технология пока не тестировалась на реальных производственных линиях и имеет ограничения: она не справляется с разнотипными роботами или задачами со строгой последовательностью действий. intrinsic.ai @ai_machinelearning_big_data #news #ai #ml

297 301

🚀 Команда Qwen представила Qwen3-Max-Preview (Instruct) — свою крупнейшую модель на сегодняшний день, с более чем 1 триллионом параметров По бенчмаркам Qwen3-Max-Preview опережает предыдущий флагман Qwen3-235B-A22B-2507. Внутренние тесты и первые отзывы пользователей говорят о том, что модель стала сильнее в диалогах, агентных задачах, следовании инструкциям и обладает более широкими знаниями. Qwen обещают очень скоро выпустить ещё что-то интересное. Qwen3-Max-Preview уже доступна в Qwen Chat и через Alibaba Cloud API. 🟢Qwen Chat: https://chat.qwen.ai 🟢Alibaba Cloud API: https://modelstudio.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3-max-preview @ai_machinelearning_big_data #AI #Qwen3 #LLM #AlibabaCloud #QwenChat

297 301

🌟 InfoSeek: синтез данных для deep‑research с формализацией HCSP. BAAI представила InfoSeek — открытую методику синтеза данных и учебный контур для глубоких исследований. Задачи такого класса выходят за рамки обычного извлечения фактов: модель должна раскладывать вопрос на подзадачи, координировать многошаговое рассуждение и проверять ответы по источникам.

Эти задачи формализуются как HCSP — иерархические задачи удовлетворения ограничений, решение которых возникает только при последовательном сужении кандидатов на нескольких уровнях, где каждый внутренний узел сам является подзадачей, а зависимость между узлами образует дерево исследования.

Базовая идея проста: данные строятся вокруг древа исследования. Вершины - сущности или атомарные факты, ребра - проверяемые отношения из Википедии и открытых страниц. Алгоритм синтеза явно управляет структурой, чтобы исключить недоопределенность или ранние "короткие замыкания". В HCSP ответ формально равен пересечению множеств, заданных текущими ограничениями и рекурсивными подвопросами; в терминах дерева корень — финальный ответ. Такой подход не только задаёт глубину и ширину рассуждения, но и делает каждый промежуточный шаг проверяемым по конкретным утверждениям. 🟡Синтез выполняет связка из 2 агентов. Планировщик контролирует глобальную сложность, выбирая цель и тип расширения, а Браузер добывает факты и ссылки из страницы сущности. 4 операции покрывают весь жизненный цикл: 🟢Инициализация из "якоря"; 🟢"Размытие родителя" - добавление нескольких независимых условий, которые в совокупности определяют уникальный ответ без включений между кандидатами; 🟢Вертикальное углубление по гиперссылке для увеличения высоты дерева; 🟢Генерация текста вопроса лишь после того, как каждый узел имеет достаточный набор проверяемых ограничений и достигнуты заданные метрики сложности. Качество контролируется по 2 осям: сложность и проверяемость. Сначала вопросы прогоняются "в лоб": если мощная базовая модель отвечает правильно без поиска, образец исключается, так было отсеяно около 2%. Затем проверяется решаемость на фиксированном наборе страниц с примесями-дистракторами и все двусмысленное удаляется. Итог: датасет с 50 тыс. пар вопрос–ответ и 16,5 тыс. траекторий размышлений с метками извлечения. 🟡Эксперименты. Тесты показали, что InfoSeek переносится за пределы домашнего домена. На классических наборах для извлечения фактов и мульти‑hop вопросов компактная модель InfoSeeker‑3B опережает типовые RAG и агентные пайплайны. На BrowseComp‑Plus с фиксированным корпусом 100K страниц и BM25 точность достигает 16,5% при среднем 8,24 обращения к поиску, что выше, чем у Gemini 2.5 Flash, Sonnet 4 и GPT‑4.1 и значительно выше Qwen3‑32B и Search‑R1‑32B. Замена обучающего набора NQ+HQA на InfoSeek поднимает точность с 3,0% до 16,5% и делает запросы осмысленно более частыми. ▶️ Из готового у проекта есть датасет, техотчет, конструктор древа данных и код для SFT- трейна. В планах - код RL и публикация весов InfoSeeker‑3B. 📌Лицензирование: Apache 2.0 License. 🟡Датасет 🟡Arxiv 🖥GitHub @ai_machinelearning_big_data #AI #ML #DeepResearch #Dataset #InfoSeek

297 301

🚀 Decart представила Oasis 2.0 — AI-модель, которая позволяет менять игровые миры и стили в реальном времени: 1080p, 30fps. Примеры выглядят кафово: Minecraft в швейцарских Альпах, на фестивале Burning Man или с альтернативными наборами персонажей. Игровой мир можно менять «на лету», без подргузки. Демку можно попробовать в вебе или использовать как мод для Minecraft. 🟢 Демо и мод: http://oasis2.decart.ai/demo @ai_machinelearning_big_data #AI #Gaming #Minecraft #Oasis2 #DecartAI #GameDev #Mods #AIDemo #RealtimeAI

297 301

🌟 На Hugging Face вышла обзорная статья об открытых ML-датасетах Автор новостного ресурса Daily Dose of Data Science собрал самые интересные релизы крупных датасетов и моделей. Среди них — Yambda-5B от команды Яндекса, крупнейший в мире открытый музыкальный рекомендательный датасет. В Yambda-5B 4,79 млрд обезличенных взаимодействий: прослушивания, лайки и дизлайки треков. Датасет уже привлек внимание мировых исследователей и обещает стать важным инструментом для развития рекомендательных систем. 🔗 Подробнее @ai_machinelearning_big_data #ai #ml #dataset

297 301

✔️ Projects в ChatGPT стали доступны для всех. Функция "Проекты" (Projects) теперь доступна не только по подписке, но и для бесплатных пользователей ChatGPT. "Проекты" работают как цифровые рабочие пространства, где можно объединять чаты, справочные файлы и пользовательские инструкции, связанные с одной долгосрочной задачей. Основная фишка "Проектов" - встроенная память. ChatGPT запоминает контекст всех разговоров и документов в рамках конкретного проекта. Вместе с этим OpenAI увеличила лимиты на загрузку файлов (до 5 для бесплатных аккаунтов, Plus до 25, а Pro до 40), добавила элементы управления памятью для каждого проекта и возможность их кастомизации. Обновление уже доступно в веб-версии и в приложении для Android, релиз для iOS ожидается в ближайшее время. OpenAI в сети X ✔️ DeepSeek работает над автономным ИИ-агентом. Китайский стартап разрабатывает платформу на базе агентного ИИ. Новая система проектируется для самостоятельного выполнения многошаговых задач от имени пользователя, требуя лишь минимальных начальных инструкций. Ключевой особенностью ИИ-агента станет способность к самообучению и улучшению своих действий на основе предыдущего опыта. По информации от источников, знакомых с планами компании, основатель DeepSeek Лян Вэньфэн нацелен на запуск нового программного обеспечения уже в четвертом квартале этого года. bloomberg.com ✔️ CoreWeave покупает OpenPipe. Облачный провайдер CoreWeave объявил о приобретении стартапа OpenPipe. Компания помогает разработчикам создавать кастомизированные ИИ-агенты с использованием RL через свой популярный опен-сорс инструментарий ART (Agent Reinforcement Trainer). Эта сделка продолжает стратегию CoreWeave по расширению технологического стека, начатую с покупки платформы Weights & Biases в марте. Вся команда и клиентская база OpenPipe переходят в CoreWeave. Финансовые условия сделки стороны не раскрывают. businesswire.com ✔️ OpenAI запускает платформу для трудоустройства и сертификации ИИ-специалистов. Компания анонсировала создание собственной экосистемы для найма, которая объединит ИИ-платформу для поиска работы и расширенную программу сертификации, чтобы напрямую связать работодателей с кандидатами, чьи навыки в области ИИ можно верифицировать. Сама платформа будет использовать модели для сопоставления компетенций соискателей с требованиями вакансий, опираясь на собственную таксономию навыков. Система сертификации вырастет из OpenAI Academy и предложит несколько уровней квалификации: от базовой ИИ-грамотности до продвинутого промпт-инжиниринга. Процесс обучения и сдачи экзаменов будет интегрирован в режим Study непосредственно в ChatGPT. Для корпоративных клиентов предусмотрена интеграция через SSO и API, а также механизм обратной связи для адаптации учебных курсов под реальные запросы рынка. openai.com ✔️ NVIDIA и Университет Эссекса провели крупнейшую в истории симуляцию в статистической физике. Инженеры из Университет Эссекса при поддержке NVIDIA установили новый мировой рекорд в компьютерном моделировании. Эксперимент позволил впервые на практике наблюдать термодинамический предел — ключевое понятие, объясняющее, как свойства материи проявляются в макроскопических системах. Для симуляции использовалась стоечная архитектура NVIDIA GB200 NVL72, которая позволила смоделировать поведение до 70 триллионов взаимодействующих частиц. Система достигла рекордной производительности почти в 115 000 обновлений решетки в наносекунду. Результаты исследования, опубликованные в Physical Review Research, могут ускорить разработку новых дисплеев, магнитных материалов и дать более глубокое понимание фундаментальных свойств материи. essex.ac.uk @ai_machinelearning_big_data #news #ai #ml

297 301

🚀 Google выпустила EmbeddingGemma: лёгкую open-source модель для текстовых эмбеддингов. Модельку можно запускать прямо на телефоне или ноутбуке, без интернета и с сохранением приватности. EmbeddingGemma - новый лидер среди открытых многоязычных моделей <500M на MTEB 🟢Что внутри: • 308M параметров, но по качеству обгоняет все модели до 500M (по MTEB) • Работает очень быстро: менее 15 мс на EdgeTPU (256 токенов) • Понимает 100+ языков • Размер эмбеддингов можно уменьшать (768 → 128) без потери качества • Контекст до 2000 токенов • Уже доступна в Sentence-Transformers, LangChain, llama.cpp, transformers.js, Weaviate и др. 🟠Blog: https://developers.googleblog.com/en/introducing-embeddinggemma/ 🟠Models: https://huggingface.co/collections/google/embeddinggemma-68b9ae3a72a82f0562a80dc4 @ai_machinelearning_big_data #AI #Google #Gemma #EmbeddingGemma #ML #DeepLearning #LLM #NLP

297 301

🔥 NVIDIA представила Universal Deep Research (UDR) UDR — настраиваемый агент для глубокого ресёрча, который «оборачивается» вокруг любого LLM. Почему это важно: 🟠**Гибкая настройка агента без кода** — UDR не ограничивает жёсткими сценариями, как большинство тулзов. 🟠Можно создавать, редактировать и комбинировать стратегии поиска и анализа. 🟠В репо есть примеры стратегий (minimal, expansive, intensive), но главная сила — в кастомизации под свои задачи. По сути, это гибкий ресёрч-агент, который можно адаптировать под любой рабочий процесс. 🟢Project: https://research.nvidia.com/labs/lpr/udr 🟢Code: https://github.com/NVlabs/UniversalDeepResearch 🟢Lab: https://nv-dler.github.io @ai_machinelearning_big_data #NVIDIA #UDR #UniversalDeepResearch #AI #LLM #ResearchAgent #AIAgents #DeepResearch

297 301

🌟 POINTS-Reader: компактная VLM для OCR без дистилляции и сложной обвязки. Tencent опубликовали довольно интересный проект - POINTS-Reader. Это VLM для OCR английского и китайского языков на 4 млрд. параметров на базе Qwen2.5-3B-Instruct, которая обошла GPT-4o и Gemini на бенче OmniDocBench. POINTS-Reader - это философия предельной простоты c прямолинейным конвейером: на вход подается изображение документа и фиксированный промпт, а на выходе получается извлеченный текст. Никаких этапов постобработки, скриптов для очистки или дополнительных моделей — результат сразу готов к использованию. Помимо скромной базовой Qwen2.5, в POINTS-Reader использовали умеренный по нынешним меркам Vision Transformer - NaViT на 600 млн. параметров. И это осознанный инженерный шаг в угоду простоте и производительности. Современные фреймворки для инференса, будь то SGLang или vLLM, в первую очередь оптимизированы под LLM-часть, из-за чего громоздкий ViT становится узким местом и серьезно замедляет всю систему. Такая компактная архитектура превосходно показала себя на тестах. На комплексном OmniDocBench модель набрала 0.133 для английских документов и 0.212 для китайских. Эти цифры ставят POINTS-Reader в один ряд с гораздо более тяжелыми и сложными системами. Секрет проекта кроется в двухэтапной стратегии подготовки данных, которая полностью отказывается от дистилляции знаний у моделей-учителей.

На первом этапе модель получает базовые навыки OCR, обучаясь на синтетике. Дальше начинается самый интересный этап — непрерывная самоэволюция. Модель используется для генерации аннотаций на реальных документах, после чего лучшие из полученных образцов используются для ее дообучения. Этот итеративный процесс позволяет постоянно повышать качество как самой модели, так и генерируемых ею данных.

Этот метод к самосовершенствованию описан в техотчете как очень гибкий и применимый, по словам Tencent, практически к любой другой архитектуре. 🟡Как в любом проекте - есть нюансы. Модель пока не очень уверенно справляется со сложными макетами, вроде газетной верстки, что может приводить к повторению или пропуску контента. Аналогичные трудности возникают и при обработке рукописного текста, например, в чеках или заметках. Кроме того, на данный момент POINTS-Reader поддерживает только английский и китайский языки. ▶️ Запустить эту прелесть модель можно на Transformers или в SGLang. Поддержку vLLM обещают добавить. 🟡Модель 🟡Arxiv 🖥GitHub @ai_machinelearning_big_data #AI #ML #VLM #POINTSReader #Tencent

297 301

big tech night — это «ночь музеев» в мире IT, где Яндекс, Сбер, X5, Т-Банк и Lamoda впервые приглашают за кулисы. Формат, придуманный в Яндексе, для тех, кто уже в IT или только стремится туда попасть. Здесь можно увидеть, как создаются технологии, меняющие окружающую среду, познакомиться с коллегами, обменяться опытом, задать неудобные вопросы и почувствовать себя частью комьюнити. Вас ждут доклады, иммерсивные экскурсии и атмосфера IT-андеграунда. А если вы не в Москве, подключайтесь к онлайн-студии с двумя потоками — от серьезных дискуссий для гиков до лампового ночного шоу с историями из жизни. Когда: 12 сентября. Где: Москва или онлайн. Регистрация - здесь.

297 301

✔️ Apple продолжает терять ИИ-таланты. Apple накрыла волна увольнений ведущих инженеров из ИИ-подразделения. Jian Zhang, возглавлявший исследования ИИ в области робототехники, перешел к Марку Цукербергу. За ним последовали еще 3 ключевых сотрудника из команды Foundation Models, которая занималась разработкой платформы Apple Intelligence. Всего, за последнее время, команда потеряла около 10 человек. Основными причинами ухода называют как агрессивный наем со стороны конкурентов, предлагающих огромные зарплаты, так и внутренние проблемы. Низкий моральный дух в команде связывают со слабой реакцией на анонс Apple Intelligence и возможным решением компании использовать сторонние ИИ-модели вместо собственных разработок. bloomberg.com ✔️ В NotebookLM добавили 3 новых аудиорежима. ИИ-платформа для работы с заметками NotebookLM получила крупное обновление аудиофункций. Теперь сервис может генерировать на основе пользовательского контента аудио-дорожки в 3 новых форматах. Режим «Brief» создает быструю двухминутную аудиосводку по ключевым идеям. В режиме «Critique» два ИИ-собеседника анализируют текст, выступая в роли редакторов. Самый необычный формат — «Debate», который имитирует спор с противоположными точками зрения для стресс-теста идей. Кроме того, добавили новые мужские и женские голоса, чтобы дать пользователям больше возможностей для персонализации. NotebookLM в сети Х ✔️ ElevenLabs обновила модель генерации звуков. Этот релиз - вторая версия модели SFX для генерации звуковых эффектов по текстовому описанию. В v2 повысили качество звука и частотe дискретизации до 48 кГц, а максимальная длительность увеличена с 22 до 30 секунд. Добавилась возможность бесшовно создавать зацикленные звуки, что особенно полезно для фоновых эмбиент-дорожек. Генерация доступна как через веб-интерфейс, так и по API. Обновление затронуло и связанный инструмент SB-1 Soundboard — браузерную звуковую панель, которая теперь также поддерживает модель v2 и получила поддержку MIDI. Новые звуковые эффекты доступны в форматах MP3 и WAV на всех тарифных планах, включая бесплатный. ElevenLabs в сети Х ✔️ Amazon запустил поиск товаров по видео в реальном времени. Amazon представил функцию Lens Live, которая обновляет визуальный поиск в мобильном приложении. Теперь пользователям не нужно делать снимок — достаточно навести камеру на объект, и система в реальном времени начнет показывать совпадающие или похожие товары из каталога. Прямо в интерфейсе камеры можно сфокусироваться на конкретной вещи, добавить ее в корзину или список желаний. В Lens Live интегрирован ИИ-ассистент Rufus, который предлагает краткие сводки о товаре и генерирует уточняющие вопросы. Технически решение работает на базе легковесной on-device CV-модели для распознавания объектов. Для сопоставления с базой данных Amazon применяется модель глубокого обучения с использованием Amazon OpenSearch и SageMaker. Функция уже доступна части пользователей в США на iOS. aboutamazon.com ✔️ Microsoft создала аналоговый оптический компьютер. Microsoft совместно с банком Barclays разработала архитектуру аналогового оптического компьютера (AOC) для решения задач оптимизации и ИИ. Согласно исследованию, опубликованному в Nature, новая система решает "проблему Фон Неймана", объединяя вычисления и память, и не нуждается в цифро-аналоговых преобразованиях. Расчетная производительность AOC - 500 TOPS на ватт при 8-битной точности. Это делает его более чем в 100 раз энергоэффективнее топовых графических процессоров. Система построена на базе доступных компонентов: проекторы, линзы и сенсоры, а вычисления производятся за счет изменения интенсивности проходящего света. Microsoft планирует поделиться с научным сообществом алгоритмом-решателем и цифровым двойником установки для дальнейшего изучения технологии. news.microsoft.com @ai_machinelearning_big_data #news #ai #ml