Machinelearning

Открыть в Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Больше

Сеть:Machinelearning Россия1 261 Технологии и приложения324...

📈 Аналитический обзор Telegram-канала Machinelearning

Канал Machinelearning (@ai_machinelearning_big_data) языкового сегмента Русский является активным участником. Сейчас сообщество объединяет 297 513 подписчиков, занимая 324 место в категории Технологии и приложения и 1 261 место в регионе Россия.

📊 Показатели аудитории и динамика

С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 297 513 подписчиков.

Согласно последним данным от 14 июня, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило -6 744, а за последние 24 часа — -170, при этом общий охват остаётся высоким.

Статус верификации: Не верифицирован
Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 8.03%. В первые 24 часа после публикации контент обычно набирает 5.69% реакций от общего числа подписчиков.
Охват публикаций: В среднем каждый пост получает 23 912 просмотров. В течение первых суток публикация набирает 16 939 просмотров.
Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 186.
Тематические интересы: Контент сосредоточен на ключевых темах, таких как openai, claude, api, gemini, контекст.

📝 Описание и контентная политика

Автор описывает ресурс как площадку для выражения субъективного мнения:
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

Благодаря высокой частоте обновлений (последние данные получены 15 июня, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.

297 513

Подписчики

-17024 часа

-1 4767 дней

-6 74430 день

23 912

Просмотры поста

~ 16 93924 часа

~ 18 95348 часов

8.03%

Коэффициент вовлеченности

~ 5

Постов в день

Ads index

beta

Архив постов

297 391

⚡️ OpenAI представила GPT-5.3-Codex-Spark. Это облегченная высокоскоростная версия GPT-5.3-Codex со скоростью генерации больше 1000 токенов в секунду, окном в 128k, которая работает на ускорителях Cerebras Wafer Scale Engine 3. OpenAI называет ее моделью для кодинга в реальном времени. Чтобы первый токен отдавался в 2 раза быстрее, чем на Сodex, перетряхнули всю архитектуру: поменяли железо, оптимизировали сеть и перешли на постоянный коннект через WebSocket. Если есть подписка ChatGPT Pro - уже можно пробовать в VS Code или CLI. @ai_machinelearning_big_data #news #ai #ml

297 391

✔️ Anthropic зафиксировала у Opus 4.6 опасную агентную активность. В свежем отчете о рисках саботажа компания раскрыла детали поведения Claude Opus 4.6. При тестировании в среде computer use ИИ проявлял излишнюю инициативу: отправлял несанкционированные письма и агрессивно пытался получить токены аутентификации без ведома оператора. Интересен выявленный феномен «answer thrashing». Во время обучения модель иногда впадала в циклы спутанных рассуждений: она вычисляла правильный ответ, но в итоговый вывод намеренно выдавала неверное значение. Также отмечены случаи, когда следуя цели быть максимально полезным, модель оказывала содействие в запросах по разработке химоружия. Несмотря на тревожные прецеденты, Anthropic оценивает риск как очень низкий и заверяет, что это побочный эффект: модель пыталась выполнить задачу любыми доступными средствами, что поддается корректировке через промпт-инжиниринг. anthropic.com ✔️ OpenAI использует спецверсию ChatGPT для поиска источника слива инсайдов. Компания развернула модифицированную версию чат-бота для выявления источников внутренних утечек. Механизм работы прост, но эффективен: когда в прессе появляется утечка, служба безопасности загружает текст статьи в эту систему. Эта версия ChatGPT имеет расширенные права доступа и анализирует корпоративную переписку в Slack, электронную почту и внутренние документы. Нейросеть сопоставляет факты из утечки с цифровыми следами сотрудников и составляет список подозреваемых, имевших доступ к целевой информации. Пока неизвестно, был ли кто-то наказан по итогу работы этого алгоритма, техническая база для него есть. Недавно OpenAI анонсировала внутреннего ИИ-агента, который выполняет глубокий анализ корпоративных данных по запросам. theinformation.com ✔️ Microsoft сокращает зависимость от OpenAI и обещает AGI к концу года. Глава Microsoft AI Мустафа Сулейман анонсировал курс на полную самодостаточность в сфере ИИ. Редмондский гигант переходит к агрессивной разработке собственной инфраструктуры и созданию моделей. Для достижения этой цели Microsoft выделяет беспрецедентные ресурсы: капитальные затраты в текущем финансовом году достигнут $140 млрд. Они пойдут на вычислительные мощности гигаваттного класса с целью создать корпоративный AGI. Ожидается, что модели Microsoft будут представлены в этом году, а в течение 18 месяцев эти технологии смогут автоматизировать значительную часть задач «белых воротничков». ft.com ✔️ Xiaomi опубликовала VLA-модель Xiaomi-Robotics-0 для управления роботами. Робототехническая команда Xiaomi выложила в открытый доступ VLA-модель с 4,7 млрд параметров на базе Qwen3-VL-4B-Instruct. Система заняла первое место в бенчмарках LIBERO и CALVIN, обойдя 30 конкурентных решений. Фишка - в разделении зон ответственности. VLM обрабатывает инструкции и пространственную логику, а DiT отвечает за генерацию непрерывных действий. Такой подход устраняет задержки, вызывающие рывки при движении манипуляторов, а инференс возможен в реальном времени на потребительских GPU. В полевых тестах двурукий робот под управлением новой модели показал стабильную координацию при выполнении длительных задач. Веса модели и код опубликованы на GitHub и Hugging Face. xiaomi-robotics-0.github.io ✔️ Илон Маск раскрыл планы объединенной xAI. Компания опубликовала 45-минутную запись общего собрания, где Маск обрисовал будущее ИИ-лаборатории. Визионерская часть стратегии включает строительство заводов на Луне и развертывание орбитальных дата-центров, которые смогут получать энергию напрямую от Солнца. Внутри xAI ждут структурные изменения, она разделяется на 4 команды: разработка Grok, создание систем для генерации кода, видеогенератор Imagine и Macrohard - проект полной компьютерной автоматизации. Последнее направление, название которого иронично обыгрывает Microsoft, ставит перед собой наиболее амбициозные цели. По словам Маска, системы Macrohard в будущем должны достичь уровня, позволяющего автономно проектировать ракетные двигатели. xAI в сети Х

297 391

⚡️ Gemini 3 Deep Think - ИИ, который решает задачи уровня олимпиад и топ-программистов Новые модели всё меньше похожи на “чат-ботов” и всё больше - на инструменты для серьёзного анализа. Deep Think - пример такого перехода от теории к реальным сложным задачам. Что показывает модель: - State-of-the-art на ARC-AGI-2 - одном из самых сложных тестов на абстрактное мышление - Новый результат на Humanity’s Last Exam - задачи высшей сложности по математике, науке и инженерии - 3455 Elo на Codeforces - уровень сильных спортивных программистов - Результаты золотого уровня на письменных этапах Олимпиад-2025 по физике и химии Модель может: - разбирать сложные технические задачи - помогать в исследованиях - анализировать инженерные решения - работать как партнёр для глубокого анализа https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-deep-think/ @ai_machinelearning_big_data

297 391

✔️ Anthropic прокачала бесплатный Claude: генерация файлов, интеграции и skills. Anthropic объявила об обновлении бесплатного тарифа. Начиная с сегодняшнего дня, пользователи без подписки могут создавать и редактировать документы офисных форматов (Excel, PowerPoint, Word) и PDF. За генерацию файлов отвечает Sonnet 4.5. Также открыт доступ к инструментам автоматизации: сonnectors связывает чат-бота со сторонними сервисами, а skills учит Claude повторяющимся сценариям на загружаемых наборах инструкций под конкретные задачи. Среди других улучшений - увеличенная длина диалогов, интерактивные ответы и доработанный поиск. ClaudeAI в сети Х ✔️ OpenAI обновила GPT-5.2 Instant: ответы стали четче. OpenAI выпустила апдейт для модели GPT-5.2 Instant. Основной упор сделали на повышение качества генерации: тон ответов стал более взвешенным, а в инструкциях и советах самая важная информация теперь выносится в начало текста. Instant - это модель без ризонинга. В ChatGPT она выбирается вручную или срабатывает автоматически, когда внутренний роутер определяет задачу как простую либо если у пользователя закончились лимиты на рассуждающие версии. Обновление уже доступно в веб-интерфейсе ChatGPT и через API по алиасу gpt-5.2-chat-latest. openai.com ✔️ Prime Intellect запустила full-stack платформу для обучения и деплоя моделей. Платформа Prime Intellect Lab - это комплексное решение для пост-трейна, объединяющее создание сред, обучение, оценку и инференс в единый цикл. Lab работает не только с родной моделью INTELLECT‑3, но и с open‑source‑решениями от  Nvidia,  Qwen  и  Hugging Face. Сердцем системы стала концепция Environments — это наборы данных и метрик, с помощью которых можно проводить RL, генерировать синтетические выборки или оптимизировать промпты. На старте доступен режим Agentic RL, а поддержка SFT запланирована на ближайшие обновления. Под капотом - оркестратор с поддержкой multi‑tenant LoRA, что позволяет нескольким пользователям делить компьют и оплачивать обучение по объему токенов. За время закрытой беты в Lab было проведено свыше 3000 тренировочных сессий. primeintellect.ai ✔️ Poetiq побила рекорды в HLE и SimpleQA. Команда Poetiq отчиталась о достижении новых SOTA-результатов на сложнейших тестах HLE и SimpleQA. Рецепт успеха - в собственной мета-системе, которая дирижирует работу топовых моделей без привязки к конкретному семейству и динамически комбинирует их ответы. В HLE, требующем глубокого рассуждения и работы с инструментами, Poetiq достигла точности 55,0%, улучшив предыдущий рекорд на 2%. В тесте на фактологическую точность SimpleQA результат составил 77,3% (+5,2%). Кстати, говорят, что включение Claude Opus 4.6 сильно бустанула итог. Разработчики Poetiq считают, что LLM знают многое, но часто дают неточные ответы. Их обвязка помогает автоматически подбирать стратегии извлечения информации и выполнять перекрестную проверку, чтобы снижать число галлюцинаций и повышать достоверность выводов. poetiq.ai ✔️ Из xAI ушел еще один сооснователь. Джимми Ба, один из 12 учредителей ИИ-стартапа Илона Маска, объявил об уходе из компании. Ранее он работал в Университете Торонто и учился у пионера глубокого обучения Джеффри Хинтона. С уходом Ба из xAI уволились ровно половина первоначального состава основателей: проект в разное время покинули Игорь Бабушкин, Тони Ву, Кайл Косье, Грег Янг и Кристиан Шегеди. В своем прощальном обращении Ба рассказал, что целью xAI остается продвижение человечества по "шкале Кардашева" и сделал смелый технический прогноз: по его мнению, циклы рекурсивного самосовершенствования могут стать реальностью уже в ближайший год. Cам Джимми решил, как он выразился, «перекалибровать свой градиент» и сосредоточиться на общей картине развития технологий вне рамок одной компании. Jimmy Ba в сети Х @ai_machinelearning_big_data #news #ai #ml

297 391

⚡️ GLM-5 выкатили в опен-сорс. Не прошло и суток с момента релиза, а Zhipu AI выложила веса GLM-5 и любезно поделилась проведенными бенчмарками. Архитектура пятого поколения построена на MoE: 744 млрд. общих параметров при активных 40 млрд. Модель учили на 28,5 трлн. токенов и она получила контекстное окно в 200 тыс. токенов. GLM-5 ориентирован на 5 доменов: кодинг, рассуждение, агентные сценарии, генеративное творчество и работа с длинным контекстом. Для эффективной обработки длинных последовательностей интегрирован механизм Dynamically Sparse Attention от DeepSeek, он позволяет избежать квадратичного роста копьюта без потери качества. По бенчмаркам GLM-5 занимает 1 место среди open-source моделей: 77,8% на SWE-bench Verified, лидирует на Vending Bench 2, BrowseComp и MCP-Atlas, а в задачах агентного кодирования и рассуждений вплотную подбирается к Claude Opus 4.5 и GPT-5.2. Вместе с моделью, авторы предлагают Z Code — собственную агентную IDE с поддержкой параллельной работы нескольких агентов над одной задачей. Локальный деплой поддерживается vLLM и SGLang, а также non-NVIDIA чипами: Huawei Ascend, Moore Threads, Cambricon (через квантование и оптимизацию ядер). Если вам негде поднять модель локально, она доступна через платформу chat.z.ai, API и на OpenRouter. Квантованные версии пока сделали только Unsloth, традиционно - полный набор от 1-bit до BF16. И да, стэлс-модель PonyAlpha на OpenRouter - это она и была. 📌Лицензирование: MIT License. 🟡Статья 🟡Модель 🟡GGUF 🖥GitHub @ai_machinelearning_big_data #AI #ML #LLM #GLM5 #ZAI

297 391

⚡️ ZAI релизнули GLM-5. Zhipu AI выкатила в своем он-лайн сервисе chat.z.ai новую языковую модель GLM-5. Официальных спецификаций на данный момент нету, но по слухам, масштаб и эффективность нового флагмана удвоены, а контекстное окно достигает 200 тыс. токенов. Первые пользователи отмечают неплохие способности модели в написании кода и логическом выводе. @ai_machinelearning_big_data #news #ai #ml

297 391

⚡️ Cowork стал доступен на Windows. Пользователи Windows теперь могут использовать все возможности Cowork: прямой доступ к файлам, выполнение многошаговых задач, поддержку плагинов и всех коннекторов MCP. Ранее этот функционал был эксклюзивом для яблочной платформы. Попутно Anthropic представила гибкую систему инструкций. Вы можете задать глобальные предпочтения: тон, формат ответов или описание своей роли, они будут применяться ко всем чатам. Также появились инструкции уровня папок: они активируются автоматически, когда вы работаете в конкретной директории. Обновлять эти настройки можно прямо в ходе диалога, не копаясь в меню. Инструмент все еще в стадии research preview и открыт для всех пользователей платных тарифов. Для доступа достаточно скачать свежую версию клиента с сайта. @ai_machinelearning_big_data #news #ai #ml

297 391

✉️ Вам приглашение на 35-летний юбилей Python 🐍🎉 Python уже совсем взрослый — и мы отмечаем это уютной конференцией вместе с комьюнити: докладами, интерактивами и праздничной атмосферой. 📍 Встречаемся в пятницу, 20 февраля, в 15:30 — в московском офисе Сбера и онлайн. В программе: 🔹 Доклады от топовых спикеров — обсудим будущее Python, ИИ в кодинге, мутационное тестирование и многое другое. 🔸 Интерактивные зоны и праздничная атмосфера — кодинг-активности, нетворкинг и, конечно, торт 🎂 Проведём этот день вместе — в офисе или онлайн. Ждём вас 20 февраля в 15:30! Регистрация по ссылке. 👈

297 391

✔️ Глава команды безопасности Anthropic покидает компанию. Мринанк Шарма, руководитель Safeguards Research Team в Anthropic в прощальном письме объяснил, что его этические принципы все сильнее расходятся с направлением, в котором развивается индустрия ИИ - корпоративная среда создает давление и вынуждает специалистов откладывать по‑настоящему важные вещи в сторону. Шарма работал в Anthropic с  2023  года и курировал проекты по защите моделей - от конституционных фильтров до систем предотвращения джейлбрейка. Теперь он планирует получить степень по литературе и сосредоточиться на поэзии параллельно с наукой. Mrinank Sharma в сети Х ✔️ OpenAI отказалась от бренда «io» Отказ от названия «io» для линейки устройств подтвержден судебными документами, поданными в рамках спора о нарушении товарного знака со стартапом iyO. По словам вице-президента Питера Велиндера, OpenAI пересмотрела стратегию нейминга и решила полностью отказаться от проблемного бренда в маркетинговых и коммерческих материалах. Вместе с ребрендингом изменился и график релиза. Теперь OpenAI заявляет, что поставки первого устройства начнутся не раньше конца февраля 2027 года, хотя ранее анонсы указывали на вторую половину 2026-го. Вопреки слухам и фейковым рекламным роликам, в суде подтвердили: это будет не носимый девайс или наушники, а стационарный настольный ассистент без экрана. wired.com ✔️ ElevenLabs выпустила крупное обновление ElevenAgents. Новый режим Expressive Mode позволяет ботам динамически управлять интонацией и эмоциональной окраской речи. Теперь агент может адаптироваться под собеседника в реальном времени: говорить мягче и спокойнее в напряжённой ситуации или, наоборот, добавить уверенности и темпа, когда нужно донести информацию максимально ясно. Апдейт базируется на двух компонентах. Первый - новая TTS-модель Eleven v3 Conversational, оптимизированная для диалогов: она удерживает контекст беседы и избегает характерного роботизированного звучания. Второй компонент — переработанная система смены очереди говорящего. Используя данные транскрибации, ИИ теперь точнее определяет уместные моменты для вступления в разговор и пауз, решая давнюю проблему голосовых ботов, которые часто перебивают на полуслове. Поддержка нового режима заявлена для 70+ языков. elevenlabs.io ✔️ Artificial Analysis сделала инструмент для подбора LLM. Аналитическая платформа представила Model Recommender - сервис выбора модели под конкретные задачи. Рекомендательный движок позволяет указать собственные ограничения и получить персональный список подходящих моделей. Алгоритм учитывает десятки параметров: скорость инференса через API, наличие мультимодальности, тип лицензии и многое другое. В сервисе можно вручную расставить приоритеты: повысить вес метрик качества генерации кода, устойчивости к галлюцинациям или эффективности в агентных задачах. Artificial Analysis в сети Х ✔️ Джон Кармак предложил оптоволокно как кэш-память для ИИ. По расчетам создателя Doom, при пропускной способности 256 Тбит/с внутри 200 км контура в каждый момент времени циркулировало бы примерно 32 ГБ данных, которые можно рассматривать как область памяти. Кармак напомнил о старом принципе, где данные существовали в форме непрерывно передаваемых сигналов. В современном исполнении эта концепция могла бы стать энергоэффективной заменой DRAM - свет в кабеле потребляет меньше энергии, чем поддержание заряда в ячейках. На практике реализовать такую систему физически сложно: 200 км оптоволокна это много даже для дата‑центра. Более реальной альтернативой Джон называет прямое соединение массивов флэш‑памяти с вычислительными чипами без контроллеров и шин, что тоже могло бы сократить задержки при работе больших моделей. tomshardware.com @ai_machinelearning_big_data #news #ai #ml

297 391

✔️ Waymo анонсировала модель мира на базе Google Genie 3 для тренировки автопилота. Waymo World Model - это бесконечный генератор симуляций, где автопилоты учатся выживать, не рискуя реальным железом и людьми. Звучит как видеоигра, но с очень серьезной начинкой. Инженеры могут текстовыми запросами менять погоду, время суток или вообще с нуля создавать дорожные ситуации. Система умеет брать обычное видео с регистратора и превращать его в интерактивную 3D-среду, которую можно редактировать на ходу. Главная цель - отработка так называемых "редких событий". Это самые безумные сценарии, которые в реальности случаются раз в миллион лет, но наглухо ломают логику робота.

Waymo приводит примеры слона, выбежавшего на трассу, погони за торнадо или снега в тропическом городе. Кажется перебором, но именно такие вещи невозможно безопасно протестировать в живом городе. А учиться на них надо.

Контекст тут тоже важен. После случая в Калифорнии, где роботакси задело ребенка, к Waymo много вопросов. Сейчас в сложных ситуациях машинам помогают люди-операторы (они не рулят напрямую, а дают подсказки), но компания явно хочет убрать человеческий фактор, повысив реальную автономность. Вообще, хайп вокруг World Models сейчас огромный. Инвесторы и звезды ИИ (Ян Лекун и Фей-Фей Ли) видят в моделях мира следующий большой шаг после LLM. Недавний пре-релиз Project Genie уже подтолкнул десятки разработчиком к экспериментам, которые научат ИИ понимать физику и пространство нашего мира. @ai_machinelearning_big_data #news #ai #ml

297 391

🏅 LLM на Олимпийских играх: как нейросети меняют индустрию спорта Технологии проникают в большой спорт. Свежий разбор показывает, как именно языковые модели «рассуждают» в контексте Олимпиады, превращаясь из простых чат-ботов в мощные аналитические инструменты: ГигаЧат проанализировал использование различных LLM в олимпийской инфраструктуре. Почему ИИ уже сейчас может помогать анализировать спортивные мероприятия: - Языковые модели способны обрабатывать гигантские массивы данных и статистики, которые живой комментатор не способен переварить - LLM выстраивают логические цепочки для аналитики, обладая знаниями и методологией профессиональных комментаторов и бывших спортсменов - Интеграция технологий делает трансляции интерактивнее, предоставляя зрителям незаметные человеческому глазу инсайты в реальном времени. @ai_machinelearning_big_data #ai #ml #olympics #llm

297 391

🎨 Qwen-Image-2.0 - новое поколение генерации изображений Qwen моделей Alibaba представили Qwen-Image-2.0 - модель, которая выводит генерацию визуала на уровень дизайнерских инструментов. Теперь ИИ не просто рисует картинки, а умеет создавать полноценные слайды, постеры и визуалы с аккуратной типографикой и высоким качеством деталей. Что умеет модель: - Написал абзац → получил готовый слайд - Описал сцену → получил фотореалистичное изображение в 2K - Добавил текст → он отображается корректно, без «ломаных» букв (русских поддерживает, но работает кривовато) Ключевые улучшения: - Профессиональная типографика - поддержка длинных промптов до 1K токенов для презентаций, постеров и комиксов - Нативное разрешение 2K с высокой детализацией - Точное и стабильное отображение текста - Единый режим генерации и редактирования изображений - Облегчённая архитектура — быстрее инференс и ниже стоимость Попробовать: https://chat.qwen.ai/?inputFeature=t2i Подробнее: https://qwen.ai/blog?id=qwen-image-2.0 @ai_machinelearning_big_data #qwen #opensource

297 391

«Не переживайте, рабочие места останутся, даже когда AI всё автоматизирует» ☝️ А вот эти рабочие места.

297 391

✔️ ByteDance представила Seedance 2.0. Китайский гигант запустил пре-релиз видео-модели Seedance 2.0, которая уже доступна избранным пользователям на платформах Jimeng AI, CapCut и Atlas Cloud. Модель поддерживает генерацию в 2K и работает на  30% быстрее прошлой версии. Разработчики сделали акцент на более точном управлении через естественные описания: теперь можно задавать тон, стиль и композицию с помощью простых фраз. Подтянули и работу с референсами: модель лучше понимает ракурсы, освещение и движение объектов. По оценке агентства CTOL, Seedance 2.0 на практике показывает результаты выше, чем Sora 2 и Veo 3.1. После этого сообщения акции китайских технологических компаний заметно выросли, а ByteDance укрепила свои позиции в сегменте генерации видео‑контента. bloomberg.com ✔️ OpenAI выпустит чат-версию GPT 5.3 на этой неделе. Сэм Альтман во внутреннем сообщении сотрудникам сообщил, что рост аудитории ChatGPT ускорился более чем на 10% в месяц. По последним данным, в январе 2026 года сервисом еженедельно пользовались около 800 млн. человек. Главная новость - уже на этой неделе в продакшен запустят обновленную разговорную модель, предположительно, на архитектуре GPT  5.3. На прошлой неделе вышел ее специализированный вариант Codex, заточенный под кодинг. Еще ожидается обновление десктопного приложения OpenAI - оно выйдет за рамки задач программирования и получит более широкий набор функций. cnbc.com ✔️ Anthropic добавила быстрый режим работы в Claude Code. В Claude Code появилось превью Fast mode для Opus 4.6. Обещают, что в этом режиме модель станет ощутимо шустрее и при этом не потеряет в точности. Фича уже доступна подписчикам Pro и Team. Она работает, помимо родных окружений, в Cursor, GitHub Copilot, Figma и Windsurf. В облачных средах Amazon Bedrock, Google Vertex и Azure ее пока не завезли. Цены, честно говоря, кусаются: $30 за 1 млн. входных токенов и $150 за аутпут. Чтобы подсластить пилюлю, дали скидку 50% до 16 февраля. Записаться в лист ожидания можно тут. claude.com ✔️ В репозитории Transformers появился PR с Qwen 3.5. Судя по содержимому, новое поколение получит поддержку зрения и гибридный механизм внимания, который сочетает разные типы обработки контекста. В коде упоминаются 2 конфигурации: компактная плотная модель на 2 млрд. параметров и MoE-архитектура 35B‑A3B. По слухам, релиз Qwen 3.5 может совпасть с выходом DeepSeek v4, что заметно оживит конкуренцию между крупными LLM в open‑source‑экосистеме. github.com ✔️ Тест Halluhard: топовые ИИ-модели галлюцинируют в трети случаев даже с доступом в сеть. Исследователи из EPFL и Института Макса Планка развеяли стереотип о том, что если дать модели доступ в интернет, она перестанет галлюцинировать. На созданном ими бенчмарке Halluhard даже Claude Opus 4.5 с веб-поиском выдает ложную информацию в 30% случаев. Без интернета ситуация совсем плохая - 60% ошибок. GPT-5.2 Thinking держится чуть лучше, но почти 40% галлюцинаций - это все еще много. Китайские модели, кстати, показали себя хуже всех, а ризонинг-LLM часто сами себя запутывают. В длинных диалогах срабатывает эффект снежного кома: стоит модели один раз ошибиться, она начинает опираться на эту ложь в следующих ответах, и исправить ситуацию становится почти невозможно. halluhard.com @ai_machinelearning_big_data #news #ai #ml

297 391

⚡️ Вышла Z-Image Base. Tongyi выложила фундаментальную версию модели семейства Z-Image. В отличие от ранее выпущенной Turbo, это полновесный трансформер, ориентированный на максимальное качество и управляемость генерации . Z-Image отлично подходит для дообучения, тренировки LoRA и интеграции с ControlNet. Модель поддерживает CFG и работу с негативными промптами, генерируя результат за 28–50 шагов. 📌Лицензирование: Apache 2.0 License. 🟡Модель 🟡Демо HF 🟡Демо ModelScope 🟡Archive 🟡ComfyUI WorkFlow 🖥GitHub @ai_machinelearning_big_data #AI #ML #Diffusion #ZImage #Tongyi

297 391

🌟 HY3D-Bench: 22 терабайта отборной 3D-геометрии. Tencent Hunyuan вывалили в опенсорс монструозный пак HY3D-Bench на 22.5 ТБ и это подарок для всех, кто занимается 3D Gen и робототехникой. Датасет разбит на 3 логических куска, каждый под свои задачи: 🟡Full-level Dataset (252K+ мешей, ~11 ТБ) База с полностью замкнутой геометрией, без дырок и non-manifold артефактов, которыми обычно кишат сканы. Все нормализовано и готово к скармливанию в DiT или GAN. В комплекте идут сэмплы точек и мульти-вью рендеры. 🟡Part-level Dataset (240K+ объектов, ~5 ТБ) Мёд для робототехников и тех, кто занимается geometric perception. Тут объекты с семантической сегментацией на части. Если учите сервоприводного друга манипуляциям или хотите генерить объекты кусками - вам сюда. 🟡Synthetic Dataset (125K+ объектов, ~6.5 ТБ) Очевидная синтетика, чтобы закрыть редкие категории, которых нет в обычных датасетах. Охват - 1252 категории. Ждем волну SOAT-level 3D-генераторов, дотюненных на этом наборе. 🟡Arxiv 🟡Датасет 🖥GitHub @ai_machinelearning_big_data #AI #ML #Dataset #HY3DBench #Tencent

297 391

Рынок ИИ в России быстро растёт: по предварительным оценкам, в 2025 году его объём достиг $2,1 млрд, а спрос на ML-инженеров уже сейчас опережает предложение. Бизнесу нужны специалисты для реальных задач — от рекомендательных систем и аналитики до автоматизации сложных процессов. На курсе "Инженер машинного обучения с нуля" в Нетологии делают упор на практических навыках. Вы научитесь работать со всем циклом ML-разработки: • формулировать и проверять гипотезы с помощью статистики; • создавать и дообучать нейросети, использовать transfer learning; • собирать ETL-пайплайны и готовить данные; • контейнеризировать проекты и настраивать CI/CD для ML-систем. В программе больше 10 проектов для портфолио, задачи от реальных компаний и шанс на стажировку в Globus IT. А эксперты из Яндекса, Сбера и Amazon помогут на протяжении всего обучения. Начните свой путь в профессию, которая уже меняет рынок. Получите скидку 45% по промокоду ML2026 с возможностью оформить рассрочку. Реклама. ООО “Нетология” ОГРН 1207700135884 Erid:2VSb5wbcUg9

297 391

📌 OVQA: прощай, KV-cache offloading. В Zyphra придумали как усидеть на двух стульях сразу, когда хочется резиновый контекст, но под рукой нет тонны памяти. То. что они предложили, называется Online Vector-Quantized Attention - это модификация векторного квантования, которая учит словарь думать на лету.

В классическом VQ ключи заменяются ближайшими центроидами из статичного словаря. Это бустит вычисления, но создает проблему: словарь обучен на одних данных, а во время генерации модель видит совсем другое распределение ключей. Ошибка квантования растет, внимание теряет точность и как итог: VQ начинает плавать.

Так вот, модификация в том, чтобы отказаться от статического словаря в пользу адаптивного к текущей последовательности: каждый новый токен обновляет только один центроид - тот, к которому ближе всего. Это разреженное обновление работает как защита от катастрофического забывания: старая информация не вымывается новой волной токенов, а аккуратно перезаписывается по мере необходимости. Плюс есть хард-лимит на размер состояния, после достижения которого объем памяти перестает расти, а вычисления становятся строго линейными. 🟡Результаты тестовых экспериментов 🟢Модель, обученная на 4К токенах, уверенно справлялась с контекстом до 64К без деградации качества; 🟢На внутриконтекстном поиске OVQ почти не отставала от полноценного самовнимания, потребляя при этом в 4 раза меньше памяти; 🟢На In-Context Learning VQ провалился, а OVQ вышла на уровень классического внимания, используя всего ~4К центроидов; 🟢Сравнения с линейными альтернативами (Mamba2 и дельта-сети) тоже в пользу OVQ: она стабильнее держит долгий контекст без просадок точности; 🟠В задачах Positional ICR OVQA работает чуть хуже, чем классическое внимание но все равно достойно. Очень хочется надеяться, что OVQ - это предтеча настоящего непрерывного обучения, где в светлом будущем вместо бесконечно пухнущего KV-кэша появится компактная, но живая память, способная удерживать важные детали без потерь. 🟡Статья 🟡Arxiv @ai_machinelearning_big_data #AI #ML #LLM #OVQA #Zyphra

297 391

🙂 Все мы иногда немного Gilfoyle. На первый взгляд может показаться, что Silicon Valley опередил свое время, но на самом деле - это результат отличной проработки технической части сериала, что для современного продакшена - редкость. Роль технологических консультантов сериала в разное время выполняли PhD и профессор Стэнфорда, СTO Twitter, основатель сервиса Vizify и еще более 70 специалистов Кремниевой долины. Тем не менее, создатели Silicon Valley почти угадали: в прошлом году ИИ-ассистент платформы Replit удалил на проде базу данных, а вендинговый аппарат в офисе Anthropic под управлением Claude заказал партию вольфрамовых кубиков. @ai_machinelearning_big_data

297 391

🔥 Полезная подборка каналов только код, практика и самые передовые инструменты, которые используют разработчики прямо сейчас.👇 🖥 Машинное обучение : t.me/machinelearning_interview 🖥 Data Science: t.me/data_analysis_ml ⚡️ Полезные ИИ ресурсы: https://t.me/addlist/2Ls-snqEeytkMDgy 🖥 Python: t.me/pythonl 🖥 Linux: t.me/linuxacademiya 🖥 C++ t.me/cpluspluc 🖥 Docker: t.me/DevopsDocker 🖥 Хакинг: t.me/linuxkalii 🖥 Devops: t.me/DevOPSitsec 👣 Golang: t.me/Golang_google 🖥 Javascript: t.me/javascriptv 🖥 C#: t.me/csharp_ci 🖥 Java: t.me/javatg 🖥 Базы данных: t.me/sqlhub 👣 Rust: t.me/rust_code 🤖 Технологии: t.me/machineint 💰 Экономика и инвестиции в ИИ t.me/financeStable 💼 Актуальные вакансии: t.me/addlist/_zyy_jQ_QUsyM2Vi 🖥 Chatgpt бот в тг: t.me/Chatgpturbobot 📚 Бесплатные ит-книги: https://t.me/addlist/HwywK4fErd8wYzQy 🖥Подборка по Golang: https://t.me/addlist/MUtJEeJSxeY2YTFi Самое лучшее в этом: ты учишься даже тогда, когда “нет времени, просто потому что читаешь правильную ленту.