Machinelearning

Open in Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Network:Machinelearning Russia1 260 Technologies & Applications323...

📈 Analytical overview of Telegram channel Machinelearning

Channel Machinelearning (@ai_machinelearning_big_data) in the Russian language segment is an active participant. Currently, the community unites 297 959 subscribers, ranking 323 in the Technologies & Applications category and 1 260 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 297 959 subscribers.

According to the latest data from 11 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -7 224 over the last 30 days and by -206 over the last 24 hours, overall reach remains high.

Verification status: Not verified
Engagement rate (ER): The average audience engagement rate is 7.69%. Within the first 24 hours after publication, content typically collects 5.95% reactions from the total number of subscribers.
Post reach: On average, each post receives 22 918 views. Within the first day, a publication typically gains 17 745 views.
Reactions and interaction: The audience actively supports content: the average number of reactions per post is 176.
Thematic interests: Content is focused on key topics such as openai, claude, api, gemini, контекст.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

Thanks to the high frequency of updates (latest data received on 12 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

297 959

Subscribers

-20624 hours

-1 5177 days

-7 22430 days

22 918

Post views

~ 17 74524 hours

~ 20 01448 hours

7.69%

Engagement rate

~ 6

Posts per day

Ads index

beta

Posts Archive

297 920

🌟 VoxCPM2: открытая 2B TTS-модель на 30 языках. VoxCPM2 - крупное обновление открытой системы синтеза речи VoxCPM. Модель обучена на более 2 млн. часов мультиязычных аудиоданных и поддерживает 30 языков, включая русский, китайский, английский, японский, корейский, арабский и хинди (плюс 9 диалектов китайского).

За проектом стоит OpenBMB, структура при Университете Цинхуа, объединяющая академическую лабораторию THUNLP и коммерческую компанию ModelBest. THUNLP - одна из сильнейших академических групп по LLM в Азии, которой руководит легенда китайского NLP, профессор Maosong Sun. OpenBMB известна сериями CPM, MiniCPM, AgentCPM и фреймворками BMTrain и OpenPrompt.

🟡В второй версии VoxCPM отказались от дискретной токенизации аудио. В отличие современных TTS-систем, VoxCPM2 работает напрямую с непрерывными представлениями в латентном пространстве AudioVAE V2. Пайплайн состоит из 4 стадий: LocEnc, TSLM, RALM и LocDiT. На выходе - аудио с частотой 48 кГц студийного качества: асимметричная архитектура AudioVAE V2 принимает референс на 16 кГц и повышает разрешение без внешнего апсемплера. 🟡Обновление добавило 2 новые возможности. 🟢Voice Design создает голос по текстовому описанию: достаточно указать пол, возраст, тембр, эмоцию и темп - никакого референсного аудио не нужно. 🟢Controllable Voice Cloning клонирует голос по короткому аудиофрагменту и в довесок позволяет управлять стилем, эмоциями и скоростью речи, сохраняя оригинальный тембр. Из версии 1.5 перешел режим Ultimate Cloning: если передать вместе с референсом его точный транскрипт, модель воспроизводит ритм, интонации и манеру речи. 🟡Тесты На Seed-TTS-eval модель показывает WER 1.84% на английском и CER 0.97% на китайском при сходстве голоса (SIM) 75.3% и 79.5% соответственно. На мультиязычном Minimax-MLS-test система лидирует по SIM в подавляющем большинстве из 24 языков, опережая Minimax, ElevenLabs, FishAudio S2 и Qwen3-TTS. В задаче генерации голоса по описанию модель набирает лучшие баллы среди open-source решений на InstructTTSEval в английском языке. 🟡Модель потребляет около 8 ГБ VRAM. Скорость инференса по соотношению времени, затраченного моделью на генерацию аудио к длительности самого аудио - около 0.3 на NVIDIA RTX 4090. На движке Nano-vLLM этот показатель снижается до 0.13 (подходит для стриминга в реальном времени). Есть скрипты и гайд для SFT (добавления нового языка или домена) или LoRA для глубокой имитации конкретного спикера. LoRA потребует 5–10 минут аудио и 20 ГБ VRAM. Пример генерации аудио на демо-спейсе HF без клонирования и постобработке - в видеофайле поста. 📌Лицензирование: Apache 2.0 License. 🟡Страница проекта 🟡Документация 🟡Модель 🟡Demo 🖥GitHub @ai_machinelearning_big_data #AI #ML #TTS #VoxCPM2 #OpenBNB

297 920

🌟 ИИ-агенты на контентных платформах: два подхода к встраиванию в медиа. На русскоязычных медиа-площадках появились первые публичные интеграции ИИ-агентов непосредственно в пользовательский интерфейс. Два свежих кейса — Хабр и «Код Дурова» — демонстрируют разные архитектурные подходы к одной задаче: помочь читателю взаимодействовать с контентом. 🟡 Хабр: объяснение кода в статьях Хабр совместно с SourceCraft разработал фичу для объяснения кодовых сниппетов прямо в статьях. В блоках кода появилась кнопка «Объяснить код с SourceCraft» — при нажатии ИИ-помощник на базе Yandex AI Studio берёт в качестве контекста всю статью и конкретный блок кода, затем генерирует объяснение в оверлейном окне. Можно в один клик перейти в среду разработки с сохранением контекста статьи, чтобы продолжить работу с кодом. 🟡 «Код Дурова»: агент-помощник по всему сайту Издание запустило агента «Кодик» также на базе Yandex AI Studio — он работает как персональный помощник по всему контенту сайта. Архитектура задействует два компонента: нейросетевые модели для генерации ответов и AI Search для поиска релевантных материалов по сайту. Логика работы: агент сначала ищет по контенту площадки. Если релевантная информация найдена — формирует ответ с привязкой к конкретным публикациям. Если нет — фолбэчит на базовые знания модели, покрывая вопросы за пределами тематики сайта. Функционал шире: поиск материалов по запросу, рекомендации, объяснение терминов, краткий пересказ статей в реальном времени. 📌 В обоих случаях площадки выступают потребителями платформенных решений, а не строят инфраструктуру с нуля. @ai_machinelearning_big_data #news #ai #ml

297 920

🔥 Claude теперь воспитывают кнутом и пряником Сначала в сети завирусился badclaude - тулза, где ИИ буквально «подгоняют» командами быстрее после каждого фейла. Чистый треш, но многим зашло. Теперь появился антипод- goodclaude. Там всё наоборот: чем больше работаешь, тем больше Claude получает похвалы.

«У тебя всё отлично получается» «Я горжусь тобой» «Ты лучший кодер»

И да, звучит как шутка, но это реально используют. Суть простая: поведение модели сильно зависит от контекста и тона. Хочешь агрессивного исполнителя - дави. Хочешь аккуратного и стабильного - хвали. goodclaude лежит на GitHub https://github.com/ashley-ha/goodclaude badclaude тоже никуда не делся https://github.com/GitFrog1111/badclaude Что выберешь ты? @ai_machinelearning_big_data #claude

297 920

Repost from Анализ данных (Data analysis)

🔥 Милла Йовович теперь тоже Вайбкодер😱 Актриса выложила на GitHub опенсорс-инструмент MemPalace для работы с памятью ИИ-агентов. Делала его вместе с другом. Фишка в том, что все данные хранятся локально, а система сама решает, какие факты о пользователе подтягивать под конкретный запрос. По бенчмарку LongMemEval инструмент уже обгоняет и платные, и бесплатные решения. За сутки репозиторий набрал 2k+ звёзд. Настоящий обитель зла 💀 https://x.com/bensig/status/2041229266432733356 🎯Полезные Мл-ресурсы 🚀 Max @data_analysis_ml

297 920

✔️ Великобритания убеждает Anthropic масштабировать свой бизнес. Поводом стал недавний конфликт создателей Claude с Администрацией США. Воспользовавшись обострением, мэр Лондона предложил главе Anthropic сделать британскую столицу главной базой компании, гарантировав стабильную и открытую для инноваций юрисдикцию. Чиновники подготовили пакет предложений по расширению местного офиса и двойному листингу акций. Проект представят Амодею в конце мая. Сейчас в лондонском филиале Anthropic работают около 200 человек, из них 60 исследователей. На фоне отсутствия локальных компаний такого уровня Великобритания стремится стать главным европейским хабом для лидеров ИИ-рынка. ft.com ✔️ OpenAI представила концепцию экономики для эпохи AGI. В опубликованном документе OpenAI прогнозирует, что AGI обрушит традиционную экономику. Чтобы избежать дефицита бюджета, компания предлагает перенести налоговую нагрузку на сверхприбыли корпораций и ввести специальный сбор для бизнеса, где людей заменяют на ИИ-системы. Для защиты рынка труда - переход на 32-часовую рабочую неделю с сохранением оклада и соцпакеты, не привязанные к работодателю. Плюс создание государственного ИИ-фонда, который будет выплачивать дивиденды всем гражданам. Также OpenAI лоббирует закрепление базового права на ИИ и модернизацию энергосетей под дата-центры. Компания поддерживает курс США на минимальное внутреннее регулирование ради победы в технологической гонке с Китаем, призывая сфокусироваться лишь на контроле за безопасностью моделей. wsj.com ✔️ NVIDIA показала технологию нейросетевого сжатия текстур. Neural Texture Compression (NTC) использует компактные нейросети для распаковки текстур прямо во время рендеринга. Это уменьшает объем файлов на диске и кратно снижает потребление VRAM. На демонстрации активация NTC снизила потребление видеопамяти с 6,5 ГБ до 970 МБ, при этом разрешение текстур оказалось даже выше оригинала. Тот же подход применяется в технологии Neural Materials: алгоритм заменяет ресурсоемкие математические вычисления, самостоятельно определяя, как свет взаимодействует со слоями материалов. Скорость рендеринга вырастает до 7,7 раз. Все вычисления идут на тензорных ядрах, поэтому базовая производительность GPU не страдает. NTC не связана с генеративным ИИ: сети тренируются исключительно на ассетах конкретной игры, что исключает визуальные галлюцинации. Технология не останется эксклюзивом NVIDIA - Microsoft уже стандартизировала механику в DirectX под названием Cooperative Vectors. tomshardware.com ✔️ Anthropic раздает разовые кредиты подписчикам платных тарифов Claude. В честь запуска новых пакетов расширенных лимитов Anthropic начисляет бонусы для тарифов Pro, Max и Team. Сумма эквивалентна стоимости подписки (Pro - $20, Max 5x - $100, Max 20x и Team - $200). Средства можно потратить на дополнительные запросы во всей экосистеме, включая Claude Code, Cowork и сторонние интеграции. Для получения нужна активная подписка и включенная опция «Extra usage» в настройках. После этого бонус можно забрать кнопкой Claim на странице Usage. Срок акции - с 3 по 17 апреля. Средства сгорят через 90 дней после активации. Подписки Enterprise и API-аккаунты Console в акции не участвуют. support.claude.com ✔️ Спрос на программистов в 2026 году достиг трехлетнего максимума. По данным платформы TrueUp, отслеживающей вакансии в 9000 технологических компаний, сейчас открыто более 67 тыс. позиций для разработчиков (вдвое больше, чем в середине 2023 года). Только с начала этого года число предложений выросло на 30%. Статистика ломает нарратив о том, что ИИ отнимает работу у программистов. Напротив, гонка ИИ-технологий заставляет корпорации нанимать еще больше специалистов, а спрос в профильных ML-направлениях растет. Иллюзия схлопывания рынка, на которую жалуются джуниоры, возникает из-за резкого роста конкуренции. Профессия стала массовой, и хотя вакансии начального уровня никуда не исчезли, конкурс на них выше, чем 5 лет назад. businessinsider.com @ai_machinelearning_big_data #news #ai #ml

297 920

Митинг в ИТ-компании в 2026 году 🤣 @ai_machinelearning_big_data

297 920

🔥 Собери свой OpenClaw за вечер Репозиторий, в котором разобрано устройство OpenClaw по слоям. Это формат, которого не хватает большинству гайдов, пошаговая сборка системы, где каждый этап добавляет новый уровень сложности Сначала обычный чат. Потом подключаются инструменты. Затем навыки, работа с вебом, память, маршрутизация задач и мультиагентная логика. В какой-то момент начинаешь ловить себя на мысли, что уже думаешь как оркестратор, а не как пользователь модели В гайде хорошо видно, где заканчивается модель и начинается обвязка. Как строится цикл принятия решений, как агент выбирает инструменты и как вообще появляется ощущение «интеллекта» Дает неплохое понимание архитектуры клешни. https://github.com/czl9707/build-your-own-openclaw @ai_machinelearning_big_data #opensource #openclaw

297 920

🌟 PrismAudio: генерация звука по видео. Лаборатория Tongyi (Qwen) опубликовала практическую часть проекта PrismAudio, участника ICLR 2026. Это фреймворк для задачи Video-to-Audio, то есть синтеза звуковой дорожки по видео. Модель разделяет задачу генерации звука на 4 перцептивных измерения и работает с каждым отдельно через специализированные модули рассуждений и соответствующие им функции вознаграждения. Предшественник PrismAudio, модель ThinkSound, первой применила CoT для V2A: MMLM сначала описывала, какой звук нужен, а затем диффузионная модель его генерировала.

Это было громоздко. ThinkSound использовала единый, монолитный блок рассуждений для всех аспектов звука одновременно. Когда модель пыталась одновременно понять семантику сцены, выстроить тайминг, оценить эстетику и расположить звук в пространстве - качество каждого измерения страдало.

PrismAudio разбивает процесс рассуждения на 4 независимых CoT-модуля: 🟠Semantic CoT определяет, какие звуковые события соответствуют видеоряду; 🟠Temporal CoT выстраивает их последовательность и синхронизацию; 🟠Aesthetic CoT отвечает за естественность и качество звука; 🟠Spatial CoT — за пространственное позиционирование в стереопанораме. Каждому модулю назначена своя reward-функция: семантическое соответствие оценивает MS-CLAP от Microsoft, темпоральную синхронизацию Synchformer, эстетику Audiobox Aesthetics, пространственную точность StereoCRW. Такая архитектура позволяет обучать модель с подкреплением сразу по 4 осям, не жертвуя одним измерением ради другого. Для RL-обучения авторы предложили Fast-GRPO - модификацию, которая применяет SDE-сэмплирование только в небольшом случайном окне шагов, а остальную траекторию проходит детерминированно через ODE. По данным техотчета, Fast-GRPO достигает финального результата за 200 шагов обучения вместо 600 и при этом выходит на более высокий итоговый показатель. 🟡Тесты 🟢На VGGSound модель показала CLAP 0,47 против 0,43 у ThinkSound, DeSync 0,41 против 0,55, а ошибку пространственного позиционирования CRW снизила с 13,47 до 7,72. 🟢На внутреннем бенче AudioCanvas, который авторы создали для оценки сложных сцен разрыв еще заметнее: ThinkSound деградирует по темпоральной метрике до 0,80, а PrismAudio удерживает 0,36. 🟢Субъективные оценки MOS-Q и MOS-C также оказались наивысшими среди всех протестированных моделей. 🟢Опубликованная модель PrismAudio показывает самое быстрое время инференса: 0,63 секунды на 9-секундный фрагмент без учета извлечения признаков. 🟡Но вот с извлечением признаков есть нюанс.

По отзывам пользователей, извлечение признаков для 10-секундного видео требует около 43 ГБ видеопамяти.

📌Лицензирование: MIT License. 🟡Страница проекта 🟡Модель 🟡Demo 🖥GitHub @ai_machinelearning_big_data #AI #ML #V2A #PrismAudio #TongyiLab

297 920

📌Красивая история о том, как Anything вернула себя в Apple App Store. В конце марта Apple удалила из App Store приложение Anything - один из инструментов вайб-кодинга, который позволяет создавать приложения с помощью текстовых запросов к ИИ без навыков программирования. Компания сослалась на нарушение пункта 2.5.2 правил App Store: "приложения должны быть самодостаточными и не могут загружать или исполнять код, изменяющий их функциональность."

Anything основан выходцами из Google Дхрувом Амином и Маркусом Лоу. Они работают вместе с 2021 года: сначала запустили маркетплейс, затем в 2023-м свернули проект и переключились на ИИ-инструменты. В апреле 2025-го продукт вышел как low-code платформа для создания полноценных веб- и мобильных приложений с базами данных, хостингом и платежными системами. В сентябре 2025 года стартап привлёк $11 млн. при оценке $100 млн. За первые две недели Anything вышел на $2 млн. годового дохода.

Удаление стало частью масштабной зачистки. Еще в середине марта Apple заблокировала обновления приложений Replit и Vibecode, сославшись на те же правила. Представитель Apple так же дежурно прокомментировал эти действия не как запрет вайб-кодинга, а о соблюдении действующих норм. В сети обратили внимание на контекст: незадолго до этого Apple сама интегрировала в среду разработки Xcode ИИ-агенты на базе Claude и Codex - инструменты со сходной функциональностью, работающие только внутри экосистемы Apple. Дхрув Амин пытался урегулировать ситуацию. Он предложил обновление, при котором превью сгенерированных приложений открывались бы в браузере, а не внутри Anything. Apple отклонила обновление. В ответ команда Anything перенесла создание приложений в iMessage, штатную систему обмена сообщениями Apple, де-факто задействовав инфраструктуру самой Apple для обхода ее ограничений. Уже 3 апреля Apple без публичных комментариев вернула Anything в App Store. Приложение восстановлено с рядом изменений, но основная функция - генерация приложений по текстовым запросам сохранилась. Сам стартап объявил о проведении хакатона с призовым фондом $5 тыс. в честь возвращения. @ai_machinelearning_big_data #news #ai #ml

297 920

📌Прогноз Альтмана о «компании на миллиард с одним сотрудником» получил первого претендента. В 2024 году глава OpenAI заявил, что ИИ сделает возможным появление компании с выручкой в миллиард долларов и единственным сотрудником. На этой неделе Альман направил письмо в The New York Times: по его словам, он выиграл пари с друзьями из числа руководителей технологических компаний - и хотел бы лично познакомиться с человеком, который, как он считает, это доказал.

"In my little group chat with my tech CEO friends there's this betting pool for the first year that there is a one-person billion-dollar company, which would have been unimaginable without AI and now will happen."

🟡Этот человек - Мэттью Галлахер. В сентябре 2024 года 41-летний предприниматель из Лос-Анджелеса вложил $20 тысяч и за 2 месяца запустил Medvi, телемедицинскую платформу по продаже препаратов для снижения веса. Код создавался с помощью ChatGPT, Claude и Grok, рекламные креативы - через Midjourney и Runway, а за клиентскую поддержку отвечали ИИ-агенты. В штате компании два человека: сам Галлахер и его брат Эллиот. По данным NYT, выручка Medvi за 2025 год составила $401 млн. при чистой марже 16,2% (около $65 млн. прибыли). Прогноз по выручке на 2026 год - $1,8 млрд. Внешнего финансирования компания не привлекала.

Для сравнения: конкурент Hims & Hers при выручке $2,4 млрд. имеет штат свыше 2400 человек и маржу 5,5%. Следует оговориться: финансовые показатели Medvi не проходили независимого аудита, и NYT не приводит какую-либо стороннюю верификацию этой оценке.

Медицинскую инфраструктуру Галлахер не строил, она полностью арендованная. Консультации врачей консультации и рецепты обеспечивает CareValidate, аптечную логистику - OpenLoop Health. Medvi владеет только брендом, сайтом, рекламой и поддержкой. 🟡Безусловно, не обошлось без проблем. Чатбот Medvi выдумывал цены на препараты. Галлахеру, по его словам, пришлось выполнять такие заказы, пока это не починили. Бот генерировал описания препаратов, которых не существовало. Когда клиенты требовали разговора с живым человеком, звонки поступали на личный телефон основателя - всего таких звонков, по его оценке, было более 1000. Во время одного сбоя сайта чинить его было некому: Галлахер находился на прогулке и за это время компания потеряла около 200 клиентов. В марте этого года FDA, американский регулятор, направил предупреждения десяткам телемедицинских компаний, включая Medvi за вводящий в заблуждение маркетинг, так что окно для основы бизнеса Галлахера может закрыться. @ai_machinelearning_big_data #news #ai #ml

297 920

✔️ В Codex ввели pay-as-you-go тариф для команд с оплатой за токены и без лимитов на запросы. OpenAI изменила подход к ценообразованию: для профилей с доступом исключительно к Codex отменены ограничения на частоту запросов. Оплата теперь списывается только за израсходованные токены. Это делает стоимость прозрачной и позволяет точнее распределять бюджеты по проектам. Для тех, кому нужен комплексный доступ к чат-боту, сохраняется тариф ChatGPT Business. Codex в рамках этого плана остается лимитированным, но годовую подписку снизили с 25 до 20 долларов за рабочее место. Для стимулирования перехода OpenAI запустила промо-акцию: за каждого нового участника с доступом только к Codex на баланс рабочего пространства начисляется 100 бонусных долларов (до 500 долларов на команду). openai.com ✔️ Anthropic приобрела биотех-стартап Coefficient Bio. Компания закрыла сделку по поглощению Coefficient Bio - стартапа, разрабатывающего ИИ-решения для биологических исследований. Покупка оплачена акциями, сумма оценивается примерно в 400 млн. долларов. Приобретение усилит экспертизу Anthropic в сфере здравоохранения, продолжая стратегию экспансии после запуска Claude for Life Sciences. Coefficient Bio просуществовал в стэлс-режиме 8 месяцев. Основатели ранее занимались вычислительным дизайном медицинских препаратов в Genentech. Проект использовал ML для оптимизации поиска активных веществ и повышения эффективности биологических исследований. Вся команда стартапа из 10 специалистов вольется в профильное медицинское подразделение Anthropic. theinformation.com ✔️ World Labs выпустила модели Marble 1.1 и 1.1 Plus. Стартап Фэй-Фэй Ли, разрабатывающий ИИ для создания 3D-пространств из текста, обновил платформу. Базовой моделью по умолчанию стала Marble 1.1 с более высокой детализацией генерации при прежней стоимости в 1500 кредитов за сцену. Marble 1.1 Plus автоматически расширяет площадь 3D-мира, если того требует сцена, решая проблему пространственных лимитов предыдущих версий - крупные локации генерируются за один проход без ручного изменения границ. Оплата гибкая: 1500 кредитов плюс 300 за каждый дополнительный динамический куб. Платформа также получила обновление интерфейса: добавлен селектор моделей, страница ассетов показывает версию ИИ, инструменты редактирования вынесены в отдельное меню. Исправлен конфликт сессий при работе в разных вкладках и баг с видимостью дочерних узлов в Studio. worldlabs.ai ✔️ Deepseek v4 будет работать только на чипах Huawei. Deepseek v4 ожидается в ближайшие недели. Главная особенность - полный отказ от зарубежных ускорителей: модель будет запускаться целиком на оборудовании Huawei. Инженеры Deepseek совместно с Huawei и Cambricon потратили несколько месяцев на портирование модели под отечественные чипы. Nvidia не получила раннего доступа к v4, он был открыт только для китайских производителей полупроводников. Ставка на локальную инфраструктуру уже спровоцировала спрос на внутреннем рынке. Alibaba, ByteDance и Tencent суммарно заказали сотни тысяч ускорителей Huawei Ascend 950PR для развертывания v4 в своих облачных сервисах и продуктах. На фоне ажиотажа цены на чипы подскочили на 20%. theinformation.com ✔️ Microsoft называет Copilot инструментом для развлечений. Всплеск интереса к пользовательскому соглашению Copilot for Individuals вскрыл любопытную деталь: Microsoft заявляет, что ее ИИ-помощник предназначен «только для развлекательных целей». Хотя маркетинг корпорации активно продвигает ИИ как незаменимого ассистента, юридически Microsoft полностью снимает с себя ответственность за любые галлюцинации модели. Перестраховка типична и для других игроков индустрии. Европейское соглашение Anthropic для подписки Pro парадоксальным образом запрещает использовать сервис в коммерческих или деловых целях, исключая ответственность за возможные убытки бизнеса. theregister.com @ai_machinelearning_big_data #news #ai #ml

297 920

🚨 Anthropic убила «безлимит» для Claude-агентов С завтрашнего дня подписка Claude больше не работает с OpenClaw и другими сторонними агентами как раньше. Теперь всё, что идёт через OAuth, оплачивается отдельно поверх тарифа. По факту это конец схемы, когда за $200 в месяц прогоняли агентные пайплайны на тысячи долларов. Anthropic прямо сказала, что такие кейсы перегружают их инфраструктуру. Сам Claude никуда не делся. OpenClaw тоже не запретили. Просто экономика изменилась. Либо платишь за каждый запрос, либо идёшь через API. Чтобы сгладить удар, дают кредит на сумму подписки до 17 апреля и обещают скидки на доп. использование. Но это уже косметика. Главное изменение другое. Все инструменты, которые строились вокруг подписки Claude, резко становятся дороже. И теперь вопрос не в удобстве, а в юнит-экономике. Эра дешёвых агентных хакингов закончилась. https://x.com/bcherny/status/2040206440556826908 @ai_machinelearning_big_data #claude #ai #openclaw

297 920

🔥 Netflix выложили open-source модель для удаления объектов из видео с сохранением логики сцены Это не просто «удалить объект из видео». Модель удаляет объект и пересчитывает всю физику сцены. Удалил человека → гитара падает сама убрал домино → цепочка не падает убрал машину → аварии не происходит ИИ буквально отвечает на вопрос: «что было бы, если этого объекта не существовало» Под капотом: - diffusion + transformer (на базе CogVideoX) - анализ взаимодействий объектов - генерация новой реальности, а не просто замазка И это главное отличие от всего, что было раньше. Раньше: замазали объект → сцена ломается Теперь: удалили объект → сцена остаётся логичной Требования, правда, не слабые: GPU от ~40GB VRAM (A100) Репа: https://github.com/Netflix/void-model HF: https://huggingface.co/spaces/sam-motamed/VOID @ai_machinelearning_big_data #Netflix #ai #video

297 920

Я смотрю, как Клод исправляет ошибку в моем коде, которую он сделал 5 минут назад. @ai_machinelearning_big_data

297 920

✔️ Microsoft представила 3 модели семейства MAI. Microsoft выпустила сразу 3 модели под брендом MAI: MAI-Transcribe-1 для распознавания речи, MAI-Voice-1 для синтеза голоса и MAI-Image-2 для генерации изображений по текстовому описанию. Все они позиционируются как решение для тех, кому нужны решения продакшен-уровня с конкурентной стоимостью инференса. 🟡MAI-Transcribe-1 Модель speech-to-text с высокоскоростной транскрибацией для 25 языков, включая русский. На бенчмарке FLEURS показывает лучший Word Error Rate среди конкурентов: среднее значение составляет 3,86%. Модель обходит Whisper во всех 25 языках, Gemini 3.1 Flash - в 22 из 25. Принимает форматы WAV, MP3 и FLAC.

Real-time транскрибация, диаризация и context biasing пока недоступны - эти функции заявлены на будущее.

Стоимость: $0,36 за час аудио. 🟡MAI-Voice-1 TTS-модель, генерирующая реалистичную речь с эмоциональной окраской, естественной интонацией и возможностью клонированием голоса по референсу.

Доступ к клонированию требует одобрения Microsoft и загрузки записанного согласия владельца голоса.

Заявленная скорость генерации - 1 минута аудио за одну секунду. Модель поддерживает управление эмоциями на уровне отдельных фраз через SSML и рассчитана на длинный контент: аудиокниги, подкасты, лекции. Пока работает только с английским, поддержка более 10 языков заявлена в перспективе. Доступна в 3-х регионах Azure: Central US, Japan West и Sweden Central. Стоимость: $22 за 1 млн. символов. 🟡MAI-Image-2 Диффузионная модель для генерации изображений по текстовому промпту, которую Microsoft обкатывала в бета-тестировании с 20 марта. Модель содержит от 10 до 50 млрд. параметров (без учета эмбеддингов), принимает контекст до 32K токенов и генерирует изображения с максимальным разрешением 1024×1024 пикселя. По внутренним оценкам через Elo-рейтинг MAI-Image-2 набирает 1190 ± 8 баллов против 1093 ± 4 у предшественницы MAI-Image-1, особенно сильно выступая в фотореалистичных и портретных категориях (1201 балл). На лидерборде ArenaAI модель вошла в топ-3. Стоимость: $5 за 1 млн. токенов текстового ввода, $33 за 1 млн. токенов на выходе (изображения). Все модели доступны через Microsoft Foundry. Попробовать их в интерактивной среде MAI Playground пока можно только из США. @ai_machinelearning_big_data #news #ai #ml

297 920

Выиграй деньги, став чемпионом ИТ-соревнования от МТС Остались считанные дни до окончания регистрации — призовой фонд 1 500 000 рублей. True Tech Hack — это три уникальные задачи для инженеров данных, разработчиков и системных аналитиков. За лучшие решения дают деньги и зовут на стажировку. Для всех финалистов — закрытая вечеринка с диджеем в Москве на видовой площадке. Регистрация закроется вечером 9 апреля — торопись!

297 920

✔️ Релиз Cursor 3. Anysphere выпустила крупное обновление среды разработки, в котором привычный форк VS Code дополняется интерфейсом, построенным с нуля вокруг агентов. Новая среда поддерживает мульти-репозиторную структуру, где локальные и облачные агенты собраны в одном сайдбаре. Переключение между средами стало бесшовным. Сессию агента можно перенести из облака на локальную машину для правок и тестирования, а затем отправить обратно, чтобы задача продолжала выполняться после закрытия ноутбука. Среди других нововведений - упрощенный интерфейс для диффов с возможностью довести код до merged PR, встроенный браузер для работы с локальными сайтами и маркетплейс плагинов с поддержкой MCP, субагентов и навыков. cursor.com ✔️ OpenAI купила техно-шоу TBPN. По словам OpenAI, корпоративные стратегии продвижения больше не работают. Индустрии нужен новый формат честного диалога о том, как ИИ меняет мир, и онлайн-шоу с широкой аудиторией подходит для этого лучше всего. TBPN станет частью подразделения по глобальной стратегии. TBPN популярно в Кремниевой долине, в его эфирах появлялись Цукерберг, Наделла и сам Альтман. При этом команда сохранит полную редакционную независимость. Ведущие смогут публично критиковать ИИ-индустрию, приглашать в эфир конкурентов OpenAI и самостоятельно формировать повестку. Финансовые условия сделки не разглашаются. bloomberg.com ✔️ Sakana AI представила deep-research агента Marlin. Японский стартап анонсировал первый B2B-продукт - систему глубокого рассуждения Sakana Marlin. Инструмент автоматизирует сложную аналитику, на которую у людей обычно уходят недели. Достаточно задать тему, после чего агент уходит в автономный поиск на срок до 8 часов, генерируя подробные стратегические бизнес-отчеты и презентации. Архитектура объединяет систему AI Scientist, отвечающую за выявление и разрешение противоречий в данных, и алгоритм стратегического поиска AB-MCTS. Sakana AI открыла набор на бета-тестирование для специалистов из финансов, науки и консалтинга. Доступ бесплатный, но форма регистрации доступна только на японском. sakana.ai ✔️ Google прокачала подписку AI Pro. Google расширила возможности тарифов AI Pro и Ultra. Главным бонусом стало увеличение облачного хранилища с 2 до 5 ТБ, но фокус обновления - глубокая интеграция ИИ в сервисы. Gemini в Google Workspace научился работать со сложным контекстом. Модель напрямую агрегирует данные из локальных файлов, писем и веб-ресурсов пользователя, связывая разрозненную информацию. Chrome auto browse - ИИ-агент, способный брать на себя управление браузером. Он может выполнять многошаговые задачи в вебе, например, заполнять громоздкие формы или собирать данные для ресерча. В Gmail добавили генерацию саммари по инбоксу и продвинутый пруфридинг. В подписку также включили план Google Home Premium, где Gemini сможет настраивать сценарии умного дома промптами на естественном языке. Развертывание уже началось, часть функций пока ограничена рынком США. Shimrit Ben-Yair в сети Х ✔️ Почти половина студентов в США готовы сменить профессию из-за ИИ. Опрос американских учащихся показал, что 47% респондентов всерьез задумываются о смене профиля подготовки из-за опасений за карьерное будущее, а 16% уже перевелись на другие направления. Тренд особенно заметен среди мужчин: 21% уже сменили специализацию (против 12% у женщин). Наибольшую тревогу испытывают студенты технологических направлений (70%) - это выше, чем на инженерных, гуманитарных и бизнес-факультетах (52–54%). Академическая среда сильно отстает в выработке стандартов. 42% вузов не одобряет применение ИИ в учебе, и лишь 7% открыто поощряют использование новых инструментов. Реальная практика расходится с политикой университетов. Даже там, где ИИ строго запрещен, 10% студентов пользуются им ежедневно, а еще 17% обращаются к ИИ минимум раз в неделю. axios.com @ai_machinelearning_big_data #news #ai #ml

297 920

⚡️ Alibaba выпустила Qwen 3.6-Plus с контекстом в миллион токенов. Alibaba официально представила Qwen 3.6-Plus, новую флагманскую языковую модель, наследницу серии Qwen 3.5. В 3.6 Plus сделан акцент на агентный кодинг. Модель самостоятельно декомпозирует сложные задачи на уровне репозитория, пишет и тестирует код, итеративно отлаживает его до готового результата. Контекстное окно в миллион токенов - это примерно 2000 страниц текста в одном запросе, что позволяет загружать целые кодовые базы и длинные документы целиком. Максимальный выход - 65 536 токенов, СoT включен постоянно, есть поддержка function calling. 🟡 Тесты 🟢На Terminal-Bench 2.0 Qwen 3.6-Plus набирает 61,6 балла против 59,3 у Claude 4.5 Opus. 🟠На SWE-bench Verified: 78,8 против 80,9 у Claude. 🟢По обработке документов модель лидирует с показателем 91,2 на OmniDocBench v1.5.

Принципиальное отличие от предшественника: устранена проблема overthinking, которая была главной претензией разработчиков к Qwen 3.5. Модель тратит меньше токенов на рассуждения и ведет себя стабильнее в продакшн-сценариях.

По неофициальным тестам сообщества, скорость генерации примерно втрое выше, чем у Claude Opus 4.6, хотя time-to-first-token на бесплатном тарифе в среднем составляет 11,5 секунды. Цена на платформе Alibaba Model Studio - от $0,5 до 2 за миллион входных токенов и от $3 до 6 за то же количество выходных. Бесплатно - на OpenRouter (в режиме превью) и в веб-чате Qwen.

Планов на опен-сорс относительно нового флагмана Alibaba не озвучивала, но циркулируют слухи, что часть моделей серии Qwen 3.6 все-таки выложат в открытый доступ.

@ai_machinelearning_big_data #news #ai #ml

297 920

Cotype Light 3 ломает рынок корпоративных ИИ-агентов MWS AI выкатили мультимодальную модель на 9B параметров, которая работает с текстом и с визуалом в едином контексте. Договоры, чертежи, формы, картинки можно обрабатывать без костылей и переключений между системами. Ключевой акцент сделан на эффективности: меньше модель, ниже стоимость, быстрее внедрение в корпоративные процессы. При этом по качеству она уже конкурирует с моделями в 100B+. - Мультимодальность из коробки: текст и изображения в одной логике. - 9B параметров, но топ-3 в MERA среди русскоязычных моделей. - Точность >99% в задачах на математику и знания о мире. - Инференс на одном GPU без кластеров. - Можно разворачивать в закрытом контуре. По железу все приземленно: A100, A10, L4 - один ускоритель, без сложной инфраструктуры Запуск подтверждает тренд, который образовался на рынке: уход от гигантских моделей к компактным, заточенным под задачи. Выигрывает не тот, у кого больше параметров, а тот, у кого дешевле и быстрее работает прод.

297 920

🚀 Gemma 4 - новое семейство открытых моделей, которые можно запускать прямо на своём железе. Созданы для сложного reasoning и агентных сценариев. Распространяются по лицензии Apache 2.0. Вот что нового 👇 🔵 Доступны в четырёх вариантах: • 31B Dense и 26B MoE Топовый уровень производительности для сложных локальных задач: кастомные код-ассистенты, анализ научных данных и не только. • E4B и E2B (Edge) Оптимизированы для мобильных устройств — работают в реальном времени с текстом, изображениями и аудио. 🤖 Что можно делать: • строить автономных ИИ-агентов • планировать и выполнять многошаговые задачи • взаимодействовать с приложениями • искать данные и вызывать API 👉 Встроенная работа с инструментами (tool use) из коробки. 🧠 Контекст до 256K токенов: • анализ целых кодовых баз • длинные цепочки действий без потери контекста • стабильная работа в сложных сценариях ⚡️ Начать можно уже сейчас через Google AI Studio Также веса моделей доступны на Hugging Face, Kaggle и Ollama Gemma 4 — это уже не просто модель. Это фундамент для локальных AI-агентов нового поколения. https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/ @ai_machinelearning_big_data #Gemma