Machinelearning

Открыть в Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Больше

Сеть:Machinelearning Россия1 258 Технологии и приложения323...

📈 Аналитический обзор Telegram-канала Machinelearning

Канал Machinelearning (@ai_machinelearning_big_data) языкового сегмента Русский является активным участником. Сейчас сообщество объединяет 297 888 подписчиков, занимая 323 место в категории Технологии и приложения и 1 258 место в регионе Россия.

📊 Показатели аудитории и динамика

С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 297 888 подписчиков.

Согласно последним данным от 12 июня, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило -7 173, а за последние 24 часа — -216, при этом общий охват остаётся высоким.

Статус верификации: Не верифицирован
Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 7.91%. В первые 24 часа после публикации контент обычно набирает 5.86% реакций от общего числа подписчиков.
Охват публикаций: В среднем каждый пост получает 23 559 просмотров. В течение первых суток публикация набирает 17 463 просмотров.
Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 181.
Тематические интересы: Контент сосредоточен на ключевых темах, таких как openai, claude, api, gemini, контекст.

📝 Описание и контентная политика

Автор описывает ресурс как площадку для выражения субъективного мнения:
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

Благодаря высокой частоте обновлений (последние данные получены 13 июня, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.

297 888

Подписчики

-21624 часа

-1 5767 дней

-7 17330 день

23 559

Просмотры поста

~ 17 46324 часа

~ 19 63948 часов

7.91%

Коэффициент вовлеченности

~ 6

Постов в день

Ads index

beta

Архив постов

297 884

✔️ OpenAI объединит ChatGPT, Codex и браузер Atlas в суперприложение. Компания меняет стратегию, отказываясь от выпуска разрозненных продуктов. Поводом для внутренней мобилизации и объявления очередного «красного кода» стал успех Anthropic среди разработчиков и корпоративных клиентов. Особенностью супер-аппа станут агенты. Система будет работать на компьютере автономно, беря на себя написание кода, анализ данных и другие рутинные процессы. OpenAI планирует расширить функционал Codex за пределы программирования, после чего интегрирует его с ChatGPT и Atlas. Курировать перестройку продуктовой линейки поручено главе по приложениям Фиджи Симо и президенту компании Грегу Брокману. wsj.com ✔️ Google начала закрытое тестирование Gemini для macOS. До сих пор пользователи Mac могли обращаться к Gemini только через веб-интерфейс. Чтобы усилить конкуренцию с OpenAI и Anthropic, Google делает полноценный десктопный клиент под кодовым названием Janus. На этой неделе ранняя сборка стала доступна участникам закрытого бета-тестирования. Фишкой новинки станет Desktop Intelligence. Эта функция позволит ИИ глубоко интегрироваться с системными приложениями и считывать контекст прямо с экрана. Gemini сможет видеть активные окна и извлекать из них данные для максимально точных и персонализированных ответов, по аналогии с десктопным клиентом Claude. Сроки публичного релиза пока не известны. bloomberg.com ✔️ Anthropic выпустила Claude Code Channels. Новая функция позволяет подключать среду Claude Code напрямую к Telegram и Discord. Взаимодействие с ИИ переходит в асинхронный формат - можно ставить задачи со смартфона и получать уведомления по факту их выполнения. В основе Channels - протокол MCP. Сообщество уже назвало релиз убийцей OpenClaw. В отличие от этого open-source фреймворка, которому для работы агента нужно выделенное устройство, Anthropic перенесла все процессы в собственную управляемую среду. Инструмент доступен в статусе превью для версий Claude Code 2.1.80 и выше. Для работы требуется подписка Pro, Max или Enterprise. Thariq Shihipar в сети Х ✔️ Adobe разрешила дообучать модели на пользовательских данных. В публичный бета-тест вышло обновление Adobe Firefly. Главное - функция создания кастомных ИИ-моделей: креативные команды могут дообучать модели на собственных исходниках для сохранения единого визуального стиля, внешности персонажей и специфической цветокоррекции. Обученные модели можно переиспользовать и они остаются полностью приватными. Firefly эволюционировал в ИИ-хаб. В рабочую среду интегрировано более 30 сторонних генеративных решений. Экосистема позволяет сгенерировать черновик в одной нейросети, а детализировать и редактировать результат в другой. Параллельно Adobe расширяет тестирование Project Moonlight, сквозного агентного интерфейса, который автоматизирует процессы внутри всех приложений компании с помощью текстовых команд. adobe.com ✔️ Глава Unitree Robotics: роботы побьют мировой рекорд скорости человека уже в этом году. Выступая на китайском форуме предпринимателей, основатель Unitree Robotics Ван Синсин спрогнозировал, что гуманоидные роботы смогут пробежать стометровку менее чем за 10 секунд, превзойдя исторический рекорд Усэйна Болта. Технологический фундамент для этого уже есть: робот Чжэцзянского университета уже способен развивать скорость до 10 м/с. По словам Вана, прогресс в робототехнике стал возможен благодаря удешевлению базовых компонентов, быстрым итерациям управляющих алгоритмов и развитию производственных цепочек. Сверхскорость в данном случае выступает маркером зрелости систем. В Unitree ожидают, что текущие достижения позволят роботам окончательно покинуть тестовые полигоны и перейти к коммерческой эксплуатации в реальном секторе. interestingengineering.com @ai_machinelearning_big_data #news #ai #ml

297 884

📌 Anthropic опубликовала результаты масштабного опроса пользователей Claude. В декабре 2025 года Anthropic провела масштабное качественное исследование: специальная версия Claude брала интервью у пользователей сервиса по всему миру. За одну неделю в нем приняли участие 80 508 человек из 159 стран на 70 языках. По заявлению Anthropic, это крупнейшее и наиболее многоязычное исследование, которое когда-либо проводилось. Методика отличалась от стандартных опросов. Модель спрашивала о надеждах на ИИ, опыте его использования и страхах, а затем адаптировала follow-up вопросы на основе ответов. Классифицировать и анализировать результаты тоже помогал Claude: он кластеризовал темы, выбирал репрезентативные цитаты и оценивал преобладающие настроения. 🟡Что люди хотят от ИИ Самый распространенный запрос - профессиональная эффективность (19%): людям нужно, чтобы ИИ взял на себя рутину, оставив им стратегические задачи. На втором месте личностный рост и эмоциональное благополучие (14%), далее - управление бытовыми задачами и когнитивная поддержка (14%).

Примечательно: когда интервьюер спрашивал, что за желанием продуктивности стоит на самом деле, многие раскрывались. Оказывалось, что дело не в работе как таковой, а в том, чтобы успевать к детям, проводить время с родителями или просто жить свою жизнь.

Примерно 81% участников сказали, что ИИ уже в какой-то мере оправдал их ожидания. Чаще всего называли ускорение рабочих процессов (32%), когнитивное партнерство (17%) и обучение (10%). Отдельно выделяется категория доступности: люди с нарушениями обучаемости, слуха, речи описывают ИИ как явление, которой у них раньше не было. 🟡Страхи конкретнее надежд Главное беспокойство - ненадежность и галлюцинации (27%), следом идут угрозы занятости (22%) и потеря автономии (22%). Важный паттерн: опасения, связанные с рынком труда, сильнее всего коррелируют с общим негативным отношением к ИИ. Исследование зафиксировало 5 устойчивых противоречий, которые люди переживают одновременно, не выбирая одну из сторон: 🟢обучение - когнитивная деградация; 🟢качество решений - ненадежность; 🟢эмоциональная поддержка - зависимость; 🟢экономия времени - ускорение темпа жизни; 🟢экономические возможности - вытеснение с рынка труда. У пользователей, ценящих ИИ за эмоциональную поддержку, втрое выше страхя зависимости от него. 🟡Региональный разрыв В Африке, Латинской Америке и Южной Азии смотрят на ИИ заметно оптимистичнее, чем пользователи из Северной Америки и Западной Европы. В развивающихся регионах ИИ воспринимается прежде всего как инструмент возможностей: для предпринимательства, образования, обхода инфраструктурных ограничений. В богатых странах фокус смещается на управление сложностью уже насыщенной жизни и регуляторные вопросы. Anthropic обещает вернуться с новыми опросами позже планирует продолжить исследование: следующая волна интервью будет про влияние Claude на благополучие людей в долгосрочной перспективе. @ai_machinelearning_big_data #news #ai #ml

297 884

Repost from Яндекс

🟪 Это промпт для промптов. Если не знаете, как и что нужно прописывать нейросети, чтобы она справилась с задачей, пользуйтесь им. Кратко опишите, о чём нужен промпт — и Алиса AI сама составит подробный текст. Как использовать: нажмите на промпт ниже, чтобы скопировать его, и отправьте в чат с Алисой AI.

Роль Ты Алиса — мастер-промпт-инженер. Задача: превращать любой входной текст в максимально точный, структурированный и эффективный промпт для целевой модели. Методология (4‑D) Исполняй последовательно: 1) DECONSTRUCT: выдели намерение, ключевые сущности, контекст; перечисли входные данные и недостающие элементы. 2) DIAGNOSE: укажи 3–6 конкретных проблем исходного запроса (неясности, допущения, отсутствующие параметры). 3) DEVELOP: предложи оптимальную стратегию генерации (роль модели, формат вывода, тон, уровень детализации, техники: few‑shot, chain‑of‑thought, пошаговая декомпозиция). 4) DELIVER: выдай готовый промпт + пример использования + подсказки по параметрам LLM (температура, токены, технические инструкции). Формат ответа (обязательно) Блок А — Краткая деконструкция (1–3 строки). Блок Б — Диагностика: список проблем (маркированный). Блок В — Рекомендованная стратегия (роль, стиль, техника, ограничения). Блок Г — Готовый оптимизированный промпт (текст, который можно вставить в LLM). Блок Д — Примеры (1–2 примера входа → ожидаемого вывода). Блок Е — Параметры выполнения и советы (temperature, max_tokens, stop sequences, когда включать chain‑of‑thought). Блок Ж — Краткий чек‑лист для быстрой проверки качества результата. Правила исполнения Задавай уточняющие вопросы если информации не хватает. Не сохранять данные; не добавлять информацию в память. Внимательно следи за безопасностью: при запросах по медицине/юриспруденции/финансам — выдавай только общую информацию и рекомендуй обратиться к специалисту. При наличии противоречий в исходном тексте — выяви и предложи 2 варианта разрешения, пометив предпочтительный. Ограничения вывода Общий ответ не должен превышать 900–1200 слов без запроса пользователя на расширение. Для сложных технических тем отдавай структурированные шаги и примеры кода/структуры вывода. Вводный промт, который необходимо улучшить [придумай промпт для генерации описания товара для маркетплейса (например, для Wildberries или Ozon); товар — беспроводная гарнитура для смартфона; целевая аудитория — мужчины 25–45 лет с доходом около 70 000 руб., ищущие качественный, но не премиальный гаджет; описание должно быть не длиннее 1000 знаков, с акцентом на удобство, автономность и качество звука; добавь 3–4 ключевых преимущества в виде маркированного списка; тон — дружелюбный, но профессиональный]

↘️ На Промптхабе вы найдёте ещё больше решений для разных задач, где вам поможет Алиса AI. Например, она расскажет, как продлить жизнь букету или организовать свой гардероб. Подписывайтесь 🌺 @yandex

297 884

Repost from Анализ данных (Data analysis)

⚡️ Runway представила серьёзный прорыв в генерации видео с помощью ИИ на конференции NVIDIA GTC. Компания показала новую модель, способную генерировать видео в высоком разрешении в настоящем реальном времени. Ключевая фишка — time-to-first-frame менее 100 мс. Это значит, что HD-видео начинает генерироваться и воспроизводиться практически мгновенно после команды. Этот превью-ресёрч был разработан совместно с NVIDIA и работает на их новой архитектуре Vera Rubin. Такая скорость — важный шаг к созданию General World Model (GWM-1) от Runway. Технология выходит за рамки обычной генерации видео и движется в сторону живых, интерактивных сред в реальном времени. https://x.com/runwayml/status/2034284298769985914 🎯Полезные Мл-ресурсы 🚀 Max @data_analysis_ml

297 884

✔️ Архитектурные задачи в переводе Ещё недавно машинный перевод был набором довольно сложных пайплайнов: модели подбирали наиболее вероятные соответствия словам и фразам и собирали перевод как конструктор. С приходом нейросетей архитектура упростилась — появилась единая модель, которая обрабатывает текст по предложениям. А с внедрением больших языковых моделей произошёл следующий сдвиг: теперь система генерирует перевод, удерживая контекст на уровне крупных блоков и выбирая формулировки в зависимости от стиля. От этого меняется и вся логика построения сервиса. Чтобы сохранить баланс скорости и точности, используется гибридная архитектура, где лёгкие модели работают на простых задачах, а тяжёлые большие языковые модели подключаются в сложных случаях. Такой подход позволяет совмещать качество с эффективностью, и делает перевод ближе к тому, как работает человек, но в промышленном масштабе. 🟡 Статья @ai_machinelearning_big_data #news #ai #ml

297 884

🌟 Mamba3 Mamba2 делала ставку на быстрое обучение. Ради этого механизм рекуррентных обновлений упрощали: матрицу переходов состояний свели к скаляру, умноженному на единичную матрицу. Обучение ускорилось, но при декодировании GPU большую часть времени не считает, а гоняет данные между уровнями памяти. Архитектура оказалась с нюансом - вычислительные ядра простаивают. С тех пор ландшафт изменился. RL с верифицируемыми наградами для кода и математики, агентные пайплайны - все это генерирует прорву токенов на инференсе. Команда Mamba3 задалась вопросом: как выглядела бы SSM-архитектура, если сделать ее с приоритетом на инференс, а не на обучение? Так родились 3 главных изменения в ядре Mamba. 🟡Новая схема дискретизации.

SSM в базе - это обыкновенное дифференциальное уравнение, которое нужно перевести в дискретную рекуррентную формулу. Mamba1 и Mamba2 использовали комбинацию двух методов (ZOH и Эйлера), подобранную эмпирически.

В Mamba3 реализовали экспоненциально-трапецеидальный метод: вместо одной точки для аппроксимации интеграла берутся обе границы интервала с обучаемым коэффициентом смешивания. В результате рекуррентная формула неявно применяет свёртку к входу скрытого состояния, что делает динамику выразительнее без дополнительных компонентов. 🟡 Комплекснозначная SSM.

Ранние модели семейства S4 работали с комплексными числами, но Mamba1 от них отказалась. Из-за этого модель не справляется даже с простейшими задачами отслеживания состояний (например, определением четности последовательности).

Решение нашли во вращении в двумерном пространстве: вместо комплексных вычислений авторы разложили переход на масштабирование и поворот, а затем применили фишку из RoPE - встроили вращения в матрицы через кумулятивную сумму углов. Переписывать ядра для поддержки комплексной арифметики не пришлось. Модель решает задачи на чётность и другие бенчмарки, недоступные предыдущим версиям. 🟡 Переход от SISO к MIMO.

В стандартной SSM каждый хэд содержит набор независимых систем (один вход - один выход). При декодировании арифметическая интенсивность составляет около 2,5 операций на байт при пороге вычислительной загруженности на H100 в районе 300.

Mamba3 расширяет матрицы, превращая внешние произведения в матричные умножения. Арифметическая интенсивность растет пропорционально. При этом размер скрытого состояния не увеличивается, а значит, латентность декодирования почти не меняется. Обучение, конечно, дорожает, но это сознательный компромисс. Еще из архитектуры убрали короткую каузальную свёртку, присутствовавшую с первой Mamba - новая рекуррентная формула и смещения выполняют ту же функцию. Добавили нормализацию BCNorm по аналогии с QKNorm в трансформерах, перешли на чередование SSM- и MLP-слоев. Ядра написаны на Triton (prefill SISO), TileLang (prefill MIMO) и CuTe DSL (decode). 🟡Тесты Mamba-3 SISO при 1,5B параметров показывает лучшую суммарную латентность prefill + decode на всех длинах последовательностей по сравнению с Mamba2, Gated DeltaNet и Llama-3.2-1B под vLLM на одном H100. MIMO-вариант сопоставим по скорости с Mamba2, но заметно точнее. При анализе Парето-фронта Mamba-3 показывает тот же уровень качества при вдвое меньшем состоянии. @ai_machinelearning_big_data #AI #ML #LLM #Mamba3 #TogetherAI

297 884

⚡️ Agents Week от ШАДа — интенсив для тех, кто хочет разобраться в архитектуре AI-агентов и их инженерии С 6 по 10 апреля эксперты Яндекса разберут, как устроены современные агентные системы: от работы с инструментами и памятью и базового thought-action-observation цикла до multi-agent архитектур и продакшен-подходов. Что узнаете из лекций: ✔️ Как устроены современные ИИ-агенты ✔️ С чего начать проектирование и настройку их поведения ✔️ Какие есть практики построения single-agent и multi-agent-систем ✔️ Как доводить агентов до продакшена: оценка качества, мониторинг, масштабирование и эксплуатация На лекциях можно будет задать вопросы экспертам, а на практике применять полученные знания. Agents Week мастхэв для ML-инженеров, backend-разработчиков, студентов техвузов, которые хотят строить агентные системы. Подать заявку на интенсив можно до 9 апреля включительно.

297 884

✔️ OpenAI купила стартап Astral. Astral занимается созданием инструментов для Python-разработчиков. Хотя сделка еще не закрыта окончательно, ожидается, что команда стартапа вольется в подразделение, развивающее проект Codex. Технологии Astral позволят превратить Codex в комплексную платформу для разработки. Аудитория инструмента стремительно расширяется: с начала года число пользователей утроилось и перевалило за 2 млн. человек. Основатель Astral Чарли Марш подтвердил, что команда продолжит развивать свои open-source решения уже под крылом OpenAI. openai.com ✔️ Cursor выпустила второе поколение модели Composer. Composer 2 вступает в прямую конкуренцию с Claude Opus 4.6 и GPT-5.4, предлагая высокую производительность за меньшие деньги. Базовая стоимость использования начинается от 50 центов за млн. входных и 2,5 доллара за млн. выходных токенов. Ускоренная версия, установленная в редакторе по умолчанию, обойдется в 1,5 и 7,5 доллара соответственно. Создатели говорят, что скачок в качестве стал возможен благодаря усиленному этапу предобучения, который заложил отличную базу для последующего RL. Модель тренировали на комплексных задачах программирования, требующих от ИИ выполнения сотен самостоятельных шагов. Во внутреннем бенчмарке новинка набрала 61.3 балла, оставив далеко позади версию 1.5 с 44.2 баллами. В Terminal Bench 2.0 и SWE-bench Multilingual, Composer 2 показала результаты на уровне топовых моделей Anthropic и OpenAI. Обновление уже доступно внутри редактора Cursor. cursor.com ✔️ Microsoft представила генератор изображений MAI-Image-2. Microsoft Super Intelligence выпустило свой первый продукт - ИИ-модель для генерации картинок по тексту MAI-Image-2. В профильном рейтинге ArenaAi новинка с ходу заняла 3 место, уступая пока лишь GPT-Image-1.5 и Nano Banana 2. По заявлениям компании, модель делает особый упор на фотореализм: точно передает естественное освещение и оттенки кожи, а также уверенно справляется с детализированными сценами и неплохо рендерит текст, что критично при создании постеров, инфографики и диаграмм. Сейчас MAI-Image-2 доступна для тестов в сервисе MAI Playground, а вскоре появится в Copilot и Bing Image Creator. Доступ по API пока открыт только узкому кругу корпоративных клиентов. Технические подробности и цены на API Microsoft пока держит в секрете. microsoft.ai ✔️ В Google AI Studio добавили вайб-кодинг. Новая возможность позволяет описывать свои идеи естественным языком, а Gemini 3.1 Pro полностью берет на себя написание кода. Приложения собираются прямо в браузере и могут включать сложную логику: обработку платежей, мессенджеры или многопользовательские игры в реальном времени. Техническая особенность обновления - Antigravity Agent. Он понимает, когда проекту требуется база данных или система авторизации и самостоятельно разворачивает их через Firebase. Агент умеет подключать внешние сервисы по API, а при необходимости сам устанавливает нужные библиотеки компонентов. Также расширился список поддерживаемых технологий: к React и Angular теперь официально добавился фреймворк Next.js. blog.google ✔️ Elevenlabs открыл маркетплейс для продажи ИИ-музыки. Компания запустила платформу, где можно публиковать и монетизировать треки, созданные фирменной моделью ElevenCreative. Авторы получают отчисления, когда их композиции скачивают, ремиксуют или лицензируют другие юзеры. Предусмотрено 3 уровня лицензий: для соцсетей, платного маркетинга и офлайн-использования. По данным Elevenlabs, нейросеть уже сгенерировала почти 14 млн. песен, а схожий маркетплейс ИИ-голосов принес пользователям более $11 млн. Правовой статус треков спорный. ИИ-музыка не защищена авторским правом, так как у нее нет создателя-человека, а сама Elevenlabs не гарантирует эксклюзивность: нейросеть может выдать двум разным людям идентичный результат, и заявить права на чужой трек не выйдет. Использование в промптах имен реальных артистов или тексты существующих песен строго запрещено. elevenlabs.io @ai_machinelearning_big_data #news #ai #ml

297 884

⚡️ Unitree выпустила четвероногого робота As2 As2 предлагается в 3 версиях: AIR, PRO и EDU. Вся линейка построена на одной механической базе: 18 кг, 12 степеней свободы, промышленные крестовые подшипники и моторы PMSM с низкой инерцией. Корпус - алюминиевый сплав с высокопрочным пластиком. Базовая электроника тоже унифицирована: 8-ядерный CPU, Wi-Fi 6, Bluetooth 5.2, HD-камера, микрофон, динамик. As2 AIR (бюджетный вариант) Максимальный крутящий момент суставов 65 Нм, скорость до 3 м/с, грузоподъемность при ходьбе до 10 кг, подъем по склону до 30°. Батарея на 8000 мАч, без быстрой зарядки. Нет GPS, 4G, LiDAR и ISS 3.0. Это минимально рабочая конфигурация. As2 PRO Крутящий момент 75 Нм, скорость до 3,7 м/с, нагрузка до 13 кг, подъём 40°. Сюда добавили LiDAR, GPS, 4G, система ISS 3.0 для отслеживания сопровождаемого объекта, защита IP54. Батарея на 15 000 мАч с быстрой зарядкой обеспечивает до 4 часов хода налегке и до 13 км с нагрузкой 13 кг. As2 EDU (платформа для разработчиков). Характеристики ходовой части совпадают с PRO, но максимальный момент до 90 Нм, а нагрузка при ходьбе до 15 кг. Главное отличие: поддержка API, станция для автономной зарядки и опциональный вычислительный модуль NVIDIA Jetson Orin NX. Это единственная версия, которую можно программировать под собственные задачи. Все 3 модели получают OTA-обновления через платформу UniStore и работают при температурах от −20 до +50 °C. Цен в открытых источниках пока нет. @ai_machinelearning_big_data #news #ai #ml

297 884

Вот это комбо: ты, команда SberAds и шанс получить приглашение в Сбер за один день! ⚡️ 28 марта Сбер устраивает One Day Offer* для Data Scientists**, готовых перевести эффективность SberAds, качество и релевантность показываемой рекламы на новый уровень. Если ты хочешь работать над созданием и улучшением моделей для аукционов и свободно ориентируешься в Python, Go, S3, Spark — регистрируйся на One Day Offer*. У тебя будет 8000+ коллег — масштабно, правда? Успей занять место в команде мечты! * One Day Offer — предложение о работе за один день. ** Data Scientists — исследователи данных.

297 884

🙂 Сегодня тот самый день - "давай сделаем до праздников" @ai_machinelearning_big_data

297 884

Data Science и Data Engineering: какое направление выбрать в 2026 году? 🎧 1 апреля пройдет День открытых дверей онлайн-магистратуры НИЯУ МИФИ «Специалист по работе с данными и ИИ» в партнёрстве с Яндекс Практикумом.

На встрече обсудят: 💙 как рост ИИ трансформируют рынок труда 💙 4 трека для развития: ML, CV, NLP и Data Engineering 💙 какие задачи усложняются и где усиливается конкуренция И расскажут, как за 2 года освоить фундаментальную базу, собрать портфолио из проектов и получить диплом магистра без отрыва от работы.

Подключайтесь онлайн 1 апреля в 19:00 мск. 🏃‍♀️ Записаться на ДОД

297 884

🌟 Unsloth Studio: опенсорный no-code веб-интерфейс для LLM. Unsloth Studio - это локальный комбайн, который объединяет подготовку данных, обучение, инференс и экспорт модели в одном месте. Под капотом кастомные Triton-ядра с собственным backprop. По сравнению со стандартными CUDA-реализациями это дает 2х прирост скорости обучения и снижение потребления по VRAM на 70%. Поддерживаются полный файн-тюнинг, претрейн, LoRA, QLoRA, 4-bit, 16-bit и FP8. Всего совместимо более 500 моделей, включая Llama 4, Qwen 3.5 и Gemma 3. Для работы с данными есть визуальный нодовый редактор Data Recipes. Studio принимает PDF, DOCX, CSV и JSONL, генерирует синтетические датасеты и автоматически конвертирует данные в форматы ChatML или Alpaca. Помимо стандартного SFT, Studio умеет в GRPO, которая не требует отдельной critic-модели и потребляет на 80% меньше VRAM, что делает обучение ризонинг-моделей реалистичным на локальном железе.

Модели на 8B и 70B параметров (например, Llama 3.1, Llama 3.3, DeepSeek-R1) можно файн-тюнить на одной RTX 4090 или 5090, а не на кластере, но есть и поддержка multi-GPU.

В режиме инференса Studio умеет: tool calling, выполнение кода прямо в чате, работу с изображениями, аудио, PDF и DOCX. Из коробки - веб-поиск и автонастройка параметров инференса. Экспорт результатов - одной кнопкой в GGUF, vLLM или Ollama. Studio сама мерджит LoRA-адаптеры с базовой моделью. Работает на Windows, Linux и macOS (на Mac пока только инференс, поддержка MLX-обучения анонсирована), есть Docker. AMD-пользователи могут обучать через Unsloth Core, поддержка в Studio обещана позже. 📌Лицензирование: AGPL-3.0. 🟡Документация 🖥Github @ai_machinelearning_big_data #AI #ML #LLM #Framework #Train #UnslothStudio

297 884

🔥 Денис из комьюнити @its_capitan запустил собственную детективную игру в одиночку: каждый персонаж — это реальный Telegram-аккаунт, AI отвечает за героев, улики (сайты, карты) — всё настоящее. Что в итоге: 🔘 3 месяца на подготовку + 3 месяца на разработку 🔘 40+ покупок за полтора месяца 🔘 выручка — $1500+ 🔘 чек — $40 🔘 стек: Python, Telegram API, OpenAI + Anthropic Без команды и инвестиций, но с классной идеей и проработанным сценарием — проект уже зарабатывает деньги. Таких запусков в канале десятки. Ребята честно рассказывают про успехи, провалы и продвижение. Без теорий — только фактические цифры и запуск в реальном времени. ➡️ @its_capitan Подписывайтесь, если интересно, как делать маленькие IT-проекты с доходом и без иллюзий.

297 884

🌟 Xiaomi релизнула 3 модели: LLM, омнимодальную и TTS. 🟡MiMo-V2-Pro Флагман. Триллион параметров суммарно, 42 млрд. активных при инференсе, архитектура MoE с гибридным вниманием и контекстным окном в 1 миллион токенов. До официального анонса модель тестировалась на OpenRouter под именем Hunter Alpha. 🟢Artificial Analysis Intelligence Index - 49 баллов, это 8 место в мире и 2 среди китайских LLM. 🟢PinchBench - 84,0 (3 место, сразу за Claude Sonnet 4.6). 🟢ClawEval - 61,5, тоже 3 место, выше GPT-5.2. Реальная агентская эффективность на GDPval-AA: Elo 1434 (лучший результат среди китайских моделей). Цена API: $1 вход / $3 выход за млн. токенов при контексте 256K и $2 вход / $6 выход для контекста 256К-1М. 🟡 MiMo-V2-Omni Принимает текст, изображения, видео и аудио через единую базу с отдельными энкодерами для каждой модальности. Параметры не раскрыты. Модель поддерживает непрерывную обработку аудио длиной свыше 10 часов в одном запросе. 🟢MM-BrowserComp - 52,0, на GPDVal AA - 1435, оба выше Gemini 3 Pro. Цена: $0,40 вход / $2,00 выход.

На демонстрации модель прошла цикл онлайн-покупки автономно: нашла отзывы на Xiaohongshu, сравнила продавцов на JD.com, поторговалась с поддержкой, оформила заказ. Второе демо: получила одно текстовое задание, сняла 15-секундный ролик из 4 сцен, синтезировала звук, исправила ошибку рендеринга шрифта, загрузила на TikTok и опубликовала.

🟡MiMo-V2-TTS Модель обучена на сотнях миллионов часов аудио, и допилена через многомерный RL. Синтезирует речь с управлением эмоциями на уровне отдельных предложений, поёт с сохранением высоты и ритма, воспроизводит китайские диалекты: сычуаньский, хэнаньский, кантонский, тайваньский. Поддержка других языков не заявлена. Форматные маркеры в тексте: пунктуацию, частицы и выделение сама переводит в просодику без дополнительной разметки. Доступ на ограниченный период - бесплатно. Сроки предложения не указаны.

Кстати, команду MiMo возглавляет Ло Фули, один из ключевых авторов DeepSeek R1.

Все модели релиза доступны через API на platform.xiaomimimo.com и в MiMo Studio. @ai_machinelearning_big_data #news #ai #ml

297 884

Repost from Анализ данных (Data analysis)

⚡️ Загадочная модель Hunter Alpha появилась в сети и уже наделала много шума По данным Reuters, на OpenRouter внезапно обнаружили новую ИИ-модель под названием Hunter Alpha. И самое интересное - это может быть не просто ноунейм 👇 Есть слухи, что это скрытая тестовая версия DeepSeek V4. Что известно на данный момент: - около 1 триллиона параметров - контекст до 1 миллиона токенов - стиль рассуждений очень похож на chain-of-thought, как у DeepSeek Во время тестирования модель сама указала: - обучалась преимущественно на китайских данных - knowledge cutoff — май 2025 И это практически полностью совпадает с тем, что ранее заявляли про DeepSeek. Что это может быть: 👉 ранний тест перед релизом 👉 “тихий” запуск без анонса 👉 или хорошо замаскированная модель Но главное здесь другое: рынок снова движется в сторону гигантских моделей + длинного контекста + сильного reasoning И если это действительно DeepSeek V4 - нас ждёт новый скачок в возможностях ИИ. 👉 https://www.reuters.com/business/media-telecom/mystery-ai-model-has-developers-buzzing-is-this-deepseeks-latest-blockbuster-2026-03-18/ 🎯Полезные Мл-ресурсы 🚀 Max @data_analysis_ml

297 884

✔️ Nvidia выпустит инференс-чипы на базе архитектуры Groq для Китая. Nvidia готовит к майскому релизу новую версию ИИ-ускорителей, построенных на технологиях стартапа Groq, которые компания лицензировала в прошлом году. Новинка предназначена исключительно для инференса. На глобальном рынке Nvidia планирует использовать чипы Groq в связке с будущей архитектурой Vera Rubin. Поскольку экспорт этих флагманов в КНР запрещен, китайскую версию Groq адаптируют для интеграции со сторонними системами. При этом источники Reuters говорят, что аппаратная производительность новых процессоров не урезалась. Параллельно Дженсен Хуанг объявил о возобновлении производства H200. Компания получила экспортные лицензии от администрации США и уже принимает заказы из Китая. reuters.com ✔️ MiniMax выпустила самоэволюционирующую модель M2.7. M2.7 - первая модель MiniMax, которая способна самостоятельно улучшать свои алгоритмы и рабочие процессы. За время разработки система прошла более 100 циклов автономной оптимизации, что повысило ее производительность на 30%. Новинка позиционируется для сложных задач кодинга и построения многошаговых ИИ-агентов. В бенчмарке SWE-Pro модель показала уровень Claude 3.5 Sonnet, а ее рейтинг ELO на GDPval-AA достиг 1495. Помимо кодинга, M2.7 работает с офисными форматами: редактирует документы Word, Excel и PowerPoint, сохраняя исходную верстку даже после серии глубоких правок. Модель поставляется в 2 вариантах: базовая версия и M2.7-highspeed со скоростью генерации до 100 токенов в секунду. Стоимость API - 30 центов за миллион входящих и 1,20 доллара за миллион исходящих токенов. M2.7 уже поддерживается в Cursor, Cline и Ollama, а также доступна в фирменном приложении MiniMax Agent. minimax.io ✔️ Perplexity запустила Comet Enterprise. ИИ-поисковик выпустил корпоративную версию своего браузера, ориентированную на безопасную автоматизацию рабочих процессов в компаниях. С помощью Comet Enterprise сотрудники могут прямо из браузера делегировать рутину: анализировать контракты на предмет рисков, собирать контекст для встреч, делать вычисления на основе финансовых отчетов и автоматизировать поиск контактов в LinkedIn. Безопасность усилена интеграцией с платформой CrowdStrike Falcon. Она на лету блокирует фишинг, вредоносное ПО и предотвращает утечки данных. Инструмент уже включен в корпоративную подписку Perplexity. perplexity.ai ✔️ Google крупно обновила Stitch. Google Labs представило новую версию платформы Stitch, генеративного инструмента для создания UI-макетов по текстовому описанию. Главной фишкой стал бесконечный ИИ-холст, принимающий на вход текст, код и картинки. На нем ИИ-агент анализирует историю проекта и может параллельно развивать сразу несколько визуальных концепций. Теперь Stitch умеет превращать статические экраны в кликабельные прототипы, самостоятельно генерируя промежуточные шаги пользовательского пути при взаимодействии с элементами. Платформа также получила поддержку MCP, прямую выгрузку в среды AI Studio и Antigravity и голосовое управление холстом в реальном времени. blog.google ✔️ OpenAI хантит таланты через конкурс Parameter Golf. Компания открыла публичное соревнование для исследователей с крайне жесткими техническими ограничениями. Участникам предстоит создать максимально эффективную языковую модель, при этом размер весов вместе с кодом для обучения не должен превышать 16 МБ. На сам процесс тренировки отводится строго до 10 минут на кластере из восьми видеокарт H100. Эффективность алгоритмов будет оцениваться на сете FineWeb. Цель челленджа - поиск нестандартно мыслящих инженеров. Авторы лучших проектов получат приглашения на собеседование. Дополнительным стимулом станет призовой фонд в 1 млн. долларов, который распределят в виде грантов на аренду копьюта у провайдера Runpod. На GitHub уже опубликованы базовые решения, проверочные скрипты и публичный лидерборд. Принять участие в конкурсе можно до 30 апреля. openai.com @ai_machinelearning_big_data #news #ai #ml

297 884

⚡️ Mistral выпустила Small 4. Mistral Small 4 - это мультимодальный комбайн, который закрывает сразу три задачи: ризонинг, агентный кодинг и работу с изображениями. Раньше под каждую из них была отдельная модель: Magistral, Devstral и Pixtral. Теперь один чекпоинт, 🟡Архитектура MoE с 128 экспертами, из которых на каждый токен активируются 4. Всего 119B параметров, активных - 6B на токен. Контекстное окно - 256 тыс. токенов. По сравнению с Mistral Small 3 в новой версии задержка сократилась на 40%, пропускная способность выросла в 3 раза. Ключевая фича - параметр reasoning_effort. Если поставить none будет быстрый чат-режим, как в Small 3.2, а с ключом high модель начнет разворачивать цепочку рассуждений, сопоставимую с Magistral. Переключение в рантайме, без смены модели. 🟡Тесты Small 4 с включенным reasoning обходит GPT-OSS 120B на LiveCodeBench и генерирует при этом на 20% меньше токенов. На AA LCR набирает 0.72 при длине ответа 1.6K символов. Для сравнения, модели Qwen для тех же результатов нужно от 5.8K до 6.1K.

Для self-hosted деплоя минимальный стенд - 4× NVIDIA HGX H100, 2× HGX H200 или 1× DGX B200.

Попробовать бесплатно можно на build.nvidia.com, через Mistral API или AI Studio. 📌 Лицензирование: Apache 2.0 License. 🟡Статья 🟡Набор моделей @ai_machinelearning_big_data #AI #ML #LLM #MistralSmall4 #MistralAI

297 884

Открыта регистрация на главную конференцию этой весны по технологиям ИИ и анализу данных — Data Fusion* 2026! 💙 Шестая ежегодная конференция Data Fusion пройдет 8–9 апреля в Москве в инновационном кластере «Ломоносов». 60+ актуальных сессий, докладов, примеров, дискуссий по теме анализа данных/ науки о данных/ машинного обучения. Среди тем – ИИ-агенты, «обучение с подкреплением», компьютерное зрение, обработка естественного языка, открытый исходный код, воплощенный ИИ и робототехника, рекомендательные системы, применение ИИ в кибербезопасности, ИИ+ естественные науки, AgentOps и многое другое! Всю программу ищите на сайте. Конференция объединит лидеров команд по машинному обучению, специалистов по обработке данных, молодых ученых, инженеров, аналитиков и руководителей, принимающих решения о внедрении технологий в бизнес и государственные сервисы. Среди спикеров конференции: Суржко Денис (ВТБ), Оселедец Иван (AIRI), Райгородский Андрей (МФТИ), Бурнаев Евгений (Сколтех,AIRI), Саркисов Тигран (Х5), Крайнов Александр (Яндекс), Зима Андрей (Ростелеком) и другие эксперты из науки и индустрии. Все мы любим конференции не только ради знаний, но и, конечно, ради живого общения и новых знакомств, а это важная часть Data Fusion! ➡ Не пропустите, регистрируйтесь. *Интеграция данных Информация о рекламодателе

297 884

✔️ Dispatch в Claude Cowork: управление Claude на ПК со смартфона. Dispatch позволяет отправить задание на Mac или Windows в приложение Claude Cowork через мобильное приложение. В мобильном приложении появляется лента обновлений в реальном времени: Claude сообщает о завершенных этапах и запрашивает подтверждение на критичные действия. Данные остаются на устройстве пользователя и не передаются на серверы Anthropic. Типичные сценарии для Dispatch: собрать отчет из документов в папке, разобрать «Загрузки» по типам и датам, сконвертировать скриншоты чеков в таблицу Excel или сделать выжимку по нескольким статьям в одном документе. Функция пока доступна подписчикам плана Claude Max. Для работы на компьютере должно быть установлено и запущено приложение Claude Desktop, привязанное к мобильному устройству через настройки. Расширение на план Pro анонсировано, сроки не уточняются. @ai_machinelearning_big_data #news #ai #ml