ru
Feedback
Machinelearning

Machinelearning

Открыть в Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Больше

📈 Аналитический обзор Telegram-канала Machinelearning

Канал Machinelearning (@ai_machinelearning_big_data) языкового сегмента Русский является активным участником. Сейчас сообщество объединяет 295 417 подписчиков, занимая 333 место в категории Технологии и приложения и 1 275 место в регионе Россия.

📊 Показатели аудитории и динамика

С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 295 417 подписчиков.

Согласно последним данным от 24 июня, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило -6 346, а за последние 24 часа — -267, при этом общий охват остаётся высоким.

  • Статус верификации: Не верифицирован
  • Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 7.94%. В первые 24 часа после публикации контент обычно набирает 5.71% реакций от общего числа подписчиков.
  • Охват публикаций: В среднем каждый пост получает 23 454 просмотров. В течение первых суток публикация набирает 16 873 просмотров.
  • Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 183.
  • Тематические интересы: Контент сосредоточен на ключевых темах, таких как openai, claude, api, gemini, контекст.

📝 Описание и контентная политика

Автор описывает ресурс как площадку для выражения субъективного мнения:
Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Благодаря высокой частоте обновлений (последние данные получены 25 июня, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.

295 417
Подписчики
-26724 часа
-1 5017 дней
-6 34630 день
Архив постов
🌟 Modded-NanoGPT — позволяет добиться качества GPT-2 (124M) при обучении всего на 5B лексем Modded-NanoGPT — это модификация
🌟 Modded-NanoGPT — позволяет добиться качества GPT-2 (124M) при обучении всего на 5B лексем Modded-NanoGPT — это модификация того кода для обучения GPT-2 от Андрея Карпати. Modded-NanoGPT позволяет: — обучать в 2 раза эффективнее (требуется всего 5B лексем вместо 10B для достижения той же точности) — имеет более простой код (446 строк вместо 858) 🖥 GitHub @ai_machinelearning_big_data

⚡️ Anthropic только что представлии Claude 3.5 Sonnet, модель которая превосходит GPT-4 почти на всех тестах. В Claude 3.5 So
⚡️ Anthropic только что представлии Claude 3.5 Sonnet, модель которая превосходит GPT-4 почти на всех тестах. В Claude 3.5 Sonnet добавлена поддержка «артефактов», позволяющая выдавать результаты в различных форматах, таких как код, текстовые документы, изображения и другие. Claude 3.5 Sonnet уже доступна бесплатно для всех пользователей. До конца года Anthropic планируют выпустить Claude 3.5 Haiku (более компактная и быстрая) и Claude 3.5 Opus (самая мощная модель). Вы можете попросить модель создать документы, код, диаграммы, векторную графику и многое другое . Попробуйте бесплатно: http://claude.ai @ai_machinelearning_big_data

🦜 Toucan — open-source TTS-модель с поддержкой 7000 языков и диалектов Toucan — это модель преобразования текста в речь (TTS
+2
🦜 Toucan — open-source TTS-модель с поддержкой 7000 языков и диалектов Toucan — это модель преобразования текста в речь (TTS) + набор инструментов для обучения, тренировки и развертывания модели. Модель создана в Институте обработки естественного языка (IMS) Штутгартского университета. Всё написано на идиоматическом Python с использованием PyTorch, для максимально лёгкого изучения и тестирования. 🖥 GitHub 🤗 Затестить на HF 🤗 Датасет на HF @ai_machinelearning_big_data

⚡️Как устроены ChatGPT, Siri, Алиса и Маруся — и какие навыки нужны, чтобы запускать такие продукты? Приходите на бесплатный
⚡️Как устроены ChatGPT, Siri, Алиса и Маруся — и какие навыки нужны, чтобы запускать такие продукты? Приходите на бесплатный онлайн-практикум от ТГУ и Skillfactory 27 июня в 19:00 мск. За 1,5 часа эксперт расскажет: — что такое обработка естественного языка; — как использовать ее для анализа текстов, проверки бизнес-идей и научных гипотез; — какие технологии сейчас востребованы на рынке. Регистрируйтесь бесплатно по ссылке: https://go.skillfactory.ru/&erid=2VtzqwadDRZ Получите в подарок курс по математике. Реклама ООО "Скилфэктори", ИНН 9702009530

🌟 Magnum-72B-v1 — LLM, которая умеет в прозу и стихи (как Sonnet и Opus от Claude AI) Magnum-72B-v1 создана на базе Qwen-2 7
🌟 Magnum-72B-v1 — LLM, которая умеет в прозу и стихи (как Sonnet и Opus от Claude AI) Magnum-72B-v1 создана на базе Qwen-2 72B. Обучение проводилось на 55 миллионах токенов высококачественных данных. Для тонкой настройки всех параметров модели было использовано 8 ускорителей AMD Instinct MI300X. 🤗 Hugging Face @ai_machinelearning_big_data

🌟 GEB-1.3B — open-source облегченная LLM GEB-1.3B — это лёгкая LLM, обученная на 550 миллиардах лексем. При всей своей лёгко
+1
🌟 GEB-1.3B — open-source облегченная LLM GEB-1.3B — это лёгкая LLM, обученная на 550 миллиардах лексем. При всей своей лёгкости модель превосходит Llama-7B и схожие LLM в 3 метриках из 4 (C-Eval, CMMLU, Average) Для достижения такого впечатляющего результата были использованы новые методы обучения, включая ROPE, Group-Query-Attention и FlashAttention-2, для ускорения обучения при сохранении производительности LLM. Кроме того, была произведена тонкая настройка модели при помощи 10 миллионов разных промптов и инструкций. Кстати, квантизованная FP32-версия GEB-1.3B довольно быстро работает даже на CPU, при этом продолжаются работы по дальнейшему увеличению скорости с помощью квантования. 🟡 Arxiv 🤗 Hugging Face @ai_machinelearning_big_data

DataOps Platform от МТС получила награду от CNews в номинации “Инновация года: Self-Service платформа для работы с большими д
DataOps Platform от МТС получила награду от CNews в номинации “Инновация года: Self-Service платформа для работы с большими данными". Платформа предоставляет инструменты для хранения, обработки, контроля качества и виртуализации данных, а также построения отчётности и многое другое. Успешное замещение импортных сервисов на собственную платформу принесло экономию до 1,5 млрд рублей за год. Отличный шаг в развитии цифровой экосистемы. @ai_machinelearning_big_data

🌟 Open Interpreter — полное управление компьютером при помощи запросов на естественном языке
pip install open-interpreter
interpreter
Open Interpreter предоставляет интерфейс естественного языка для управления компьютером. Можно общаться с Open Interpreter через ChatGPT-подобный интерфейс прямо в терминале. При помощи Open Interpreter можно на естественном языке выполнять такие действия как: — создание и редактирование фотографий, видео, PDF-файлов и т. д. — управление браузером — анализ данных, построение графиков и т.д. 🖥 GitHub 🟡 Доки @ai_machinelearning_big_data

⚡️ Florence-2 — open-source VLM от Microsoft Microsoft выкатили Florence-2 — модель, принимающую изображения на вход, способн
+3
⚡️ Florence-2 — open-source VLM от Microsoft Microsoft выкатили Florence-2 — модель, принимающую изображения на вход, способную решать многие задачи CV (распознавание, сегментирование, OCR). Есть 2 основные версии — base и large (200M и 800M параметров), при этом обе версии модели отлично себя показывают в сравнении с моделями, которые тяжелее в 100 раз 🤗 Hugging Face 🟡 Arxiv @ai_machinelearning_big_data

🔥Хотите перейти в ML и построить успешную карьеру? В OTUS стартует курс "Machine Learning. Professional", обучение на которо
🔥Хотите перейти в ML и построить успешную карьеру?  В OTUS стартует курс "Machine Learning. Professional", обучение на котором позволит последовательно освоить современные инструменты анализа данных и на профессиональном уровне создавать модели машинного обучения.  ⚡25 июня в 20.00 мск приглашаем на открытое практическое занятие "Карьерные переходы в ML или старт в новой профессии", где мы разберем: - стратегии перехода; - правильное оформление резюме; - прохождение интервью; - реальные кейсы из опыта эксперта.  Условие участия - вступительное тестирование  👉Пройти тест и записаться на мероприятие https://otus.pw/Cnfe/?erid=LjN8K8nhJ При поступлении в группу обучения возможны разные способы оплаты и рассрочка платежа. 

⚡️ MeshAnything: генерация качественной полигональной сетки с помощью авторегрессионных трансформеров MeshAnything строит полигональную сетку так же, как это делал бы человек. При этом MeshAnything генерирует полигональные сетки, обходясь минимумом необходимых граней, что значительно облегчает хранение, рендеринг и моделирование полученных 3D-объектов. MeshAnything можно интегрировать в различные конвейеры создания 3D-объектов. 🖥 GitHub 🤗 Hugging Face 🟡 Страничка MeshAnything @ai_machinelearning_big_data

🔥 Meta анонсировали четыре новые открытые модели искусственного интеллекта! 🦎 Meta Chameleon Языковые модели 7B и 34B, подд
🔥 Meta анонсировали четыре новые открытые модели искусственного интеллекта! 🦎 Meta Chameleon Языковые модели 7B и 34B, поддерживающие смешанный ввод и вывод только текста. https://arxiv.org/abs/2405.09818 🪙 Meta Multi-Token Prediction Предварительно обученные языковые модели для написания кода. 🎼 Мета-JASCO Модели преобразования текста в музыку, способные принимать различные входные данные. 🗣️ Meta AudioSeal Модель создания ватермарков на аудиодорожки, которая, является первой моделью, разработанной специально для распознавания речи, генерируемой искусственным интеллектом, и доступной по коммерческой лицензии. 📝 Additional RAI artifacts Исследования, данные и код для работы с географическими данными и данными культурных предпочтений в системах искусственного интеллекта. Подробности и доступ ко всему, что будет опубликовано на FAIR сегодня ➡️ https://ai.meta.com/blog/meta-fair-research-new-releases/ *Компания Meta Platforms Inc. признана экстремистской организацией и запрещена на территории РФ. @ai_machinelearning_big_data

+1
🔥 Астрологи объявлили неделю моделей генерации видео! После ажиотажа вокруг моделей Kling, Luma и Runway, вышла новая версия Open-Sora с открытым исходным кодом. На huggingface опубликована Open-Sora 1.2 от компании Hpcoretech. Основные моменты: Новая модель 1.1B, обучена на 20M видео и генерирует видео продолжительностью до 14 секунд с разрешением 720p. ▪Diffusion Model: https://huggingface.co/hpcai-tech/OpenSora-STDiT-v3VAE model: https://huggingface.co/hpcai-tech/OpenSora-VAE-v1.2Technical report: https://github.com/hpcaitech/Open-Sora/blob/main/docs/report_03.mdDemo: https://huggingface.co/spaces/hpcai-tech/open-sora @ai_machinelearning_big_data

🎙️StreamSpeech: Мощная модель синхронного перевода речи. StreamSpeech - это бесшовная модель “Все в одном” для автономного и синхронного распознавания речи, перевода речи и синтеза речи. 💡 StreamSpeech достигает производительности SOTA как при работе офлайн, так и при синхронном переводе речи в речь.page: https://ictnlp.github.io/StreamSpeech-site/paper: https://arxiv.org/abs/2406.03049code: https://github.com/ictnlp/streamspeech @ai_machinelearning_big_data

⚡️ DeepSeek-Coder-V2: Первая модель с открытым исходным кодом, превосходящая GPT4-Turbo в кодинге и математике > > Превосходи
+1
⚡️ DeepSeek-Coder-V2: Первая модель с открытым исходным кодом, превосходящая GPT4-Turbo в кодинге и математике > > Превосходит GPT4-Turbo, Claude3-Opus, Gemini-1.5Pro, Codestral в задачах написания кода и решении математических задач. > Поддерживает 338 языков программирования, длина контекста 128 КБ. > Полностью открытый исходный код двух размеров: 230B и 16 B В таблице Arena-Hard-Auto DeepSeek-Coder-V2 превосходит Yi-large, Claude3-Opus, GL M4 и Qwen2-72B. #DeepSeekCoder ▪HF: https://huggingface.co/deepseek-ai/DeepSeek-Coder-V2-InstructGithub: https://github.com/deepseek-ai/DeepSeek-Coder-V2/blob/main/paper.pdf @ai_machinelearning_big_data

⚡️ Runway AI только что анонсировали Gen-3 Alpha, которая генерирует видео из текста и изображений и будет доступна в ближайшие дни. Что нас ждет — Супер высокая детализация; — Плавные переходы по кадрам; — Длительность роликов до 10 секунд; — Продвинутые инструменты контроля над видео; — Нейронная сеть будет преобразовывать текст в видео, изображение в видео и текст в изображение; — Возможность обучения на собственных стилях На видео сравнение недавно-3 Alpha не и открытой Luma. Разница видна невооруженным взгялдом Для этих генераций были использованы одни и те же промпты. @ai_machinelearning_big_data

🌟 OpenVLA 7B — OpenVLA — VLA-модель с 7B параметрами OpenVLA 7B (vision-language-action) — это open-source модель, обученная
+1
🌟 OpenVLA 7B — OpenVLA — VLA-модель с 7B параметрами OpenVLA 7B (vision-language-action) — это open-source модель, обученная на 970K эпизодах манипулирования роботами из набора данных Open X-Embodiment. Модель принимает на вход текстовый промпт и изображения с камеры и генерирует действия робота. OpenVLA 7B из коробки поддерживает управление несколькими роботами и может быть быстро адаптирована к новым областям робототехники с помощью тонкой настройки. 🖥 GitHub 🟡 Модели на Hugging Face 🟡 Страничка OpenVLA @ai_machinelearning_big_data

🌟 Mamba — семейство SSM-моделей Селективные модели пространства состояний (SSM), такие как Mamba, не имеют некоторых недоста
+1
🌟 Mamba — семейство SSM-моделей Селективные модели пространства состояний (SSM), такие как Mamba, не имеют некоторых недостатков трансформеров, таких как квадратичная вычислительная сложность при увеличении длины последовательности и большие требования к памяти. Более того, недавние исследования показали, что SSM могут соответствовать или превосходить возможности трансформеров, что делает их интересной альтернативой. Однако до сих пор проводились лишь небольшие эксперименты по сравнению SSM с трансформерами. Это исследование призвано исправить ситуацию, здесь проводится прямое сравнение 8B моделей Mamba, Mamba-2 и трансформера, обученных на одних и тех же наборах данных объемом до 3.5Т лексем. Также эти модели сравниваются с гибридной моделью (Mamba-2-Hybrid), состоящей из 43% слоев Mamba-2, 7% слоев Attention и 50% слоев MLP. 🤗 Mamba-2 и другие модели на Hugging Face 🟡 Arxiv @ai_machinelearning_big_data

🌟 Hallo: новый подход в анимации портретных изображений на основе аудио Hallo объединяет генеративные диффузионные модели, д
+1
🌟 Hallo: новый подход в анимации портретных изображений на основе аудио Hallo объединяет генеративные диффузионные модели, денойзер на основе UNet, методы временного согласования отдельных движений и опорную нейросеть, а также даёт возможность контролировать выражение и движения лица. 🖥 GitHub 🟡 Предобученные модели на Hugging Face 🟡 Arxiv @ai_machinelearning_big_data

⚡️ VideoLLaMA 2 — набор open-source Video-LLM, предназначенных для генерации видео
git clone https://github.com/DAMO-NLP-SG/VideoLLaMA2
cd VideoLLaMA2
pip install -r requirements.txt
pip install flash-attn --no-build-isolation
VideoLLaMA 2 — логическое развитие прошлых моделей, включает в себя специализированный компонент пространственно-временной свертки (STC), который эффективно улавливает сложную динамику на видео. 🖥 GitHub 🤗 Демо на HF 🤗 Модель VideoLLaMA 2 на HF @ai_machinelearning_big_data