Machinelearning

Open in Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Network:Machinelearning Russia1 275 Technologies & Applications333...

📈 Analytical overview of Telegram channel Machinelearning

Channel Machinelearning (@ai_machinelearning_big_data) in the Russian language segment is an active participant. Currently, the community unites 295 417 subscribers, ranking 333 in the Technologies & Applications category and 1 275 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 295 417 subscribers.

According to the latest data from 24 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -6 346 over the last 30 days and by -267 over the last 24 hours, overall reach remains high.

Verification status: Not verified
Engagement rate (ER): The average audience engagement rate is 7.94%. Within the first 24 hours after publication, content typically collects 5.71% reactions from the total number of subscribers.
Post reach: On average, each post receives 23 454 views. Within the first day, a publication typically gains 16 873 views.
Reactions and interaction: The audience actively supports content: the average number of reactions per post is 183.
Thematic interests: Content is focused on key topics such as openai, claude, api, gemini, контекст.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

Thanks to the high frequency of updates (latest data received on 25 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

295 417

Subscribers

-26724 hours

-1 5017 days

-6 34630 days

23 454

Post views

~ 16 87324 hours

~ 18 97748 hours

7.94%

Engagement rate

~ 5

Posts per day

Ads index

beta

Posts Archive

295 339

🌟 Modded-NanoGPT — позволяет добиться качества GPT-2 (124M) при обучении всего на 5B лексем Modded-NanoGPT — это модификация того кода для обучения GPT-2 от Андрея Карпати. Modded-NanoGPT позволяет: — обучать в 2 раза эффективнее (требуется всего 5B лексем вместо 10B для достижения той же точности) — имеет более простой код (446 строк вместо 858) 🖥 GitHub @ai_machinelearning_big_data

295 339

⚡️ Anthropic только что представлии Claude 3.5 Sonnet, модель которая превосходит GPT-4 почти на всех тестах. В Claude 3.5 Sonnet добавлена поддержка «артефактов», позволяющая выдавать результаты в различных форматах, таких как код, текстовые документы, изображения и другие. Claude 3.5 Sonnet уже доступна бесплатно для всех пользователей. До конца года Anthropic планируют выпустить Claude 3.5 Haiku (более компактная и быстрая) и Claude 3.5 Opus (самая мощная модель). Вы можете попросить модель создать документы, код, диаграммы, векторную графику и многое другое . Попробуйте бесплатно: http://claude.ai @ai_machinelearning_big_data

295 339

🦜 Toucan — open-source TTS-модель с поддержкой 7000 языков и диалектов Toucan — это модель преобразования текста в речь (TTS) + набор инструментов для обучения, тренировки и развертывания модели. Модель создана в Институте обработки естественного языка (IMS) Штутгартского университета. Всё написано на идиоматическом Python с использованием PyTorch, для максимально лёгкого изучения и тестирования. 🖥 GitHub 🤗 Затестить на HF 🤗 Датасет на HF @ai_machinelearning_big_data

295 339

⚡️Как устроены ChatGPT, Siri, Алиса и Маруся — и какие навыки нужны, чтобы запускать такие продукты? Приходите на бесплатный онлайн-практикум от ТГУ и Skillfactory 27 июня в 19:00 мск. За 1,5 часа эксперт расскажет: — что такое обработка естественного языка; — как использовать ее для анализа текстов, проверки бизнес-идей и научных гипотез; — какие технологии сейчас востребованы на рынке. Регистрируйтесь бесплатно по ссылке: https://go.skillfactory.ru/&erid=2VtzqwadDRZ Получите в подарок курс по математике. Реклама ООО "Скилфэктори", ИНН 9702009530

295 339

🌟 Magnum-72B-v1 — LLM, которая умеет в прозу и стихи (как Sonnet и Opus от Claude AI) Magnum-72B-v1 создана на базе Qwen-2 72B. Обучение проводилось на 55 миллионах токенов высококачественных данных. Для тонкой настройки всех параметров модели было использовано 8 ускорителей AMD Instinct MI300X. 🤗 Hugging Face @ai_machinelearning_big_data

295 339

🌟 GEB-1.3B — open-source облегченная LLM GEB-1.3B — это лёгкая LLM, обученная на 550 миллиардах лексем. При всей своей лёгкости модель превосходит Llama-7B и схожие LLM в 3 метриках из 4 (C-Eval, CMMLU, Average) Для достижения такого впечатляющего результата были использованы новые методы обучения, включая ROPE, Group-Query-Attention и FlashAttention-2, для ускорения обучения при сохранении производительности LLM. Кроме того, была произведена тонкая настройка модели при помощи 10 миллионов разных промптов и инструкций. Кстати, квантизованная FP32-версия GEB-1.3B довольно быстро работает даже на CPU, при этом продолжаются работы по дальнейшему увеличению скорости с помощью квантования. 🟡 Arxiv 🤗 Hugging Face @ai_machinelearning_big_data

295 339

DataOps Platform от МТС получила награду от CNews в номинации “Инновация года: Self-Service платформа для работы с большими данными". Платформа предоставляет инструменты для хранения, обработки, контроля качества и виртуализации данных, а также построения отчётности и многое другое. Успешное замещение импортных сервисов на собственную платформу принесло экономию до 1,5 млрд рублей за год. Отличный шаг в развитии цифровой экосистемы. @ai_machinelearning_big_data

295 339

🌟 Open Interpreter — полное управление компьютером при помощи запросов на естественном языке

pip install open-interpreter
interpreter

Open Interpreter предоставляет интерфейс естественного языка для управления компьютером. Можно общаться с Open Interpreter через ChatGPT-подобный интерфейс прямо в терминале. При помощи Open Interpreter можно на естественном языке выполнять такие действия как: — создание и редактирование фотографий, видео, PDF-файлов и т. д. — управление браузером — анализ данных, построение графиков и т.д. 🖥 GitHub 🟡 Доки @ai_machinelearning_big_data

295 339

⚡️ Florence-2 — open-source VLM от Microsoft Microsoft выкатили Florence-2 — модель, принимающую изображения на вход, способную решать многие задачи CV (распознавание, сегментирование, OCR). Есть 2 основные версии — base и large (200M и 800M параметров), при этом обе версии модели отлично себя показывают в сравнении с моделями, которые тяжелее в 100 раз 🤗 Hugging Face 🟡 Arxiv @ai_machinelearning_big_data

295 339

🔥Хотите перейти в ML и построить успешную карьеру? В OTUS стартует курс "Machine Learning. Professional", обучение на котором позволит последовательно освоить современные инструменты анализа данных и на профессиональном уровне создавать модели машинного обучения. ⚡25 июня в 20.00 мск приглашаем на открытое практическое занятие "Карьерные переходы в ML или старт в новой профессии", где мы разберем: - стратегии перехода; - правильное оформление резюме; - прохождение интервью; - реальные кейсы из опыта эксперта. Условие участия - вступительное тестирование 👉Пройти тест и записаться на мероприятие https://otus.pw/Cnfe/?erid=LjN8K8nhJ При поступлении в группу обучения возможны разные способы оплаты и рассрочка платежа.

295 339

⚡️ MeshAnything: генерация качественной полигональной сетки с помощью авторегрессионных трансформеров MeshAnything строит полигональную сетку так же, как это делал бы человек. При этом MeshAnything генерирует полигональные сетки, обходясь минимумом необходимых граней, что значительно облегчает хранение, рендеринг и моделирование полученных 3D-объектов. MeshAnything можно интегрировать в различные конвейеры создания 3D-объектов. 🖥 GitHub 🤗 Hugging Face 🟡 Страничка MeshAnything @ai_machinelearning_big_data

295 339

🔥 Meta анонсировали четыре новые открытые модели искусственного интеллекта! 🦎 Meta Chameleon Языковые модели 7B и 34B, поддерживающие смешанный ввод и вывод только текста. https://arxiv.org/abs/2405.09818 🪙 Meta Multi-Token Prediction Предварительно обученные языковые модели для написания кода. 🎼 Мета-JASCO Модели преобразования текста в музыку, способные принимать различные входные данные. 🗣️ Meta AudioSeal Модель создания ватермарков на аудиодорожки, которая, является первой моделью, разработанной специально для распознавания речи, генерируемой искусственным интеллектом, и доступной по коммерческой лицензии. 📝 Additional RAI artifacts Исследования, данные и код для работы с географическими данными и данными культурных предпочтений в системах искусственного интеллекта. Подробности и доступ ко всему, что будет опубликовано на FAIR сегодня ➡️ https://ai.meta.com/blog/meta-fair-research-new-releases/ *Компания Meta Platforms Inc. признана экстремистской организацией и запрещена на территории РФ. @ai_machinelearning_big_data

295 339

🔥 Астрологи объявлили неделю моделей генерации видео! После ажиотажа вокруг моделей Kling, Luma и Runway, вышла новая версия Open-Sora с открытым исходным кодом. На huggingface опубликована Open-Sora 1.2 от компании Hpcoretech. Основные моменты: Новая модель 1.1B, обучена на 20M видео и генерирует видео продолжительностью до 14 секунд с разрешением 720p. ▪Diffusion Model: https://huggingface.co/hpcai-tech/OpenSora-STDiT-v3 ▪VAE model: https://huggingface.co/hpcai-tech/OpenSora-VAE-v1.2 ▪Technical report: https://github.com/hpcaitech/Open-Sora/blob/main/docs/report_03.md ▪Demo: https://huggingface.co/spaces/hpcai-tech/open-sora @ai_machinelearning_big_data

295 339

🎙️StreamSpeech: Мощная модель синхронного перевода речи. StreamSpeech - это бесшовная модель “Все в одном” для автономного и синхронного распознавания речи, перевода речи и синтеза речи. 💡 StreamSpeech достигает производительности SOTA как при работе офлайн, так и при синхронном переводе речи в речь. ▪page: https://ictnlp.github.io/StreamSpeech-site/ ▪paper: https://arxiv.org/abs/2406.03049 ▪code: https://github.com/ictnlp/streamspeech @ai_machinelearning_big_data

295 339

⚡️ DeepSeek-Coder-V2: Первая модель с открытым исходным кодом, превосходящая GPT4-Turbo в кодинге и математике > > Превосходит GPT4-Turbo, Claude3-Opus, Gemini-1.5Pro, Codestral в задачах написания кода и решении математических задач. > Поддерживает 338 языков программирования, длина контекста 128 КБ. > Полностью открытый исходный код двух размеров: 230B и 16 B В таблице Arena-Hard-Auto DeepSeek-Coder-V2 превосходит Yi-large, Claude3-Opus, GL M4 и Qwen2-72B. #DeepSeekCoder ▪HF: https://huggingface.co/deepseek-ai/DeepSeek-Coder-V2-Instruct ▪Github: https://github.com/deepseek-ai/DeepSeek-Coder-V2/blob/main/paper.pdf @ai_machinelearning_big_data

295 339

⚡️ Runway AI только что анонсировали Gen-3 Alpha, которая генерирует видео из текста и изображений и будет доступна в ближайшие дни. Что нас ждет — Супер высокая детализация; — Плавные переходы по кадрам; — Длительность роликов до 10 секунд; — Продвинутые инструменты контроля над видео; — Нейронная сеть будет преобразовывать текст в видео, изображение в видео и текст в изображение; — Возможность обучения на собственных стилях На видео сравнение недавно-3 Alpha не и открытой Luma. Разница видна невооруженным взгялдом Для этих генераций были использованы одни и те же промпты. @ai_machinelearning_big_data

295 339

🌟 OpenVLA 7B — OpenVLA — VLA-модель с 7B параметрами OpenVLA 7B (vision-language-action) — это open-source модель, обученная на 970K эпизодах манипулирования роботами из набора данных Open X-Embodiment. Модель принимает на вход текстовый промпт и изображения с камеры и генерирует действия робота. OpenVLA 7B из коробки поддерживает управление несколькими роботами и может быть быстро адаптирована к новым областям робототехники с помощью тонкой настройки. 🖥 GitHub 🟡 Модели на Hugging Face 🟡 Страничка OpenVLA @ai_machinelearning_big_data

295 339

🌟 Mamba — семейство SSM-моделей Селективные модели пространства состояний (SSM), такие как Mamba, не имеют некоторых недостатков трансформеров, таких как квадратичная вычислительная сложность при увеличении длины последовательности и большие требования к памяти. Более того, недавние исследования показали, что SSM могут соответствовать или превосходить возможности трансформеров, что делает их интересной альтернативой. Однако до сих пор проводились лишь небольшие эксперименты по сравнению SSM с трансформерами. Это исследование призвано исправить ситуацию, здесь проводится прямое сравнение 8B моделей Mamba, Mamba-2 и трансформера, обученных на одних и тех же наборах данных объемом до 3.5Т лексем. Также эти модели сравниваются с гибридной моделью (Mamba-2-Hybrid), состоящей из 43% слоев Mamba-2, 7% слоев Attention и 50% слоев MLP. 🤗 Mamba-2 и другие модели на Hugging Face 🟡 Arxiv @ai_machinelearning_big_data

295 339

🌟 Hallo: новый подход в анимации портретных изображений на основе аудио Hallo объединяет генеративные диффузионные модели, денойзер на основе UNet, методы временного согласования отдельных движений и опорную нейросеть, а также даёт возможность контролировать выражение и движения лица. 🖥 GitHub 🟡 Предобученные модели на Hugging Face 🟡 Arxiv @ai_machinelearning_big_data

295 339

⚡️ VideoLLaMA 2 — набор open-source Video-LLM, предназначенных для генерации видео

git clone https://github.com/DAMO-NLP-SG/VideoLLaMA2
cd VideoLLaMA2
pip install -r requirements.txt
pip install flash-attn --no-build-isolation

VideoLLaMA 2 — логическое развитие прошлых моделей, включает в себя специализированный компонент пространственно-временной свертки (STC), который эффективно улавливает сложную динамику на видео. 🖥 GitHub 🤗 Демо на HF 🤗 Модель VideoLLaMA 2 на HF @ai_machinelearning_big_data