uk
Feedback
Machinelearning

Machinelearning

Відкрити в Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Показати більше

📈 Аналітичний огляд Telegram-каналу Machinelearning

Канал Machinelearning (@ai_machinelearning_big_data) у мовному сегменті Російська є активним учасником. На даний момент спільнота об'єднує 295 417 підписників, посідаючи 333 місце в категорії Технології та додатки та 1 275 місце у регіоні Росія.

📊 Показники аудиторії та динаміка

З моменту свого створення невідомо, проект продемонстрував стрімке зростання, зібравши аудиторію у 295 417 підписників.

За останніми даними від 24 червня, 2026, канал демонструє стабільну активність. Хоча за останні 30 днів спостерігається зміна кількості учасників на -6 346, а за останні 24 години на -267, загальне охоплення залишається високим.

  • Статус верифікації: Не верифікований
  • Рівень залученості (ER): Середній показник залученості аудиторії становить 7.94%. Протягом перших 24 годин після публікації контент зазвичай збирає 5.71% реакцій від загальної кількості підписників.
  • Охоплення публікацій: В середньому кожен допис отримує 23 454 переглядів. Протягом першої доби публікація в середньому набирає 16 873 переглядів.
  • Реакції та взаємодія: Аудиторія активно підтримує контент: середня кількість реакцій на один пост – 183.
  • Тематичні інтереси: Контент зосереджений навколо ключових тем, таких як openai, claude, api, gemini, контекст.

📝 Опис та контентна політика

Автор описує ресурс як майданчик для висловлення суб'єктивної думки:
Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Завдяки високій частоті оновлень (останні дані отримано 25 червня, 2026), канал підтримує актуальність та високий рівень охоплення публікацій. Аналітика показує, що аудиторія активно взаємодіє з контентом, що робить його важливою точкою впливу в категорії Технології та додатки.

295 417
Підписники
-26724 години
-1 5017 днів
-6 34630 день
Архів дописів
🌟 Modded-NanoGPT — позволяет добиться качества GPT-2 (124M) при обучении всего на 5B лексем Modded-NanoGPT — это модификация
🌟 Modded-NanoGPT — позволяет добиться качества GPT-2 (124M) при обучении всего на 5B лексем Modded-NanoGPT — это модификация того кода для обучения GPT-2 от Андрея Карпати. Modded-NanoGPT позволяет: — обучать в 2 раза эффективнее (требуется всего 5B лексем вместо 10B для достижения той же точности) — имеет более простой код (446 строк вместо 858) 🖥 GitHub @ai_machinelearning_big_data

⚡️ Anthropic только что представлии Claude 3.5 Sonnet, модель которая превосходит GPT-4 почти на всех тестах. В Claude 3.5 So
⚡️ Anthropic только что представлии Claude 3.5 Sonnet, модель которая превосходит GPT-4 почти на всех тестах. В Claude 3.5 Sonnet добавлена поддержка «артефактов», позволяющая выдавать результаты в различных форматах, таких как код, текстовые документы, изображения и другие. Claude 3.5 Sonnet уже доступна бесплатно для всех пользователей. До конца года Anthropic планируют выпустить Claude 3.5 Haiku (более компактная и быстрая) и Claude 3.5 Opus (самая мощная модель). Вы можете попросить модель создать документы, код, диаграммы, векторную графику и многое другое . Попробуйте бесплатно: http://claude.ai @ai_machinelearning_big_data

🦜 Toucan — open-source TTS-модель с поддержкой 7000 языков и диалектов Toucan — это модель преобразования текста в речь (TTS
+2
🦜 Toucan — open-source TTS-модель с поддержкой 7000 языков и диалектов Toucan — это модель преобразования текста в речь (TTS) + набор инструментов для обучения, тренировки и развертывания модели. Модель создана в Институте обработки естественного языка (IMS) Штутгартского университета. Всё написано на идиоматическом Python с использованием PyTorch, для максимально лёгкого изучения и тестирования. 🖥 GitHub 🤗 Затестить на HF 🤗 Датасет на HF @ai_machinelearning_big_data

⚡️Как устроены ChatGPT, Siri, Алиса и Маруся — и какие навыки нужны, чтобы запускать такие продукты? Приходите на бесплатный
⚡️Как устроены ChatGPT, Siri, Алиса и Маруся — и какие навыки нужны, чтобы запускать такие продукты? Приходите на бесплатный онлайн-практикум от ТГУ и Skillfactory 27 июня в 19:00 мск. За 1,5 часа эксперт расскажет: — что такое обработка естественного языка; — как использовать ее для анализа текстов, проверки бизнес-идей и научных гипотез; — какие технологии сейчас востребованы на рынке. Регистрируйтесь бесплатно по ссылке: https://go.skillfactory.ru/&erid=2VtzqwadDRZ Получите в подарок курс по математике. Реклама ООО "Скилфэктори", ИНН 9702009530

🌟 Magnum-72B-v1 — LLM, которая умеет в прозу и стихи (как Sonnet и Opus от Claude AI) Magnum-72B-v1 создана на базе Qwen-2 7
🌟 Magnum-72B-v1 — LLM, которая умеет в прозу и стихи (как Sonnet и Opus от Claude AI) Magnum-72B-v1 создана на базе Qwen-2 72B. Обучение проводилось на 55 миллионах токенов высококачественных данных. Для тонкой настройки всех параметров модели было использовано 8 ускорителей AMD Instinct MI300X. 🤗 Hugging Face @ai_machinelearning_big_data

🌟 GEB-1.3B — open-source облегченная LLM GEB-1.3B — это лёгкая LLM, обученная на 550 миллиардах лексем. При всей своей лёгко
+1
🌟 GEB-1.3B — open-source облегченная LLM GEB-1.3B — это лёгкая LLM, обученная на 550 миллиардах лексем. При всей своей лёгкости модель превосходит Llama-7B и схожие LLM в 3 метриках из 4 (C-Eval, CMMLU, Average) Для достижения такого впечатляющего результата были использованы новые методы обучения, включая ROPE, Group-Query-Attention и FlashAttention-2, для ускорения обучения при сохранении производительности LLM. Кроме того, была произведена тонкая настройка модели при помощи 10 миллионов разных промптов и инструкций. Кстати, квантизованная FP32-версия GEB-1.3B довольно быстро работает даже на CPU, при этом продолжаются работы по дальнейшему увеличению скорости с помощью квантования. 🟡 Arxiv 🤗 Hugging Face @ai_machinelearning_big_data

DataOps Platform от МТС получила награду от CNews в номинации “Инновация года: Self-Service платформа для работы с большими д
DataOps Platform от МТС получила награду от CNews в номинации “Инновация года: Self-Service платформа для работы с большими данными". Платформа предоставляет инструменты для хранения, обработки, контроля качества и виртуализации данных, а также построения отчётности и многое другое. Успешное замещение импортных сервисов на собственную платформу принесло экономию до 1,5 млрд рублей за год. Отличный шаг в развитии цифровой экосистемы. @ai_machinelearning_big_data

🌟 Open Interpreter — полное управление компьютером при помощи запросов на естественном языке
pip install open-interpreter
interpreter
Open Interpreter предоставляет интерфейс естественного языка для управления компьютером. Можно общаться с Open Interpreter через ChatGPT-подобный интерфейс прямо в терминале. При помощи Open Interpreter можно на естественном языке выполнять такие действия как: — создание и редактирование фотографий, видео, PDF-файлов и т. д. — управление браузером — анализ данных, построение графиков и т.д. 🖥 GitHub 🟡 Доки @ai_machinelearning_big_data

⚡️ Florence-2 — open-source VLM от Microsoft Microsoft выкатили Florence-2 — модель, принимающую изображения на вход, способн
+3
⚡️ Florence-2 — open-source VLM от Microsoft Microsoft выкатили Florence-2 — модель, принимающую изображения на вход, способную решать многие задачи CV (распознавание, сегментирование, OCR). Есть 2 основные версии — base и large (200M и 800M параметров), при этом обе версии модели отлично себя показывают в сравнении с моделями, которые тяжелее в 100 раз 🤗 Hugging Face 🟡 Arxiv @ai_machinelearning_big_data

🔥Хотите перейти в ML и построить успешную карьеру? В OTUS стартует курс "Machine Learning. Professional", обучение на которо
🔥Хотите перейти в ML и построить успешную карьеру?  В OTUS стартует курс "Machine Learning. Professional", обучение на котором позволит последовательно освоить современные инструменты анализа данных и на профессиональном уровне создавать модели машинного обучения.  ⚡25 июня в 20.00 мск приглашаем на открытое практическое занятие "Карьерные переходы в ML или старт в новой профессии", где мы разберем: - стратегии перехода; - правильное оформление резюме; - прохождение интервью; - реальные кейсы из опыта эксперта.  Условие участия - вступительное тестирование  👉Пройти тест и записаться на мероприятие https://otus.pw/Cnfe/?erid=LjN8K8nhJ При поступлении в группу обучения возможны разные способы оплаты и рассрочка платежа. 

⚡️ MeshAnything: генерация качественной полигональной сетки с помощью авторегрессионных трансформеров MeshAnything строит полигональную сетку так же, как это делал бы человек. При этом MeshAnything генерирует полигональные сетки, обходясь минимумом необходимых граней, что значительно облегчает хранение, рендеринг и моделирование полученных 3D-объектов. MeshAnything можно интегрировать в различные конвейеры создания 3D-объектов. 🖥 GitHub 🤗 Hugging Face 🟡 Страничка MeshAnything @ai_machinelearning_big_data

🔥 Meta анонсировали четыре новые открытые модели искусственного интеллекта! 🦎 Meta Chameleon Языковые модели 7B и 34B, подд
🔥 Meta анонсировали четыре новые открытые модели искусственного интеллекта! 🦎 Meta Chameleon Языковые модели 7B и 34B, поддерживающие смешанный ввод и вывод только текста. https://arxiv.org/abs/2405.09818 🪙 Meta Multi-Token Prediction Предварительно обученные языковые модели для написания кода. 🎼 Мета-JASCO Модели преобразования текста в музыку, способные принимать различные входные данные. 🗣️ Meta AudioSeal Модель создания ватермарков на аудиодорожки, которая, является первой моделью, разработанной специально для распознавания речи, генерируемой искусственным интеллектом, и доступной по коммерческой лицензии. 📝 Additional RAI artifacts Исследования, данные и код для работы с географическими данными и данными культурных предпочтений в системах искусственного интеллекта. Подробности и доступ ко всему, что будет опубликовано на FAIR сегодня ➡️ https://ai.meta.com/blog/meta-fair-research-new-releases/ *Компания Meta Platforms Inc. признана экстремистской организацией и запрещена на территории РФ. @ai_machinelearning_big_data

+1
🔥 Астрологи объявлили неделю моделей генерации видео! После ажиотажа вокруг моделей Kling, Luma и Runway, вышла новая версия Open-Sora с открытым исходным кодом. На huggingface опубликована Open-Sora 1.2 от компании Hpcoretech. Основные моменты: Новая модель 1.1B, обучена на 20M видео и генерирует видео продолжительностью до 14 секунд с разрешением 720p. ▪Diffusion Model: https://huggingface.co/hpcai-tech/OpenSora-STDiT-v3VAE model: https://huggingface.co/hpcai-tech/OpenSora-VAE-v1.2Technical report: https://github.com/hpcaitech/Open-Sora/blob/main/docs/report_03.mdDemo: https://huggingface.co/spaces/hpcai-tech/open-sora @ai_machinelearning_big_data

🎙️StreamSpeech: Мощная модель синхронного перевода речи. StreamSpeech - это бесшовная модель “Все в одном” для автономного и синхронного распознавания речи, перевода речи и синтеза речи. 💡 StreamSpeech достигает производительности SOTA как при работе офлайн, так и при синхронном переводе речи в речь.page: https://ictnlp.github.io/StreamSpeech-site/paper: https://arxiv.org/abs/2406.03049code: https://github.com/ictnlp/streamspeech @ai_machinelearning_big_data

⚡️ DeepSeek-Coder-V2: Первая модель с открытым исходным кодом, превосходящая GPT4-Turbo в кодинге и математике > > Превосходи
+1
⚡️ DeepSeek-Coder-V2: Первая модель с открытым исходным кодом, превосходящая GPT4-Turbo в кодинге и математике > > Превосходит GPT4-Turbo, Claude3-Opus, Gemini-1.5Pro, Codestral в задачах написания кода и решении математических задач. > Поддерживает 338 языков программирования, длина контекста 128 КБ. > Полностью открытый исходный код двух размеров: 230B и 16 B В таблице Arena-Hard-Auto DeepSeek-Coder-V2 превосходит Yi-large, Claude3-Opus, GL M4 и Qwen2-72B. #DeepSeekCoder ▪HF: https://huggingface.co/deepseek-ai/DeepSeek-Coder-V2-InstructGithub: https://github.com/deepseek-ai/DeepSeek-Coder-V2/blob/main/paper.pdf @ai_machinelearning_big_data

⚡️ Runway AI только что анонсировали Gen-3 Alpha, которая генерирует видео из текста и изображений и будет доступна в ближайшие дни. Что нас ждет — Супер высокая детализация; — Плавные переходы по кадрам; — Длительность роликов до 10 секунд; — Продвинутые инструменты контроля над видео; — Нейронная сеть будет преобразовывать текст в видео, изображение в видео и текст в изображение; — Возможность обучения на собственных стилях На видео сравнение недавно-3 Alpha не и открытой Luma. Разница видна невооруженным взгялдом Для этих генераций были использованы одни и те же промпты. @ai_machinelearning_big_data

🌟 OpenVLA 7B — OpenVLA — VLA-модель с 7B параметрами OpenVLA 7B (vision-language-action) — это open-source модель, обученная
+1
🌟 OpenVLA 7B — OpenVLA — VLA-модель с 7B параметрами OpenVLA 7B (vision-language-action) — это open-source модель, обученная на 970K эпизодах манипулирования роботами из набора данных Open X-Embodiment. Модель принимает на вход текстовый промпт и изображения с камеры и генерирует действия робота. OpenVLA 7B из коробки поддерживает управление несколькими роботами и может быть быстро адаптирована к новым областям робототехники с помощью тонкой настройки. 🖥 GitHub 🟡 Модели на Hugging Face 🟡 Страничка OpenVLA @ai_machinelearning_big_data

🌟 Mamba — семейство SSM-моделей Селективные модели пространства состояний (SSM), такие как Mamba, не имеют некоторых недоста
+1
🌟 Mamba — семейство SSM-моделей Селективные модели пространства состояний (SSM), такие как Mamba, не имеют некоторых недостатков трансформеров, таких как квадратичная вычислительная сложность при увеличении длины последовательности и большие требования к памяти. Более того, недавние исследования показали, что SSM могут соответствовать или превосходить возможности трансформеров, что делает их интересной альтернативой. Однако до сих пор проводились лишь небольшие эксперименты по сравнению SSM с трансформерами. Это исследование призвано исправить ситуацию, здесь проводится прямое сравнение 8B моделей Mamba, Mamba-2 и трансформера, обученных на одних и тех же наборах данных объемом до 3.5Т лексем. Также эти модели сравниваются с гибридной моделью (Mamba-2-Hybrid), состоящей из 43% слоев Mamba-2, 7% слоев Attention и 50% слоев MLP. 🤗 Mamba-2 и другие модели на Hugging Face 🟡 Arxiv @ai_machinelearning_big_data

🌟 Hallo: новый подход в анимации портретных изображений на основе аудио Hallo объединяет генеративные диффузионные модели, д
+1
🌟 Hallo: новый подход в анимации портретных изображений на основе аудио Hallo объединяет генеративные диффузионные модели, денойзер на основе UNet, методы временного согласования отдельных движений и опорную нейросеть, а также даёт возможность контролировать выражение и движения лица. 🖥 GitHub 🟡 Предобученные модели на Hugging Face 🟡 Arxiv @ai_machinelearning_big_data

⚡️ VideoLLaMA 2 — набор open-source Video-LLM, предназначенных для генерации видео
git clone https://github.com/DAMO-NLP-SG/VideoLLaMA2
cd VideoLLaMA2
pip install -r requirements.txt
pip install flash-attn --no-build-isolation
VideoLLaMA 2 — логическое развитие прошлых моделей, включает в себя специализированный компонент пространственно-временной свертки (STC), который эффективно улавливает сложную динамику на видео. 🖥 GitHub 🤗 Демо на HF 🤗 Модель VideoLLaMA 2 на HF @ai_machinelearning_big_data