Data Science | Machinelearning [ru]

Open in Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

Network:Frontender's notes [ru]Russia33 717 Technologies & Applications6 722...

📈 Analytical overview of Telegram channel Data Science | Machinelearning [ru]

Channel Data Science | Machinelearning [ru] (@devsp) in the Russian language segment is an active participant. Currently, the community unites 20 012 subscribers, ranking 6 722 in the Technologies & Applications category and 33 717 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 20 012 subscribers.

According to the latest data from 20 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -78 over the last 30 days and by -10 over the last 24 hours, overall reach remains high.

Verification status: Not verified
Engagement rate (ER): The average audience engagement rate is 8.57%. Within the first 24 hours after publication, content typically collects 3.82% reactions from the total number of subscribers.
Post reach: On average, each post receives 1 715 views. Within the first day, a publication typically gains 765 views.
Reactions and interaction: The audience actively supports content: the average number of reactions per post is 8.
Thematic interests: Content is focused on key topics such as llm, nvidia, контекст, openai, архитектура.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
“Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD”

Thanks to the high frequency of updates (latest data received on 21 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

20 012

Subscribers

-1024 hours

-467 days

-7830 days

1 715

Post views

~ 76524 hours

~ 91148 hours

8.57%

Engagement rate

~ 1

Posts per day

Ads index

beta

Posts Archive

20 009

Залетай на «Технолето» и прокачайся в ML-сфере Приглашаем студентов и начинающих специалистов в области машинного обучения на стажировку «Технолето» от Яндекса. Участников ждет масштабная программа карьерных и развлекательных мероприятий. Стажеры смогут не только углубить свои навыки в IT, но и поближе познакомиться с культурой Яндекса: пообщаться с топовыми специалистами компании, пройтись с интерактивной экскурсией по офисам, посетить дата-центр, а также отдохнуть на диджей-сетах и Алгорейв-вечеринках. Студенты, желающие изучить сферу машинного обучения, освоят востребованные в индустрии навыки ML-сферы и погрузятся во все тонкости направления. На стажировке также можно освоить фронтенд, бэкенд, мобильную разработку, девопс и не только. Стажировка действует круглый год и длится три, четыре или шесть месяцев в зависимости от графика, который выбрал участник. Чтобы поучаствовать в программе, достаточно оставить заявку и решить тестовое задание. Удачи и ждем вас на «Технолето»!

20 009

🗣 OpenVoice V2 - a Text-to-Speech model that can clone any voice and speak in any language OpenVoice V2 - новая версия открытой модели преобразования текста в речь, которая позволяет клонировать любой голос и генерировать речь на различных языках. • Github: https://github.com/myshell-ai/OpenVoice/tree/main • Usage: https://github.com/myshell-ai/OpenVoice/blob/main/docs/USAGE.md @Devsp — Подписаться

20 009

🔇Efficient Large-Scale Audio Tagging Трансформеры доминируют в области по работе с адуио и заменили CNN в качестве современной нейросетевой архитектуры. Трансформеры отлично справляются с огромными аудио датасетами и подходят для создания мощных предварительно обученных моделей. В данной модели используются динамические CNN, которые достигают лучшей производительности на задачах разметки аудио данных и хорошо масштабируются, достигая производительности трансформеров и даже превосходя их. 🖥Github: https://github.com/fschmid56/efficientat 📕Paper: https://arxiv.org/abs/2310.15648v1 ⏩Demo: https://21527a47f03813481c.gradio.live/ @Devsp — Подписаться

20 009

Телеграм-канал для ML-специалистов от Яндекса Yandex for ML — канал для ML-инженеров от Яндекса. Рассказываем, как мы обучаем наши модели и интегрируем их в продукты, как делаем сервисы с архитектурой сразу из нескольких нейросетей, как обучаем модели для специфичных задач и многое другое. Подписывайтесь 👉 @Yandex4ML

20 009

🕵️ Detecting Pretraining Data from Large Language Models Min-K% Prob, простой и эффективный метод, который позволяет определить, была ли LLM предварительно обучена на заданном тексте, а также для обнаружения защищенного авторским правом текста. Метод основан на простой гипотезе: невидимый пример имеет тенденцию содержать несколько слов-выбросов с низкой вероятностью, тогда как видимый пример с меньшей вероятностью будет содержать слова с такой низкой вероятностью. Датасет WikiMIA служит бенчмарком, предназначенным для обнаружения данных предварительного обучения. 🖥Github: https://github.com/swj0419/detect-pretrain-code 📕Paper: https://arxiv.org/pdf/2310.16789.pdf 📘 WikiMIA Benchmark: ⏩Project: https://swj0419.github.io/detect-pretrain.github.io/ @Devsp — Подписаться

20 009

🖼 HiDiffusion: Unlocking High-Resolution Creativity and Efficiency in Low-Resolution Trained Diffusion Models Новый метод, не требующий обучения, который повышает о и скорость предварительно обученных моделей diffusion. • page: https://hidiffusion.github.io • paper: https://arxiv.org/abs/2311.17528 • code: https://github.com/megvii-research/HiDiffusion •colab: https://colab.research.google.com/drive/1EiBn9lSnPZTU4cikRRaBBexs429M-qty?usp=sharing @Devsp — Подписаться

20 009

GitVerse – теперь и для малого и среднего бизнеса На онлайн-презентации «GitVerse: открой вселенную кода» СберТех рассказал про новые фичи платформы. Cреди них – CI/CD-инструменты, ускоряющие разработку, и новые функции GigaCode – персонального AI-ассистента разработчика (AI, artificial intelligence — искусственный интеллект). Но это еще не все: теперь возможности GitVerse доступны не только индивидуальным разработчикам, но и малому и среднему бизнесу. Это очень удобно: можно организовывать совместную работу команды с GitVerse и управлять доступами к своим репозиториям. Готовы попробовать? Присоединяйтесь.

20 009

17 мая собираем всех на IT-конференцию МТС True Tech Day. Наша работа строится на коде, который мы создали из синтеза науки и технологий. Это надёжная и универсальная платформа для разработки продуктов и сервисов. Каждый участник конференции поучаствует в сессиях от лидеров индустрии, испытает технологии в true labs и получит новые впечатления и эмоции. Что будет: → 5 тематических треков: Main, Development, AI/ML, Cloud, Science → 50 спикеров с докладами про архитектуру, облачные платформы, NLP4Code, вероятностное программирование, безопасность контейнеров и другое → 10 часов нетворкинга → цифровые зоны и digital-интеграции → а ещё вечеринка со звездой Все спикеры и темы уже на сайте. Регистрируйся на True Tech Day. Участие бесплатное

20 009

Masked Space-Time Hash Encoding for Efficient Dynamic Scene Reconstruction MSTH - новый метод эффективного восстановления динамических 3D-сцен из многопроекционных или монокулярных видео. 🖥Github: https://github.com/masked-spacetime-hashing/msth 🤗 HH: https://huggingface.co/datasets/masked-spacetime-hashing/Campus 📕Paper: https://arxiv.org/abs/2310.17527v1 ⏩Dataset: https://paperswithcode.com/dataset/mip-nerf-360 @Devsp — Подписаться

20 009

Присоединяйтесь к участникам I’ML — конференции для тех, кто использует в проектах машинное обучение 🗓21–22 мая, онлайн Технические доклады про NLP, MLOps, CV, General ML, RecSys, Advanced Analytics, продукты на основе ML. После докладов пройдут дискуссии при участии спикеров — участники смогут обменяться опытом и задать любые вопросы. Билеты можно купить за счет компании. Для тех, кто покупает билеты сам, у нас есть промокод на скидку 10%: DEVSP Реклама. ООО «Джуг Ру Груп». ИНН 7801341446

20 009

😂Бедный сеньор) @Devsp — Подписаться

20 009

⚡️ Пройди бесплатный тест и узнай, готов ли ты к обучению по Natural Language Processing ❓ Готов ли ты разобраться, как устроены чат-боты? Освоить RAG, Langchain, Fine Tuning? Пройди короткий тест и получи специальную цену на обучение и 3 полезных урока в подарок! ➡️ Давай же, это быстро и очень полезно для твоей карьеры: https://otus.pw/Yn0U/ Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

20 009

🔅 FreeNoise: Tuning-Free Longer Video Diffusion via Noise Rescheduling LongerCrafter (FreeNoise) — это не требующая настройки и экономящая время парадигма для создания более длинных видео на основе предварительно обученных моделей распространения видео. Обширные эксперименты показывают превосходство данного метода по сравнению с предыдущими для расширения генеративных возможностей диффузионных моделей видео. 🖥 Github: https://github.com/arthur-qiu/LongerCrafter 📕 Paper: https://arxiv.org/abs/2310.15169 ⏩ Project: http://haonanqiu.com/projects/FreeNoise.html @Devsp — Подписаться

20 009

Новый Data Science Meetup от X5 🧑‍💻 🗓 25 апреля в 19:00 📍Пространство Articon + онлайн трансляция В числе спикеров - специалисты по работе с большими данными из X5 Tech и Звука. 👉 Поговорим о проверенных и новых методах взаимодействия с пользователями: от рекомендаций музыки до генерации контента и чат-ботов на основе искусственного интеллекта. Также обсудим сложности: галлюцинации, мониторинг языковых моделей, методы улучшения RAG-систем. В конце вечера afterparty 🎉 Регистрируйтесь по ссылке До встречи на митапе! 👋 Реклама. ООО "Корпоративный центр ИКС 5", ОГРН 1077760250941

20 009

☑ PERF: Panoramic Neural Radiance Field from a Single Panorama PERF - новая систему синтеза изображений на 360 градусов, которая обучает панорамное поле нейронного излучения из одной панорамы. PERF позволяет перемещать 3D-изображения в сложной сцене без дорогостоящего и утомительного сбора изображений. Модель подходит для задач преобразование панорамы в 3D, текста в 3D и стилизации 3D-сцен. 🖥 Github: https://github.com/perf-project/PeRF ⚡️Project: https://perf-project.github.io/ 📕Paper: https://arxiv.org/abs/2310.16831v1 ⏩Dataset: https://paperswithcode.com/dataset/replica @Devsp — Подписаться

20 009

🪄IC|TC: Image Clustering Conditioned on Text Criteria Новая методология кластеризации изображений на основе заданных пользователем критериев в форме текста с использованием современных моделей визуального языка и больших языковых моделей. В данной работе представлена новая методика кластеризации изображений на основе заданных пользователем текстовых описаний с использованием современных моделей "зрение-язык" и больших языковых моделей. Метод Image Clustering Conditioned on Text Criteria (IC TC), представляет собой новую парадигму кластеризации изображений и требует минимального вмешательства человека и предоставляет пользователю полный контроль над результатами кластеризации. 🖥 Github: https://github.com/sehyunkwon/ictc 📕Paper: https://arxiv.org/pdf/2310.18297v2.pdf ⏩Tasks: https://paperswithcode.com/task/clustering @Devsp — Подписаться

20 009

Участвуйте в открытом отборе научных статей по AI/ML: получите возможность опубликовать статью и представить ее на площадке международной конференции по искусственному интеллекту AI Journey! Лучшая статья получит 1 млн рублей! Стартовал приём заявок для отбора статей к публикации в журнале «Доклады Российской академии наук. Математика, информатика, процессы управления» и его англоязычной версии Doklady Mathematics. Специальное издание выйдет в рамках ежегодной международной конференции по искусственному интеллекту AI Journey. Заявку можно подать на сайте до 20 августа. Статья может быть оформлена на русском или английском языке, а также должна представлять только ранее не опубликованные сведения. Более детальную информацию можно найти в Правилах проведения отбора. Не упустите возможность презентовать свои исследования перед научным сообществом и побороться за денежное вознаграждение! Узнать подробнее о Правилах и отправить заявку -▻ AI Journey

20 009

🔥 Learning From Mistakes Makes LLM Better Reasoner Модели больших языков (LLM) недавно продемонстрировали замечательные способности к рассуждению на решение математических задач. Имитируя этот процесс обучения, основанный на ошибках, LEMA точно настраивает LLM на парах данных для исправления ошибок, сгенерированных GPT-4. LLM и две задачи по математическому рассуждению, LEMA последовательно улучшает производительность по сравнению с точной настройкой только на основе данных CoT. 🖥 Github: https://github.com/microsoft/codet 📕Paper: https://arxiv.org/pdf/2310.20689v1.pdf ⏩Dataset: https://paperswithcode.com/dataset/math @Devsp — Подписаться

20 009

🦙 Файнтюниг Llama 3 с помощью ORPO. Краткое руководство о том, как настроить новую модель Llama 3 8B с ORPO. Эта модель использует контекстное окно размером 8 КБ. Он был обучен с помощью шаблона ChatML. 🤗 Модель: https://huggingface.co/mlabonne/OrpoLlama-3-8B 💻 Colab: https://colab.research.google.com/drive/1eHNWg9gnaXErdAa8_mcvjMupbSS6rDvi?usp=sharing 📝 Статья: https://huggingface.co/blog/mlabonne/orpo-llama-3 @Devsp — Подписаться