Data Science | Machinelearning [ru]

Open in Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

Network:Frontender's notes [ru]Russia33 717 Technologies & Applications6 722...

📈 Analytical overview of Telegram channel Data Science | Machinelearning [ru]

Channel Data Science | Machinelearning [ru] (@devsp) in the Russian language segment is an active participant. Currently, the community unites 20 007 subscribers, ranking 6 722 in the Technologies & Applications category and 33 717 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 20 007 subscribers.

According to the latest data from 20 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -78 over the last 30 days and by -10 over the last 24 hours, overall reach remains high.

Verification status: Not verified
Engagement rate (ER): The average audience engagement rate is 8.57%. Within the first 24 hours after publication, content typically collects 3.82% reactions from the total number of subscribers.
Post reach: On average, each post receives 1 715 views. Within the first day, a publication typically gains 765 views.
Reactions and interaction: The audience actively supports content: the average number of reactions per post is 8.
Thematic interests: Content is focused on key topics such as llm, nvidia, контекст, openai, архитектура.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
“Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD”

Thanks to the high frequency of updates (latest data received on 21 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

20 007

Subscribers

-1024 hours

-467 days

-7830 days

1 715

Post views

~ 76524 hours

~ 91148 hours

8.57%

Engagement rate

~ 1

Posts per day

Ads index

beta

Posts Archive

20 004

☕️ Latte: Latent Diffusion Transformer for Video Generation Новый трансформер скрытой диффузии Latte, для генерации видео. Latte сначала извлекает пространственно-временные маркеры из входных видео, а затем использует серию блоков-трансформеров для генерации видео в скрытом пространстве. Latte дает ценную информацию для будущих исследований по включению Трансформеров в модели диффузии для генерации видео. ▪️Github ▪️Project ▪️Paper @Devsp — Подписаться

20 004

Авито ищет аналитиков — получить оффер можно за одни выходные! Вот, что ждет вас на позиции: — зарплата от 200 до 480 тысяч рублей в зависимости от грейда; — расширенный ДМС, компенсация питания и другие бонусы; — формат работы на выбор: офис или удаленка; — возможность поучаствовать в разработке новых продуктов — обучать модели, делать прогнозы, экспериментировать и автоматизировать. Авито — это про карьерное развитие и комфортные условия. Регистрируйтесь на Weekend Offer до 4 апреля: https://u.to/nweIIA

20 004

🌊 LaVague: automate automation with Large Action Model framework LaVague — это проект с открытым исходным кодом, предназначенный для автоматизации рутинных задач от имени своих пользователей. ▪Github: https://github.com/lavague-ai/LaVague ▪Docs: https://docs.lavague.ai/en/latest/docs/ ▪Colab: https://colab.research.google.com/github/lavague-ai/LaVague/blob/main/docs/docs/get-started/quick-tour.ipynb @Devsp — Подписаться

20 004

⁉️ Что такое языковое моделирование и как с ним работать в машинном обучении? 💻 Расскажет Мария Тихонова – PhD Computer Science, Senior Data Scientist в SberDevices и преподаватель ВШЭ. Встречаемся на бесплатном практическом уроке от OTUS, где вы: — узнаете, что такое языковое моделирование и зачем в NLP используют языковые модели; — рассмотрите основные языковые модели: от простейших статистических до самых мощных трансформерных архитектур, таких как GPT; — получите ответы на все вопросы по теме. 📌 Встречаемся 1 апреля в 18:00 мск в рамках курса «Natural Language Processing (NLP)». Доступна рассрочка на обучение! 🔴 Пройдите короткий тест прямо сейчас, чтобы посетить бесплатный урок и получить запись: https://otus.pw/Vrc8/ Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

20 004

🐬 ShareGPT4V:Improving Large Multi-Modal Models with Better Captions В сфере больших мультимодальных моделей (LMM) эффективное согласование модальностей имеет решающее значение, но часто ограничивается нехваткой высококачественных данных изображения и текста. Чтобы устранить это узкое место, мы представляем набор данных ShareGPT4V, новаторский крупномасштабный ресурс, содержащий 1,2 миллиона высокоописательных подписей, который превосходит существующие наборы данных по разнообразию и информативности, охватывая мировые знания, свойства объектов, пространственные отношения и эстетические оценки. ShareGPT4V создан на основе 100 тысяч высококачественных подписей, собранных с помощью усовершенствованного GPT4-Vision, и был расширен до 1,2 миллиона с помощью превосходной модели подписей, обученной на этом подмножестве. 🖥Code: https://github.com/InternLM/InternLM-XComposer/tree/main/projects/ShareGPT4V 🦾 Project: https://sharegpt4v.github.io/ ⚡️Demo: https://huggingface.co/spaces/Lin-Chen/ShareGPT4V-7B 📚Paper: https://arxiv.org/pdf/2311.12793.pdf 🔗Dataset: https://huggingface.co/datasets/Lin-Chen/ShareGPT4V @Devsp — Подписаться

20 004

🎓 OS-Copilot: Towards Generalist Computer Agents with Self-Improvement Автономное взаимодействие с компьютером уже давно является проблемой с огромным потенциалом, а недавнее распространение больших языковых моделей (LLM) заметно ускорило прогресс в создании цифровых агентов. Однако большинство этих агентов предназначены для взаимодействия с узкой областью, например с конкретным программным обеспечением или веб-сайтом. OS-Copilot - это новаторская основа для создания универсальных компьютерных агентов, которая обеспечивает единый интерфейс для взаимодействия приложений в экосистеме ОС. Самосовершенствующийся помощник с искусственным интеллектом, способного решать общие компьютерные задачи. Агент может взаимодействовать со всеми элементами операционной системы (ОС), включая работу в сети, написание кода, работу с файлами и мультимедиа, работу различными сторонними приложениями. ▪️Github ▪️Project ▪️Статья @Devsp — Подписаться

20 004

Друзья! Получите одну из самых востребованных IT профессий. 1 апреля начинается курс “AI в 2024 году: создание и работа с нейронными сетями" Первые 2 потока ведет автор курса — Артур Сапрыкин www.arthursaprykin.ru Что внутри курса? - создание нейронных сетей для выполнения практических задач - решение типичных проблем при обучении сетей - продвинутые архитектуры нейронных сетей и их применение в Data Science Курс будет полезен, если вы: - Аналитик данных и хотите освоить продвинутые инструменты, чтобы выйти на новый уровень - Разработчик с опытом программирования и хотите применить свои знания в новой области - Студент или Junior и хотите освоить машинное обучение для старта карьеры в ML - Руководитель IT-проектов и хотите лидировать современные бизнес-процессы Что вы получите? 🏆 Сертификат/удостоверение о повышении квалификации 🏆 Рекомендации и помощь в трудоустройстве успешным ученикам Академия Кодебай образовательный центр для IT-профессионалов @Codeby_Academy 84994441750

20 004

🖼 One-Step Image Translation with Text-to-Image Models CycleGAN-Turbo — общий метод адаптации одношаговой диффузионной модели, такой как SD-Turbo, к новым задачам и областям посредством состязательного обучения. Это позволяет нам использовать внутренние знания предварительно обученных моделей диффузии, одновременно достигая эффективного вывода. ▪Paper: https://arxiv.org/abs/2403.12036 ▪Code: https://github.com/GaParmar/img2img-turbo ▪Demo: http://huggingface.co/spaces/gparmar/img2img-turbo-sketch @Devsp — Подписаться

20 004

⁉️ Как повысить производительность Spark? С помощью оптимизатора запросов Catalyst! О том, как работать с Catalyst, – мы поговорим на открытом вебинаре «Раскрытие мощности Apache Spark: Погружение в оптимизатор запросов Catalyst». Урок проведёт Андрей Чучалов, опытный специалист по технологиям на базе JVM и большим данным. 💻 Вы узнаете: — Каким образом Catalyst повышает производительность Spark — Из чего состоит архитектура Catalyst — Каким образом Catalyst обеспечивает расширяемость и настройку — Какие препятствия и ограничения возникают при работе с Catalyst После вебинара можно записаться на курс «Spark Developer». Курс доступен для приобретения в рассрочку. 🔛 Начало: 28 марта, 20:00 МСК 🟣 Записаться на событие - https://otus.pw/QIc9/ Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

20 004

🧬 Evolving New Foundation Models: Unleashing the Power of Automating Model Development Мы представляем новое применение эволюционных алгоритмов для автоматизации создания мощных базовых моделей. Хотя слияние моделей стало многообещающим подходом для развития LLM из-за его экономической эффективности, в настоящее время оно опирается на человеческую интуицию и знание предметной области, что ограничивает его потенциал. Авторы используют эволюционные алгоритмы для поиска лучших способов объединения моделей с открытым исходным кодом для автоматического создания новых мощных моделей с заданными пользователем возможностями! ▪Blog: https://sakana.ai/evolutionary-model-merge/ ▪Paper: https://arxiv.org/abs/2403.13187 @Devsp — Подписаться

20 004

😁Когда тебя завлекают на роботу программистом) @Devsp — Подписаться

20 004

🎧Video2Music: Suitable Music Generation from Videos using an Affective Multimodal Transformer model Эта платформа уникальным образом использует функции видео в качестве входных данных для создания соответствующей музыки с использованием архитектуры Transformer. Используя передовые технологии, наша система призвана предоставить создателям видео простое и эффективное решение для создания индивидуальной фоновой музыки. 🖥 Github: https://github.com/amaai-lab/video2music 📕Paper: https://arxiv.org/abs/2311.00968v1 ⏩Demo: https://llmrec.github.io/ 🌐 Dataset: https://zenodo.org/records/10057093 @Devsp — Подписаться

20 004

🏆 LLaMA2-Accessory: An Open-source Toolkit for LLM Development LLaMA2-Accessory — это набор инструментов с открытым исходным кодом для предварительного обучения, точной настройки и развертывания моделей большого языка (LLM) и мультимодальных LLM. 🐱 Github: https://github.com/alpha-vllm/llama2-accessory 🚀 Demo: http://imagebind-llm.opengvlab.com/ 📕Paper: https://arxiv.org/abs/2311.07575v1 ⏩Project: llama2-accessory.readthedocs.io/ ⭐Dataset: https://paperswithcode.com/dataset/vsr @Devsp — Подписаться

20 004

🔊 Qwen-Audio: Advancing Universal Audio Understanding via Unified Large-Scale Audio-Language Models Qwen-Audio — это мультимодальная версия большой серии моделей Qwen, предложенной Alibaba Cloud. Qwen-Audio принимает разнообразный звук (человеческую речь, естественный звук, музыку и песни) и текст в качестве входных данных и выводит текст. 🐱 Github: https://github.com/qwenlm/qwen-audio 🚀 Demo: https://qwen-audio.github.io/Qwen-Audio/ 📕Paper: https://arxiv.org/abs/2311.07919v1 ⏩Dataset: https://paperswithcode.com/dataset/vocalsound @Devsp — Подписаться

20 004

🪴 SceneScript: an AI model and method to understand and describe 3D spaces SceneScript — это метод представления и определения геометрии сцены с использованием авторегрессионной структурированной языковой модели и сквозного обучения. SceneScript использует тот же метод прогнозирования следующего токена, что и модели на большом языке. Это дает моделям ИИ словарный запас, необходимый для рассуждений о физических пространствах. ▪Paper ▪Project ▪Dataset @Devsp — Подписаться

20 004

📢 𝐕𝐨𝐢𝐜𝐞𝐂𝐫𝐚𝐟𝐭: Zero-Shot Speech Editing and Text-to-Speech in the Wild🪄 VoiceCraft — это языковая модель нейронного кодека, заполняющая токены, которая обеспечивает высочайшую производительность как при редактировании речи, так и при преобразовании текста в речь (TTS) с нулевым количеством кадров для реальных данных, включая аудиокниги, интернет-видео и подкасты. Чтобы клонировать или редактировать невидимый голос, VoiceCraft требуется всего несколько секунд справки. ▪Github ▪Paper ▪Project @Devsp — Подписаться

20 004

🚀 Откройте двери в мир машинного обучения и узнайте, что нужно знать новичкам, и профессионалам! Отус приглашает 27 марта в 18:00 по мск на бесплатный вебинар «Расставим точки над ML». Вебинар является частью полноценного онлайн-курса «Специализация Machine Learning». 💪 Спикером выступит: Мария Тихонова – PhD in Computer Science, Senior Data Scientist в SberDevices и преподаватель ВШЭ. На вебинаре вы: ✅ познакомитесь с ML и узнаете, чем оно отличается от классического программирования; ✅ посмотрите, какие задачи есть в ML; ✅ решите на практике одну из задач - научите компьютер определять, что изображено на картинке. ➡ Регистрация на вебинар: https://otus.pw/QIc9/ Кому подходит этот урок: - IT-специалистам которые хотят перейти в Data Science - Начинающим дата-сайентистам и специалиста по машинному обучению, желающим углубиться в профессию - Тем кто самостоятельно изучает Data Science - Кто хочет войти в IT, но не знает что выбрать Записывайтесь сейчас, а мы потом напомним. Участие бесплатно. Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.

20 004

🖼 One-Step Image Translation with Text-to-Image Models Модели CycleGAN-Turbo и pix2pix-turbo могут выполнять различные задачи перевода изображения в изображение как для парных, так и для непарных настроек. CycleGAN-Turbo превосходит существующие методы на основе GAN и диффузии, а pix2pix-Turbo находится на одном уровне с недавними работами, такими как ControlNet для Sketch2Photo и Edge2Image, но с одношаговым выводом. ▪️Paper: https://arxiv.org/abs/2403.12036 ▪️Code: https://github.com/GaParmar/img2img-turbo ▪️Demo: http://huggingface.co/spaces/gparmar/img2img-turbo-sketch @Devsp — Подписаться

20 004

🔥 Нужны примеры кода, и настройка работы с API ChatGPT? Если вы интересуетесь актуальными техниками промпт-инжиниринга и хотите внедрять ChatGPT в бизнес-процессы – приглашаем на открытый вебинар «Промптинг языковых моделей и ChatGPT: продвинутые техники» — Узнаете какие существуют техники промптинга для языковых моделей — Поймёте, как работать с API ChatGPT — Познакомитесь с возможностями ChatGPT в реализации агентов — Увидите примеры кода для работы с агентами 📊 Урок проведёт Александр Брут-Бруляко. Занимается исследованиями с фокусом на персонализацию коммуникаций в СБЕР Neurolab. Начало: 25 марта, 20:00 МСК После вебинара можно записаться на курс «Natural Language Processing (NLP)». Курс доступен для приобретения в рассрочку. 🔴 Записаться на событие - https://otus.pw/QIc9/ Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

20 004

🪄 InternLM-XComposer MORL-Baselines — это библиотека алгоритмов многоцелевого обучения с подкреплением (MORL). Цель этого репозитория — содержать надежные реализации алгоритмов MORL в PyTorch. 🖥Code: https://github.com/lucasalegre/morl-baselines 🦾 Project: lucasalegre.github.io/morl-baselines 🖥Colab: https://colab.research.google.com/drive/1ByjuUp8-CJeh1giPOACqPGiglPxDnlSq?usp=sharing 📚Paper: https://arxiv.org/abs/2311.12495v1 🔗Dataset: https://paperswithcode.com/dataset/mo-gymnasium @Devsp — Подписаться