Data Science | Machinelearning [ru]

前往频道在 Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

显示更多

网络:Frontender's notes [ru]俄罗斯33 728 技术与应用6 722...

📈 Telegram 频道 Data Science | Machinelearning [ru] 的分析概览

频道 Data Science | Machinelearning [ru] (@devsp) 俄语语言赛道中的是活跃参与者。目前社区聚集了 20 010 名订阅者，在 技术与应用 类别中位列第 6 722，并在 俄罗斯 地区排名第 33 728 位。

📊 受众指标与增长动态

自 невідомо 创建以来，项目保持高速增长，吸引了 20 010 名订阅者。

根据 19 六月, 2026 的最新数据，频道保持稳定运转。过去 30 天订阅人数变化为 -73，过去 24 小时变化为 -9，整体触达仍然可观。

认证状态： 未认证
互动率 (ER)： 平均受众互动率为 8.09%。内容发布后 24 小时内通常能获得 3.89% 的反应，占订阅者总量。
帖子覆盖： 每篇帖子平均可获得 1 619 次浏览，首日通常累积 779 次浏览。
互动与反馈： 受众积极参与，单帖平均反应数为 8。
主题关注点： 内容集中在 llm, nvidia, контекст, openai, архитектура 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台：
“Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD”

凭借高频更新（最新数据采集于 20 六月, 2026），频道始终保持新鲜度与高覆盖。分析显示受众积极互动，使其成为 技术与应用 类别中的关键影响点。

20 010

订阅者

-924 小时

-557 天

-7330 天

1 619

帖子浏览量

~ 77924 小时

~ 94848 小时

8.09%

参与率

~ 1

每日帖子数

Ads index

beta

帖子存档

20 010

👾Применение нейронных сетей для анализа графов со свойствами гомофилии и гетерофилии В этой статье мы рассмотрим новый метод для улучшения производительности GNN в графах с гетерофилией, который может привести к созданию более точных и адаптивных моделей для сложных графовых структур. Читать...

20 010

Появляется новый тип баз данных — делаем обзор! Дата-инженер из финтех-компании Точка Николай Мозганов расскажет, как пользоваться векторными базами данных для ML-задач. Если коротко: теперь в вектор можно превратить слова, предложения и даже звуки. Читайте статью и задавайте вопросы в комментариях!

20 010

🥸OpenVid-1M: крупномасштабный высококачественный набор данных для преобразования текста в видео Генерация текста в видео (T2V) недавно привлекла значительное внимание благодаря большой мультимодальности модели Sora. Однако генерация T2V по-прежнему сталкивается с важными проблемами. Этот набор данных открытого сценария содержит более 1 миллиона пар текст-видео, что облегчает исследования по генерации T2V. Обширные эксперименты и исследования абляции подтверждают превосходство OpenVid-1M над предыдущими наборами данных и эффективность нашего MVDiT. 🤗 Hugging Face 💾 Arxiv 📂 PDF @Devsp — Подписаться

20 010

🔈AST: Audio Spectrogram Transformer Audio Spectrogram Transformer применяет Vision Transformer к аудио, превращая аудио в изображение (спектрограмму). Модель получает самые современные результаты для классификации аудио. 🤗 Hugging Face 🖥 GitHub 🟡 Архив @Devsp — Подписаться

20 010

🤖Создаем чат-бота техподдержки на русском языке с RAG из документации компании в OpenWebUI В этой статье мы рассмотрим опыт создания чат-бота технической поддержки, который призван помогать отделу фронтлайна отвечать на вопросы пользователей. Читать...

20 010

🧐 Aim: Простой и удобный open-source трекер для отслеживания ML-экспериментов Aim - это инструмент, поддерживающий отображение большого количества тренировочных прогонов (до 10.000 training runs). Он предоставляет возможность аналитики и сравнения выполненных запусков тренировок моделей, а его SDK позволяет программно получать доступ к отслеживаемым метаданным для последующей автоматизации в Jupyter Notebook. 🟡Demos: Machine translation experiments | Lightweight-GAN experiments | FastSpeech 2 experiments | Simple MNIST 🖥GitHub 🟡Документация @Devsp — Подписаться

20 010

⚡️DG-Mesh: Построение высококачественных полигональных сеток из монокулярного видео DG-Mesh реконструирует высококачественную динамическую 3D-сетку с согласованными вершинами из монокулярного видео. В пайплайне используются 3D-гауссовы всплески для представления динамических сцен и дифференцируемые алгоритмы для построения полигонов. DG-Mesh позволяет отслеживать движение вершин, упрощая текстурирование динамических объектов. Метод эффективно использует память и полностью дифференцируем, что позволяет выполнять оптимизацию 3D-сетки целевого объекта напрямую. 🟡Страница проекта 🖥GitHub 🟡Arxiv @Devsp — Подписаться

20 010

🗣Искусство общения с LLM: Гайд по техникам Prompt Engineering В этом гайде мы поговорим о подготовке к prompt-engineering, о базовых принципах написания промпта, про его структуру и про типы решаемых задач. Читать...

20 010

🌟 Vico — реализация методики, которая позволяет добиться большей точности в генерации композиционных видео Vico — это не требующий обучения фреймворк, который анализирует, как отдельные лексемы из входных токенов промпта влияют на генерируемое видео, и корректирует модель для предотвращения доминирования, учитывая все слова из промпта в равной степени. Для этого Vico строит пространственно-временной граф внимания, при помощи которого оценивает и регулирует представление всех входных концепций в видео. Vico может быть применен к множеству моделей для обогащения композиционной насыщенности и точности видео. 🖥GitHub 🟡Страница проекта 🟡Arxiv @Devsp — Подписаться

20 010

📱 MobileLLM: оптимизированные субмиллиардные LLM для мобильных устройств MobileLLM демонстрирует значительное улучшение производительности по сравнению с предыдущими моделями аналогичного размера. Например, версии на 125M и 350M параметров показывают на 2.7% и 4.3% соответственно лучшую точность. Архитектура разработана с учетом ограничений мобильных устройств по памяти и вычислительной мощности. Применяются методы функции активации (SwinGLU), embedding sharing и группировки внимания. Методика, представленная в MobileLLM, может быть применен к моделям различных размеров, от 125M до 1.5B параметров. MobileLLM показывает хорошие результаты в задачах чата и вызова API, приближаясь к производительности гораздо более крупных моделей в некоторых сценариях. 🖥Github 🟡Arxiv @Devsp — Подписаться

20 010

🌟 Semantic-SAM — универсальная модель сегментации и распознавания сложных объектов с высокой степенью детализации Semantic-SAM — экспериментальный метод сегментации изображений, опирающийся на на Mask DINO, OpenSeeD, SEEM и VLPart, выполняющий интерактивную сегментацию с возможностью управления уровнем детализации и семантической осведомленностью. 🟡Arxiv 🖥Github 🟡Модели 🤗 Попробовать интерактивную демонстрация многоуровневой детализации 🤗 Попробовать авто-генерацию с контролируемой детализацией @Devsp — Подписаться

20 010

🖥 Самые интересные публикации за последние дни: • GeoWizard — новая модель для оценки 3D-параметров изображений • Уже пора программировать с помощью LLM или пока рановато? • Обновление nanoLLaVA-1.5 1B

20 010

⚡️ Test-Time Training RNN (ТТТ) - принципиально новый метод машинного обучения TTT - это метод, который позволяет моделям искусственного интеллекта адаптироваться и учиться непосредственно во время использования, а не только во время предварительного обучения. Основное преимущество TTT заключается в том, что он может эффективно обрабатывать длинные контексты (большие объемы входных данных) без значительного увеличения вычислительных затрат. Исследователи провели эксперименты на различных наборах данных, включая книги, и обнаружили, что TTT часто превосходит традиционные методы. 🟡Arxiv 🖥GitHub for Pytorch 🖥GitHub for Jax @Devsp — Подписаться

20 010

🌍 Новая реальность: посетить концерт, не выходя из дома, увидеть друзей, находясь за тысячи километров, получить высшее образование по Data Science удалённо. Когда виртуальные границы стираются, самое время применить технологии с пользой. Онлайн-бакалавриат Нетологии и ТюмГУ «Аналитика и Data Science» — способ получить диплом о высшем образовании из любой точки мира. За 4 года вы освоите навыки работы с данными и станете бакалавром в области математики, который умеет работать с Big Data, компьютерным зрением и искусственным интеллектом. Будете закреплять знания на практике, создадите портфолио и сможете строить карьеру аналитика данных или Data Scientist. Во время учёбы у вас будут все студенческие льготы и скидки, а в конце вы получите диплом очного бакалавриата ― такой же, как у студентов офлайн-обучения. Узнать подробности о программе 👉https://netolo.gy/dgU6 Реклама ООО “Нетология” 2VSb5wW9y2Q

20 010

🌟 GeoWizard — новая модель для оценки 3D-параметров изображений GeoWizard — генеративная модель, использующая алгоритмы построения гарт глубины и нормалей одновременно. Во время логического вывода GeoWizard совместно генерирует высококачественные изображения глубины и нормальности, учитывая композицию изображения. Модель использует алгоритм BiNI для восстановления 3D-сетки на основе предполагаемой карты нормалей, что значительно облегчит применение модели на методах 3D-реконструкции. 🟡Страничка GeoWizard 🖥GitHub [ Stars: 573 | Issues: 1 |Forks: 23 ] 🟡Hugging Face 🟡Arxiv @Devsp — Подписаться

20 010

👩‍💻Уже пора программировать с помощью LLM или пока рановато? В этой статье я буду делать с помощью LLM рефакторинг двух образцов грязного кода и анализ результатов. Читать...

20 010

Конференция по машинному обучению Собрали 30+ спикеров из Т-Банка, Яндекса, VK, MTS AI и AIRI. Будет: — 4 параллельных потока: NLP & MLOps/LLMops, Research & RnD, CV & Speech, RecSys & TS; — доклады и обсуждения реальных бизнес-задач; — афтепати с барбекю и диджеем. Turbo ML Conf пройдет 20 июля в Москве. Обязательно зарегистрируйтесь, пока за вас это не сделал бот. erid:2VtzqvQdzeU Реклама. АО "Тинькофф Банк", ИНН 7710140679, лицензия ЦБ РФ № 2673

20 010

⚡️Обновление nanoLLaVA-1.5 1B На днях обновилась Vision-Language модель nanoLLaVA-1.5 1B для работы на edge девайсах. nanoLLaVA-1.5 — это «маленькая, но мощная» модель языка видения 1B, разработанная для эффективной работы на периферийных устройствах. Значительно улучшилась производительность по сравнению с v1.0, при этом размер остался таким же небольшим, что очень удобно для многих применений 🤗 Hugging Face 🖥Github @Devsp — Подписаться

20 010

🖥 Самые интересные публикации за последние дни: • Как справиться с нехваткой открытых данных для обучения и тестирования ML-моделей • ML-алгоритмы против хакеров: как поведенческая аналитика меняет правила игры в кибербезопасности • Как быстро растут нейросети: прогресс Stable Diffusion за все время • Lazy Diffusion — трансформер для редактирования изображений практически в реалтайме

20 010

🌟Arcee Agent 7B — свежая модель на базе Qwen2-7B Arcee Agent — это передовая модель языка параметров 7B, специально разработанная для вызова функций и использования инструментов. Инициализированная с Qwen2-7B, она конкурирует по производительности с гораздо более крупными моделями, сохраняя при этом эффективность и скорость. Эта модель особенно подходит для разработчиков, исследователей и предприятий, стремящихся реализовать сложные решения на основе ИИ без вычислительных издержек более крупных языковых моделей. 🤗 Hugging Face @Devsp — Подписаться