ch
Feedback
Data Science | Machinelearning [ru]

Data Science | Machinelearning [ru]

前往频道在 Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

显示更多

📈 Telegram 频道 Data Science | Machinelearning [ru] 的分析概览

频道 Data Science | Machinelearning [ru] (@devsp) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 20 010 名订阅者,在 技术与应用 类别中位列第 6 722,并在 俄罗斯 地区排名第 33 728

📊 受众指标与增长动态

невідомо 创建以来,项目保持高速增长,吸引了 20 010 名订阅者。

根据 19 六月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 -73,过去 24 小时变化为 -9,整体触达仍然可观。

  • 认证状态: 未认证
  • 互动率 (ER): 平均受众互动率为 8.09%。内容发布后 24 小时内通常能获得 3.89% 的反应,占订阅者总量。
  • 帖子覆盖: 每篇帖子平均可获得 1 619 次浏览,首日通常累积 779 次浏览。
  • 互动与反馈: 受众积极参与,单帖平均反应数为 8
  • 主题关注点: 内容集中在 llm, nvidia, контекст, openai, архитектура 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台:
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

凭借高频更新(最新数据采集于 20 六月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。

20 010
订阅者
-924 小时
-557
-7330
帖子存档
​​👾Применение нейронных сетей для анализа графов со свойствами гомофилии и гетерофилии В этой статье мы рассмотрим новый метод для улучшения производительности GNN в графах с гетерофилией, который может привести к созданию более точных и адаптивных моделей для сложных графовых структур. Читать...

Появляется новый тип баз данных — делаем обзор! Дата-инженер из финтех-компании Точка Николай Мозганов расскажет, как пользоваться векторными базами данных для ML-задач. Если коротко: теперь в вектор можно превратить слова, предложения и даже звуки. Читайте статью и задавайте вопросы в комментариях!

​​🥸OpenVid-1M: крупномасштабный высококачественный набор данных для преобразования текста в видео Генерация текста в видео (T2V) недавно привлекла значительное внимание благодаря большой мультимодальности модели Sora. Однако генерация T2V по-прежнему сталкивается с важными проблемами. Этот набор данных открытого сценария содержит более 1 миллиона пар текст-видео, что облегчает исследования по генерации T2V. Обширные эксперименты и исследования абляции подтверждают превосходство OpenVid-1M над предыдущими наборами данных и эффективность нашего MVDiT. 🤗 Hugging Face 💾 Arxiv 📂 PDF @DevspПодписаться

​​🔈AST: Audio Spectrogram Transformer Audio Spectrogram Transformer применяет Vision Transformer к аудио, превращая аудио в изображение (спектрограмму). Модель получает самые современные результаты для классификации аудио. 🤗 Hugging Face 🖥 GitHub 🟡 Архив @DevspПодписаться

​​🤖Создаем чат-бота техподдержки на русском языке с RAG из документации компании в OpenWebUI В этой статье мы рассмотрим опыт создания чат-бота технической поддержки, который призван помогать отделу фронтлайна отвечать на вопросы пользователей. Читать...

​​🧐 Aim: Простой и удобный open-source трекер для отслеживания ML-экспериментов Aim - это инструмент, поддерживающий отображение большого количества тренировочных прогонов (до 10.000 training runs). Он предоставляет возможность аналитики и сравнения выполненных запусков тренировок моделей, а его SDK позволяет программно получать доступ к отслеживаемым метаданным для последующей автоматизации в Jupyter Notebook. 🟡Demos: Machine translation experiments | Lightweight-GAN experiments | FastSpeech 2 experiments | Simple MNIST 🖥GitHub 🟡Документация @DevspПодписаться

​​⚡️DG-Mesh: Построение высококачественных полигональных сеток из монокулярного видео DG-Mesh реконструирует высококачественную динамическую 3D-сетку с согласованными вершинами из монокулярного видео. В пайплайне используются 3D-гауссовы всплески для представления динамических сцен и дифференцируемые алгоритмы для построения полигонов. DG-Mesh позволяет отслеживать движение вершин, упрощая текстурирование динамических объектов. Метод эффективно использует память и полностью дифференцируем, что позволяет выполнять оптимизацию 3D-сетки целевого объекта напрямую. 🟡Страница проекта 🖥GitHub 🟡Arxiv @DevspПодписаться

​​🗣Искусство общения с LLM: Гайд по техникам Prompt Engineering В этом гайде мы поговорим о подготовке к prompt-engineering, о базовых принципах написания промпта, про его структуру и про типы решаемых задач. Читать...

​​🌟 Vico — реализация методики, которая позволяет добиться большей точности в генерации композиционных видео Vico — это не требующий обучения фреймворк, который анализирует, как отдельные лексемы из входных токенов промпта влияют на генерируемое видео, и корректирует модель для предотвращения доминирования, учитывая все слова из промпта в равной степени. Для этого Vico строит пространственно-временной граф внимания, при помощи которого оценивает и регулирует представление всех входных концепций в видео. Vico может быть применен к множеству моделей для обогащения композиционной насыщенности и точности видео. 🖥GitHub 🟡Страница проекта 🟡Arxiv @DevspПодписаться

​​📱 MobileLLM: оптимизированные субмиллиардные LLM для мобильных устройств MobileLLM демонстрирует значительное улучшение производительности по сравнению с предыдущими моделями аналогичного размера. Например, версии на 125M и 350M параметров показывают на 2.7% и 4.3% соответственно лучшую точность. Архитектура разработана с учетом ограничений мобильных устройств по памяти и вычислительной мощности. Применяются методы функции активации (SwinGLU), embedding sharing и группировки внимания. Методика, представленная в MobileLLM, может быть применен к моделям различных размеров, от 125M до 1.5B параметров. MobileLLM показывает хорошие результаты в задачах чата и вызова API, приближаясь к производительности гораздо более крупных моделей в некоторых сценариях. 🖥Github 🟡Arxiv @DevspПодписаться

​​🌟 Semantic-SAM — универсальная модель сегментации и распознавания сложных объектов с высокой степенью детализации Semantic-SAM — экспериментальный метод сегментации изображений, опирающийся на на Mask DINO, OpenSeeD, SEEM и VLPart, выполняющий интерактивную сегментацию с возможностью управления уровнем детализации и семантической осведомленностью. 🟡Arxiv 🖥Github 🟡Модели 🤗 Попробовать интерактивную демонстрация многоуровневой детализации 🤗 Попробовать авто-генерацию с контролируемой детализацией @DevspПодписаться

​​⚡️ Test-Time Training RNN (ТТТ) - принципиально новый метод машинного обучения TTT - это метод, который позволяет моделям искусственного интеллекта адаптироваться и учиться непосредственно во время использования, а не только во время предварительного обучения. Основное преимущество TTT заключается в том, что он может эффективно обрабатывать длинные контексты (большие объемы входных данных) без значительного увеличения вычислительных затрат. Исследователи провели эксперименты на различных наборах данных, включая книги, и обнаружили, что TTT часто превосходит традиционные методы. 🟡Arxiv 🖥GitHub for Pytorch 🖥GitHub for Jax @DevspПодписаться

🌍 Новая реальность: посетить концерт, не выходя из дома, увидеть друзей, находясь за тысячи километров, получить высшее образование по Data Science удалённо. Когда виртуальные границы стираются, самое время применить технологии с пользой. Онлайн-бакалавриат Нетологии и ТюмГУ «Аналитика и Data Science» — способ получить диплом о высшем образовании из любой точки мира. За 4 года вы освоите навыки работы с данными и станете бакалавром в области математики, который умеет работать с Big Data, компьютерным зрением и искусственным интеллектом. Будете закреплять знания на практике, создадите портфолио и сможете строить карьеру аналитика данных или Data Scientist. Во время учёбы у вас будут все студенческие льготы и скидки, а в конце вы получите диплом очного бакалавриата ― такой же, как у студентов офлайн-обучения. Узнать подробности о программе 👉https://netolo.gy/dgU6 Реклама ООО “Нетология” 2VSb5wW9y2Q

​​🌟 GeoWizard — новая модель для оценки 3D-параметров изображений GeoWizard — генеративная модель, использующая алгоритмы построения гарт глубины и нормалей одновременно. Во время логического вывода GeoWizard совместно генерирует высококачественные изображения глубины и нормальности, учитывая композицию изображения. Модель использует алгоритм BiNI для восстановления 3D-сетки на основе предполагаемой карты нормалей, что значительно облегчит применение модели на методах 3D-реконструкции. 🟡Страничка GeoWizard 🖥GitHub [ Stars: 573 | Issues: 1 |Forks: 23 ] 🟡Hugging Face 🟡Arxiv @DevspПодписаться

​​👩‍💻Уже пора программировать с помощью LLM или пока рановато? В этой статье я буду делать с помощью LLM рефакторинг двух образцов грязного кода и анализ результатов. Читать...

Конференция по машинному обучению Собрали 30+ спикеров из Т-Банка, Яндекса, VK, MTS AI и AIRI. Будет: — 4 параллельных потока: NLP & MLOps/LLMops, Research & RnD, CV & Speech, RecSys & TS; — доклады и обсуждения реальных бизнес-задач; — афтепати с барбекю и диджеем. Turbo ML Conf пройдет 20 июля в Москве. Обязательно зарегистрируйтесь, пока за вас это не сделал бот. erid:2VtzqvQdzeU Реклама. АО "Тинькофф Банк", ИНН 7710140679, лицензия ЦБ РФ № 2673

​​⚡️Обновление nanoLLaVA-1.5 1B На днях обновилась Vision-Language модель nanoLLaVA-1.5 1B для работы на edge девайсах. nanoLLaVA-1.5 — это «маленькая, но мощная» модель языка видения 1B, разработанная для эффективной работы на периферийных устройствах. Значительно улучшилась производительность по сравнению с v1.0, при этом размер остался таким же небольшим, что очень удобно для многих применений 🤗 Hugging Face 🖥Github @DevspПодписаться

​​🌟Arcee Agent 7B — свежая модель на базе Qwen2-7B Arcee Agent — это передовая модель языка параметров 7B, специально разработанная для вызова функций и использования инструментов. Инициализированная с Qwen2-7B, она конкурирует по производительности с гораздо более крупными моделями, сохраняя при этом эффективность и скорость. Эта модель особенно подходит для разработчиков, исследователей и предприятий, стремящихся реализовать сложные решения на основе ИИ без вычислительных издержек более крупных языковых моделей. 🤗 Hugging Face @DevspПодписаться