fa
Feedback
Data Science | Machinelearning [ru]

Data Science | Machinelearning [ru]

رفتن به کانال در Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

نمایش بیشتر

📈 تحلیل کانال تلگرام Data Science | Machinelearning [ru]

کانال Data Science | Machinelearning [ru] (@devsp) در بخش زبانی روسی بازیگری فعال است. در حال حاضر جامعه شامل 20 010 مشترک است و جایگاه 6 722 را در دسته فناوری و برنامه‌ها و رتبه 33 728 را در منطقه روسيا دارد.

📊 شاخص‌های مخاطب و پویایی

از زمان ایجاد در невідомо، پروژه رشد سریعی داشته و 20 010 مشترک جذب کرده است.

بر اساس آخرین داده‌ها در تاریخ 19 ژوئن, 2026، کانال فعالیت پایداری دارد. در ۳۰ روز گذشته تغییر اعضا برابر -73 و در ۲۴ ساعت گذشته برابر -9 بوده و همچنان دسترسی گسترده‌ای حفظ شده است.

  • وضعیت تأیید: تأیید نشده
  • نرخ تعامل (ER): میانگین تعامل مخاطب 8.09% است و در ۲۴ ساعت نخست پس از انتشار، محتوا معمولاً 3.89% واکنش نسبت به کل مشترکان کسب می‌کند.
  • دسترسی پست‌ها: هر پست به طور میانگین 1 619 بازدید دریافت می‌کند. در اولین روز معمولاً 779 بازدید جمع‌آوری می‌شود.
  • واکنش‌ها و تعامل: مخاطبان به‌طور فعال حمایت می‌کنند؛ میانگین واکنش به هر پست 8 است.
  • علایق موضوعی: محتوا بر موضوعات کلیدی مانند llm, nvidia, контекст, openai, архитектура تمرکز دارد.

📝 توضیح و سیاست محتوایی

نویسنده این فضا را محل بیان دیدگاه‌های شخصی توصیف می‌کند:
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

به لطف به‌روزرسانی‌های پرتکرار (آخرین داده در تاریخ 20 ژوئن, 2026)، کانال همواره به‌روز و دارای دسترسی بالاست. تحلیل‌ها نشان می‌دهد مخاطبان به‌طور فعال با محتوا تعامل دارند و آن را به نقطه اثرگذاری مهم در دسته فناوری و برنامه‌ها تبدیل کرده‌اند.

20 010
مشترکین
-924 ساعت
-557 روز
-7330 روز
آرشیو پست ها
​​👾Применение нейронных сетей для анализа графов со свойствами гомофилии и гетерофилии В этой статье мы рассмотрим новый метод для улучшения производительности GNN в графах с гетерофилией, который может привести к созданию более точных и адаптивных моделей для сложных графовых структур. Читать...

Появляется новый тип баз данных — делаем обзор! Дата-инженер из финтех-компании Точка Николай Мозганов расскажет, как пользоваться векторными базами данных для ML-задач. Если коротко: теперь в вектор можно превратить слова, предложения и даже звуки. Читайте статью и задавайте вопросы в комментариях!

​​🥸OpenVid-1M: крупномасштабный высококачественный набор данных для преобразования текста в видео Генерация текста в видео (T2V) недавно привлекла значительное внимание благодаря большой мультимодальности модели Sora. Однако генерация T2V по-прежнему сталкивается с важными проблемами. Этот набор данных открытого сценария содержит более 1 миллиона пар текст-видео, что облегчает исследования по генерации T2V. Обширные эксперименты и исследования абляции подтверждают превосходство OpenVid-1M над предыдущими наборами данных и эффективность нашего MVDiT. 🤗 Hugging Face 💾 Arxiv 📂 PDF @DevspПодписаться

​​🔈AST: Audio Spectrogram Transformer Audio Spectrogram Transformer применяет Vision Transformer к аудио, превращая аудио в изображение (спектрограмму). Модель получает самые современные результаты для классификации аудио. 🤗 Hugging Face 🖥 GitHub 🟡 Архив @DevspПодписаться

​​🤖Создаем чат-бота техподдержки на русском языке с RAG из документации компании в OpenWebUI В этой статье мы рассмотрим опыт создания чат-бота технической поддержки, который призван помогать отделу фронтлайна отвечать на вопросы пользователей. Читать...

​​🧐 Aim: Простой и удобный open-source трекер для отслеживания ML-экспериментов Aim - это инструмент, поддерживающий отображение большого количества тренировочных прогонов (до 10.000 training runs). Он предоставляет возможность аналитики и сравнения выполненных запусков тренировок моделей, а его SDK позволяет программно получать доступ к отслеживаемым метаданным для последующей автоматизации в Jupyter Notebook. 🟡Demos: Machine translation experiments | Lightweight-GAN experiments | FastSpeech 2 experiments | Simple MNIST 🖥GitHub 🟡Документация @DevspПодписаться

​​⚡️DG-Mesh: Построение высококачественных полигональных сеток из монокулярного видео DG-Mesh реконструирует высококачественную динамическую 3D-сетку с согласованными вершинами из монокулярного видео. В пайплайне используются 3D-гауссовы всплески для представления динамических сцен и дифференцируемые алгоритмы для построения полигонов. DG-Mesh позволяет отслеживать движение вершин, упрощая текстурирование динамических объектов. Метод эффективно использует память и полностью дифференцируем, что позволяет выполнять оптимизацию 3D-сетки целевого объекта напрямую. 🟡Страница проекта 🖥GitHub 🟡Arxiv @DevspПодписаться

​​🗣Искусство общения с LLM: Гайд по техникам Prompt Engineering В этом гайде мы поговорим о подготовке к prompt-engineering, о базовых принципах написания промпта, про его структуру и про типы решаемых задач. Читать...

​​🌟 Vico — реализация методики, которая позволяет добиться большей точности в генерации композиционных видео Vico — это не требующий обучения фреймворк, который анализирует, как отдельные лексемы из входных токенов промпта влияют на генерируемое видео, и корректирует модель для предотвращения доминирования, учитывая все слова из промпта в равной степени. Для этого Vico строит пространственно-временной граф внимания, при помощи которого оценивает и регулирует представление всех входных концепций в видео. Vico может быть применен к множеству моделей для обогащения композиционной насыщенности и точности видео. 🖥GitHub 🟡Страница проекта 🟡Arxiv @DevspПодписаться

​​📱 MobileLLM: оптимизированные субмиллиардные LLM для мобильных устройств MobileLLM демонстрирует значительное улучшение производительности по сравнению с предыдущими моделями аналогичного размера. Например, версии на 125M и 350M параметров показывают на 2.7% и 4.3% соответственно лучшую точность. Архитектура разработана с учетом ограничений мобильных устройств по памяти и вычислительной мощности. Применяются методы функции активации (SwinGLU), embedding sharing и группировки внимания. Методика, представленная в MobileLLM, может быть применен к моделям различных размеров, от 125M до 1.5B параметров. MobileLLM показывает хорошие результаты в задачах чата и вызова API, приближаясь к производительности гораздо более крупных моделей в некоторых сценариях. 🖥Github 🟡Arxiv @DevspПодписаться

​​🌟 Semantic-SAM — универсальная модель сегментации и распознавания сложных объектов с высокой степенью детализации Semantic-SAM — экспериментальный метод сегментации изображений, опирающийся на на Mask DINO, OpenSeeD, SEEM и VLPart, выполняющий интерактивную сегментацию с возможностью управления уровнем детализации и семантической осведомленностью. 🟡Arxiv 🖥Github 🟡Модели 🤗 Попробовать интерактивную демонстрация многоуровневой детализации 🤗 Попробовать авто-генерацию с контролируемой детализацией @DevspПодписаться

​​⚡️ Test-Time Training RNN (ТТТ) - принципиально новый метод машинного обучения TTT - это метод, который позволяет моделям искусственного интеллекта адаптироваться и учиться непосредственно во время использования, а не только во время предварительного обучения. Основное преимущество TTT заключается в том, что он может эффективно обрабатывать длинные контексты (большие объемы входных данных) без значительного увеличения вычислительных затрат. Исследователи провели эксперименты на различных наборах данных, включая книги, и обнаружили, что TTT часто превосходит традиционные методы. 🟡Arxiv 🖥GitHub for Pytorch 🖥GitHub for Jax @DevspПодписаться

🌍 Новая реальность: посетить концерт, не выходя из дома, увидеть друзей, находясь за тысячи километров, получить высшее образование по Data Science удалённо. Когда виртуальные границы стираются, самое время применить технологии с пользой. Онлайн-бакалавриат Нетологии и ТюмГУ «Аналитика и Data Science» — способ получить диплом о высшем образовании из любой точки мира. За 4 года вы освоите навыки работы с данными и станете бакалавром в области математики, который умеет работать с Big Data, компьютерным зрением и искусственным интеллектом. Будете закреплять знания на практике, создадите портфолио и сможете строить карьеру аналитика данных или Data Scientist. Во время учёбы у вас будут все студенческие льготы и скидки, а в конце вы получите диплом очного бакалавриата ― такой же, как у студентов офлайн-обучения. Узнать подробности о программе 👉https://netolo.gy/dgU6 Реклама ООО “Нетология” 2VSb5wW9y2Q

​​🌟 GeoWizard — новая модель для оценки 3D-параметров изображений GeoWizard — генеративная модель, использующая алгоритмы построения гарт глубины и нормалей одновременно. Во время логического вывода GeoWizard совместно генерирует высококачественные изображения глубины и нормальности, учитывая композицию изображения. Модель использует алгоритм BiNI для восстановления 3D-сетки на основе предполагаемой карты нормалей, что значительно облегчит применение модели на методах 3D-реконструкции. 🟡Страничка GeoWizard 🖥GitHub [ Stars: 573 | Issues: 1 |Forks: 23 ] 🟡Hugging Face 🟡Arxiv @DevspПодписаться

​​👩‍💻Уже пора программировать с помощью LLM или пока рановато? В этой статье я буду делать с помощью LLM рефакторинг двух образцов грязного кода и анализ результатов. Читать...

Конференция по машинному обучению Собрали 30+ спикеров из Т-Банка, Яндекса, VK, MTS AI и AIRI. Будет: — 4 параллельных потока: NLP & MLOps/LLMops, Research & RnD, CV & Speech, RecSys & TS; — доклады и обсуждения реальных бизнес-задач; — афтепати с барбекю и диджеем. Turbo ML Conf пройдет 20 июля в Москве. Обязательно зарегистрируйтесь, пока за вас это не сделал бот. erid:2VtzqvQdzeU Реклама. АО "Тинькофф Банк", ИНН 7710140679, лицензия ЦБ РФ № 2673

​​⚡️Обновление nanoLLaVA-1.5 1B На днях обновилась Vision-Language модель nanoLLaVA-1.5 1B для работы на edge девайсах. nanoLLaVA-1.5 — это «маленькая, но мощная» модель языка видения 1B, разработанная для эффективной работы на периферийных устройствах. Значительно улучшилась производительность по сравнению с v1.0, при этом размер остался таким же небольшим, что очень удобно для многих применений 🤗 Hugging Face 🖥Github @DevspПодписаться

​​🌟Arcee Agent 7B — свежая модель на базе Qwen2-7B Arcee Agent — это передовая модель языка параметров 7B, специально разработанная для вызова функций и использования инструментов. Инициализированная с Qwen2-7B, она конкурирует по производительности с гораздо более крупными моделями, сохраняя при этом эффективность и скорость. Эта модель особенно подходит для разработчиков, исследователей и предприятий, стремящихся реализовать сложные решения на основе ИИ без вычислительных издержек более крупных языковых моделей. 🤗 Hugging Face @DevspПодписаться