ar
Feedback
Data Science | Machinelearning [ru]

Data Science | Machinelearning [ru]

الذهاب إلى القناة على Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

إظهار المزيد

📈 نظرة تحليلية على قناة تيليجرام Data Science | Machinelearning [ru]

تُعد قناة Data Science | Machinelearning [ru] (@devsp) في القطاع اللغوي الروسية لاعباً نشطاً. يضم المجتمع حالياً 20 010 مشتركاً، محتلاً المرتبة 6 722 في فئة التكنولوجيات والتطبيقات والمرتبة 33 728 في منطقة روسيا.

📊 مؤشرات الجمهور والحراك

منذ تأسيسه في невідомо، حقق المشروع نمواً سريعاً وجمع 20 010 مشتركاً.

بحسب آخر البيانات بتاريخ 19 يونيو, 2026، تحافظ القناة على نشاط مستقر. خلال آخر 30 يوماً تغيّر عدد الأعضاء بمقدار -73، وفي آخر 24 ساعة بمقدار -9، مع بقاء الوصول العام مرتفعاً.

  • حالة التحقق: غير موثّقة
  • معدل التفاعل (ER): يبلغ متوسط تفاعل الجمهور 8.09‎%. وخلال أول 24 ساعة من النشر يحصد المحتوى عادةً 3.89‎% من ردود الفعل نسبةً إلى إجمالي المشتركين.
  • وصول المنشورات: يحصل كل منشور على متوسط 1 619 مشاهدة. وخلال اليوم الأول يجمع عادةً 779 مشاهدة.
  • التفاعلات والاستجابة: يتفاعل الجمهور بانتظام؛ متوسط التفاعلات لكل منشور يبلغ 8.
  • الاهتمامات الموضوعية: يركز المحتوى على مواضيع رئيسية مثل llm, nvidia, контекст, openai, архитектура.

📝 الوصف وسياسة المحتوى

يصف المؤلف القناة بأنها مساحة للتعبير عن الآراء الذاتية:
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

بفضل وتيرة التحديث المرتفعة (أحدث البيانات بتاريخ 20 يونيو, 2026) تحافظ القناة على حداثتها ومستوى وصول مرتفع. وتُظهر التحليلات تفاعلاً نشطاً من الجمهور، ما يجعلها نقطة تأثير مهمة ضمن فئة التكنولوجيات والتطبيقات.

20 010
المشتركون
-924 ساعات
-557 أيام
-7330 أيام
أرشيف المشاركات
​​👾Применение нейронных сетей для анализа графов со свойствами гомофилии и гетерофилии В этой статье мы рассмотрим новый метод для улучшения производительности GNN в графах с гетерофилией, который может привести к созданию более точных и адаптивных моделей для сложных графовых структур. Читать...

Появляется новый тип баз данных — делаем обзор! Дата-инженер из финтех-компании Точка Николай Мозганов расскажет, как пользоваться векторными базами данных для ML-задач. Если коротко: теперь в вектор можно превратить слова, предложения и даже звуки. Читайте статью и задавайте вопросы в комментариях!

​​🥸OpenVid-1M: крупномасштабный высококачественный набор данных для преобразования текста в видео Генерация текста в видео (T2V) недавно привлекла значительное внимание благодаря большой мультимодальности модели Sora. Однако генерация T2V по-прежнему сталкивается с важными проблемами. Этот набор данных открытого сценария содержит более 1 миллиона пар текст-видео, что облегчает исследования по генерации T2V. Обширные эксперименты и исследования абляции подтверждают превосходство OpenVid-1M над предыдущими наборами данных и эффективность нашего MVDiT. 🤗 Hugging Face 💾 Arxiv 📂 PDF @DevspПодписаться

​​🔈AST: Audio Spectrogram Transformer Audio Spectrogram Transformer применяет Vision Transformer к аудио, превращая аудио в изображение (спектрограмму). Модель получает самые современные результаты для классификации аудио. 🤗 Hugging Face 🖥 GitHub 🟡 Архив @DevspПодписаться

​​🤖Создаем чат-бота техподдержки на русском языке с RAG из документации компании в OpenWebUI В этой статье мы рассмотрим опыт создания чат-бота технической поддержки, который призван помогать отделу фронтлайна отвечать на вопросы пользователей. Читать...

​​🧐 Aim: Простой и удобный open-source трекер для отслеживания ML-экспериментов Aim - это инструмент, поддерживающий отображение большого количества тренировочных прогонов (до 10.000 training runs). Он предоставляет возможность аналитики и сравнения выполненных запусков тренировок моделей, а его SDK позволяет программно получать доступ к отслеживаемым метаданным для последующей автоматизации в Jupyter Notebook. 🟡Demos: Machine translation experiments | Lightweight-GAN experiments | FastSpeech 2 experiments | Simple MNIST 🖥GitHub 🟡Документация @DevspПодписаться

​​⚡️DG-Mesh: Построение высококачественных полигональных сеток из монокулярного видео DG-Mesh реконструирует высококачественную динамическую 3D-сетку с согласованными вершинами из монокулярного видео. В пайплайне используются 3D-гауссовы всплески для представления динамических сцен и дифференцируемые алгоритмы для построения полигонов. DG-Mesh позволяет отслеживать движение вершин, упрощая текстурирование динамических объектов. Метод эффективно использует память и полностью дифференцируем, что позволяет выполнять оптимизацию 3D-сетки целевого объекта напрямую. 🟡Страница проекта 🖥GitHub 🟡Arxiv @DevspПодписаться

​​🗣Искусство общения с LLM: Гайд по техникам Prompt Engineering В этом гайде мы поговорим о подготовке к prompt-engineering, о базовых принципах написания промпта, про его структуру и про типы решаемых задач. Читать...

​​🌟 Vico — реализация методики, которая позволяет добиться большей точности в генерации композиционных видео Vico — это не требующий обучения фреймворк, который анализирует, как отдельные лексемы из входных токенов промпта влияют на генерируемое видео, и корректирует модель для предотвращения доминирования, учитывая все слова из промпта в равной степени. Для этого Vico строит пространственно-временной граф внимания, при помощи которого оценивает и регулирует представление всех входных концепций в видео. Vico может быть применен к множеству моделей для обогащения композиционной насыщенности и точности видео. 🖥GitHub 🟡Страница проекта 🟡Arxiv @DevspПодписаться

​​📱 MobileLLM: оптимизированные субмиллиардные LLM для мобильных устройств MobileLLM демонстрирует значительное улучшение производительности по сравнению с предыдущими моделями аналогичного размера. Например, версии на 125M и 350M параметров показывают на 2.7% и 4.3% соответственно лучшую точность. Архитектура разработана с учетом ограничений мобильных устройств по памяти и вычислительной мощности. Применяются методы функции активации (SwinGLU), embedding sharing и группировки внимания. Методика, представленная в MobileLLM, может быть применен к моделям различных размеров, от 125M до 1.5B параметров. MobileLLM показывает хорошие результаты в задачах чата и вызова API, приближаясь к производительности гораздо более крупных моделей в некоторых сценариях. 🖥Github 🟡Arxiv @DevspПодписаться

​​🌟 Semantic-SAM — универсальная модель сегментации и распознавания сложных объектов с высокой степенью детализации Semantic-SAM — экспериментальный метод сегментации изображений, опирающийся на на Mask DINO, OpenSeeD, SEEM и VLPart, выполняющий интерактивную сегментацию с возможностью управления уровнем детализации и семантической осведомленностью. 🟡Arxiv 🖥Github 🟡Модели 🤗 Попробовать интерактивную демонстрация многоуровневой детализации 🤗 Попробовать авто-генерацию с контролируемой детализацией @DevspПодписаться

​​⚡️ Test-Time Training RNN (ТТТ) - принципиально новый метод машинного обучения TTT - это метод, который позволяет моделям искусственного интеллекта адаптироваться и учиться непосредственно во время использования, а не только во время предварительного обучения. Основное преимущество TTT заключается в том, что он может эффективно обрабатывать длинные контексты (большие объемы входных данных) без значительного увеличения вычислительных затрат. Исследователи провели эксперименты на различных наборах данных, включая книги, и обнаружили, что TTT часто превосходит традиционные методы. 🟡Arxiv 🖥GitHub for Pytorch 🖥GitHub for Jax @DevspПодписаться

🌍 Новая реальность: посетить концерт, не выходя из дома, увидеть друзей, находясь за тысячи километров, получить высшее образование по Data Science удалённо. Когда виртуальные границы стираются, самое время применить технологии с пользой. Онлайн-бакалавриат Нетологии и ТюмГУ «Аналитика и Data Science» — способ получить диплом о высшем образовании из любой точки мира. За 4 года вы освоите навыки работы с данными и станете бакалавром в области математики, который умеет работать с Big Data, компьютерным зрением и искусственным интеллектом. Будете закреплять знания на практике, создадите портфолио и сможете строить карьеру аналитика данных или Data Scientist. Во время учёбы у вас будут все студенческие льготы и скидки, а в конце вы получите диплом очного бакалавриата ― такой же, как у студентов офлайн-обучения. Узнать подробности о программе 👉https://netolo.gy/dgU6 Реклама ООО “Нетология” 2VSb5wW9y2Q

​​🌟 GeoWizard — новая модель для оценки 3D-параметров изображений GeoWizard — генеративная модель, использующая алгоритмы построения гарт глубины и нормалей одновременно. Во время логического вывода GeoWizard совместно генерирует высококачественные изображения глубины и нормальности, учитывая композицию изображения. Модель использует алгоритм BiNI для восстановления 3D-сетки на основе предполагаемой карты нормалей, что значительно облегчит применение модели на методах 3D-реконструкции. 🟡Страничка GeoWizard 🖥GitHub [ Stars: 573 | Issues: 1 |Forks: 23 ] 🟡Hugging Face 🟡Arxiv @DevspПодписаться

​​👩‍💻Уже пора программировать с помощью LLM или пока рановато? В этой статье я буду делать с помощью LLM рефакторинг двух образцов грязного кода и анализ результатов. Читать...

Конференция по машинному обучению Собрали 30+ спикеров из Т-Банка, Яндекса, VK, MTS AI и AIRI. Будет: — 4 параллельных потока: NLP & MLOps/LLMops, Research & RnD, CV & Speech, RecSys & TS; — доклады и обсуждения реальных бизнес-задач; — афтепати с барбекю и диджеем. Turbo ML Conf пройдет 20 июля в Москве. Обязательно зарегистрируйтесь, пока за вас это не сделал бот. erid:2VtzqvQdzeU Реклама. АО "Тинькофф Банк", ИНН 7710140679, лицензия ЦБ РФ № 2673

​​⚡️Обновление nanoLLaVA-1.5 1B На днях обновилась Vision-Language модель nanoLLaVA-1.5 1B для работы на edge девайсах. nanoLLaVA-1.5 — это «маленькая, но мощная» модель языка видения 1B, разработанная для эффективной работы на периферийных устройствах. Значительно улучшилась производительность по сравнению с v1.0, при этом размер остался таким же небольшим, что очень удобно для многих применений 🤗 Hugging Face 🖥Github @DevspПодписаться

​​🌟Arcee Agent 7B — свежая модель на базе Qwen2-7B Arcee Agent — это передовая модель языка параметров 7B, специально разработанная для вызова функций и использования инструментов. Инициализированная с Qwen2-7B, она конкурирует по производительности с гораздо более крупными моделями, сохраняя при этом эффективность и скорость. Эта модель особенно подходит для разработчиков, исследователей и предприятий, стремящихся реализовать сложные решения на основе ИИ без вычислительных издержек более крупных языковых моделей. 🤗 Hugging Face @DevspПодписаться