ar
Feedback
Data Science | Machinelearning [ru]

Data Science | Machinelearning [ru]

الذهاب إلى القناة على Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

إظهار المزيد

📈 نظرة تحليلية على قناة تيليجرام Data Science | Machinelearning [ru]

تُعد قناة Data Science | Machinelearning [ru] (@devsp) في القطاع اللغوي الروسية لاعباً نشطاً. يضم المجتمع حالياً 20 012 مشتركاً، محتلاً المرتبة 6 722 في فئة التكنولوجيات والتطبيقات والمرتبة 33 717 في منطقة روسيا.

📊 مؤشرات الجمهور والحراك

منذ تأسيسه في невідомо، حقق المشروع نمواً سريعاً وجمع 20 012 مشتركاً.

بحسب آخر البيانات بتاريخ 20 يونيو, 2026، تحافظ القناة على نشاط مستقر. خلال آخر 30 يوماً تغيّر عدد الأعضاء بمقدار -78، وفي آخر 24 ساعة بمقدار -10، مع بقاء الوصول العام مرتفعاً.

  • حالة التحقق: غير موثّقة
  • معدل التفاعل (ER): يبلغ متوسط تفاعل الجمهور 8.57‎%. وخلال أول 24 ساعة من النشر يحصد المحتوى عادةً 3.82‎% من ردود الفعل نسبةً إلى إجمالي المشتركين.
  • وصول المنشورات: يحصل كل منشور على متوسط 1 715 مشاهدة. وخلال اليوم الأول يجمع عادةً 765 مشاهدة.
  • التفاعلات والاستجابة: يتفاعل الجمهور بانتظام؛ متوسط التفاعلات لكل منشور يبلغ 8.
  • الاهتمامات الموضوعية: يركز المحتوى على مواضيع رئيسية مثل llm, nvidia, контекст, openai, архитектура.

📝 الوصف وسياسة المحتوى

يصف المؤلف القناة بأنها مساحة للتعبير عن الآراء الذاتية:
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

بفضل وتيرة التحديث المرتفعة (أحدث البيانات بتاريخ 21 يونيو, 2026) تحافظ القناة على حداثتها ومستوى وصول مرتفع. وتُظهر التحليلات تفاعلاً نشطاً من الجمهور، ما يجعلها نقطة تأثير مهمة ضمن فئة التكنولوجيات والتطبيقات.

20 012
المشتركون
-1024 ساعات
-467 أيام
-7830 أيام
أرشيف المشاركات
​​🚀 AI2 presents WildChat: 1M ChatGPT Interaction Logs in the Wild WildChat представляет собой совокупность 1 миллиона реальных взаимодействий между пользователем и ChatGPT, характеризующихся широким спектром языков и разнообразием пользовательских подсказок. Он был создан путем предложения бесплатного доступа к ChatGPT и GPT-4 в обмен на согласованный сбор истории чата. Используя этот датасет, разработчики создали бота WildLlama-7b-user-assistant на базе Llama-2, который способен предсказывать как промптов пользователя, так и ответы, которые может выбрать Chatgpt. • proj: https://wildchat.allen.aiabs: https://arxiv.org/abs/2405.01470 @DevspПодписаться

​​⭐️StoryDiffusion: Consistent Self-Attention for Long-Range Image and Video Generation StoryDiffusion - новый инструмент, для создания, последовательных историй: изображений и видео. Модель позволяет создавать комиксы в различных стилях, с акцентом на последовательное повествование и поддержание единого стиля окружения, персонажей и их одежды. Он может описывать текстовую историю с последовательными изображениями или видео, охватывающими богатое разнообразие контента. • Github: https://github.com/HVision-NKU/StoryDiffusionPaper: https://arxiv.org/abs/2405.01434Demo: https://storydiffusion.github.io @DevspПодписаться

​​🦙AgentTuning: Enabling Generalized Agent Abilities For LLMs. AgentTuning - простой и эффективный метод расширения агентских возможностей для решения сложных задачи реального мира при сохранении всех возможностей ЛЛМ. AgentTuning содержит датасет 1866 высококачественных взаимодействий, предназначенных для улучшения работы ИИ-агентов в 6 различных реальных задачах. Результаты оценки показывают, что AgentTuning обеспечивает возможности агента LLM с надежным обобщением для невидимых задач агента, сохраняя при этом сильные общие языковые способности. 🖥Github: https://github.com/THUDM/AgentTuning 📕Paper: https://arxiv.org/abs/2310.12823 🤗 Model: https://huggingface.co/THUDM/agentlm-70b 🚀Dataset: https://huggingface.co/datasets/THUDM/AgentInstruct ⭐️Project: https://thudm.github.io/AgentTuning/ @DevspПодписаться

​​🛂 ConsistentID : Portrait Generation with Multimodal Fine-Grained Identity Preserving Consistent ID - новая модель, которая позволяет создавать различные персонализированные изображения для документов на основе текстовых промптов и исходного фото. ConsistentID включает в себя два ключевых компонента: мультимодальный генератор подсказок для лица, который объединяет черты лица, соответствующие описания лица и общий контекст лица для повышения точности деталей лица, а также сеть сохранения идентификаторов, оптимизированную с помощью стратегии локализации внимания к лицу, направленную на сохранение согласованности идентификаторов. • Github: https://github.com/JackAILab/ConsistentIDPaper: https://arxiv.org/abs/2404.16771Project: https://ssugarwh.github.io/consistentid.github.io/Demo: http://consistentid.natapp1.cc/ @DevspПодписаться

​​👨 AG3D: Learning to Generate 3D Avatars from 2D Image Collections (ICCV 2023) AG3D - Фреймворк для генерации трехмерных аватаров из двумерных изображений. Метод фиксирует форму и деформацию тела и свободной одежды, используя целостный 3D-генератор и интегрируя эффективный и гибкий модуль артикуляции. 🖥Github: https://github.com/zj-dong/AG3D 📕Paper: https://arxiv.org/abs/2305.02312 🚀Video: https://youtu.be/niP1YhJXEBE ⭐️Project: https://zj-dong.github.io/AG3D/ @DevspПодписаться

​​🛠 Improving Long Document Topic Segmentation Models With Enhanced Coherence Modeling SpokenNLP: официальный репозиторий кодовых баз широкого спектра исследовательских проектов, разработанных командой SpokenNLP Speech Lab, Alibaba Group. 🖥Github: https://github.com/alibaba-damo-academy/spokennlp 📕Paper: https://arxiv.org/pdf/2310.11772v1.pdf 🚀Dataset: https://paperswithcode.com/dataset/wikisection @DevspПодписаться

​​📑 DocXChain: A Powerful Open-Source Toolchain for Document Parsing and Beyond DocXChain - мощный инструментарий с открытым исходным кодом для синтаксического анализа документов, предназначенный для автоматического преобразования разнородной информации, содержащейся в неструктурированных документах, таких как текст, таблицы и диаграммы, схемы в структурированные представления, доступные для машинного чтения и манипулирования. Предоставляются базовые возможности, включая обнаружение текста, распознавание текста, распознавание структуры таблиц и анализ макета. 🖥Github: https://github.com/alibabaresearch/advancedliteratemachinery 📕Paper: https://arxiv.org/abs/2310.12430v1 🚀Damo: https://damo.alibaba.com/labs/language-technology @DevspПодписаться

🧠 Улучши ИИ на хакатоне X5 Tech AI Hack! У тебя будет 10 дней, чтобы избавить нейросеть от галлюцинаций и научить ее работат
🧠 Улучши ИИ на хакатоне X5 Tech AI Hack! У тебя будет 10 дней, чтобы избавить нейросеть от галлюцинаций и научить ее работать с конфиденциальными данными. Призовой фонд от X5 Tech – 2 000 000 рублей. Старт ML-соревнования – 17 мая. Не жди дедлайна, регистрируйся прямо сейчас: https://cnrlink.com/x5techaihackdsml На выбор – один из двух треков: 1️⃣ Маскирование. Предстоит разработать алгоритм, который будет заменять чувствительные данные в датасете без потери смысла. 2️⃣ Детекция галлюцинаций. Задача конкурсантов – создать систему, которая сможет эффективно выявлять аномалии в тексте, сгенерированном нейросетью. 28-29 мая 5 лучших команд в каждом треке получат приглашение на финал в Москве. Церемония награждения пройдет на X5 Future Night. Участвуй в X5 Tech AI Hack и внеси свой вклад в развитие ML-технологий: https://cnrlink.com/x5techaihackdsml Реклама. ООО «ИТ ИКС 5 Технологии». ИНН 1615014289. erid: LjN8KNVZC

​​🐾 Putting the Object Back into Video Object Segmentation (Cutie) Cutie - это фреймворк для сегментации видеообъектов, обладающий большей высокой производительностью, устойчивостью и скоростью. Cutie четко отделяет семантику объекта переднего плана от фона. На сложном наборе данных MOSE Cutie превосходит все предыдущие методы сегментации. Cutie выполняет чтение памяти на уровне объектов сверху вниз, адаптируя небольшой набор объектных запросов для реструктуризации и итеративного взаимодействия с восходящими пиксельными функциями с помощью преобразователя объектов на основе запросов. 🖥Github: https://github.com/hkchengrex/Cutie 🖥Colab: https://colab.research.google.com/drive/1yo43XTbjxuWA7XgCUO9qxAi7wBI6HzvP?usp=sharing 📕Paper: https://arxiv.org/abs/2310.12982v1 🚀Project: https://hkchengrex.github.io/Cutie/ @DevspПодписаться

​​🖥AutoGen AutoGen — это платформа, позволяющая разрабатывать приложения LLM с использованием нескольких агентов, которые могут взаимодействовать друг с другом для решения задач. Агенты AutoGen настраиваемы, доступны для общения и легко допускают участие человека. Они могут работать в различных режимах, в которых используются комбинации LLM, человеческого участия и инструментов. 🖥Github: https://github.com/microsoft/autogen 📕Project: https://microsoft.github.io/autogen/ 🤗 FLAML.: https://github.com/microsoft/FLAML @DevspПодписаться

​​🦩 Woodpecker: Hallucination Correction for Multimodal Large Language Models Большие языковые модели могут вызывать галлюцинации и генерировать ложную информацию, что приводит к потенциальной дезинформации и путанице. Для борьбы с галлюцинациями в современных исследованиях в основном используется метод настройки по инструкции, требующий переобучения моделей на конкретных данных. В данной работе предлагается иной подход, представляя метод не требующий переобучения модели, который называется Woodpecker. 🖥Github: https://github.com/bradyfu/woodpecker 📕Paper: https://arxiv.org/abs/2310.15110v1Demo: https://21527a47f03813481c.gradio.live/ @DevspПодписаться

Как ML-инженеру пробиться из мидлов в сеньоры? Вы уже научились делать fit() и predict(), следующий шаг для роста - научиться
Как ML-инженеру пробиться из мидлов в сеньоры? Вы уже научились делать fit() и predict(), следующий шаг для роста - научиться чему-то большему, чем создание моделей. Как это сделать? Присоединяйтесь к курсу Hard ML от karpov.courses от Валерия Бабушкина, из British Petroleum и других топовых специалистов из Яндекса, X5 Retail Group и других крупных компаний. Вы получите максимально глубокое погружение в задачи, с которыми сталкивается современный бизнес. К концу каждого модуля у вас будет собственный ML-сервис под сложную и важную задачу. Курс охватывает абсолютно все этапы работы ML-инженера. Вы научитесь самостоятельно собирать и размечать данные, строить пайплайны их поставки, деплоить приложения, настраивать мониторинги и оценивать эффективность алгоритмов. Можно пройти курс целиком или выбрать наиболее интересные для вас блоки. Присоединяйтесь и получайте скидку 5% по промокоду DSDEVSP до 10.05.2024: https://clc.to/erid_LjN8K4inN Реклама. ООО "КАРПОВ КУРСЫ". ИНН 7811764627.

​​OpenBioLLM-Llama3-70B и 8B: Open-source Large Language Models in Medical Domain OpenBioLLM-Llama3-70B и 8B: самые эффективные и доступные на сегодняшний день Lms. Они превосходят таких гигантов индустрии, как GPT-4, Gemini, Meditron-70B, Med-PaLM-1 и Med-PaLM-2, в области биомедицины. - 70B : https://huggingface.co/aaditya/OpenBioLLM-Llama3-70B - 8B : https://huggingface.co/aaditya/OpenBioLLM-Llama3-8B - Таблица лидеров в области медицины: https://huggingface.co/spaces/openlifescienceai/open_medical_llm_leaderboard @DevspПодписаться

​​🔎 Moving Object Segmentation:All You Need Is SAM (and Flow) FlowSAM - новый инструмент для обнаружения и сегментации движущихся объектов на видео, который значительно превосходит все предыдущие модели, как для одного объекта, так и для множества объектов. ▪️ Project page: https://www.robots.ox.ac.uk/~vgg/research/flowsam/ ▪️ Code: https://github.com/Jyxarthur/flowsam ▪️Paper: https://arxiv.org/abs/2404.12389 ▪️ Data: https://drive.google.com/drive/folders/1tmDq_vG_BvY5po40Ux5OBds1avUM_CbR @DevspПодписаться

Для IT специалистов-фрилансеров: 🇫🇮 Переезд в Финляндию с помощью IT-инкубатора! ☑️ Если вы работаете в сфере IT на фриланс
Для IT специалистов-фрилансеров: 🇫🇮 Переезд в Финляндию с помощью IT-инкубатора! ☑️ Если вы работаете в сфере IT на фрилансе с постоянными клиентами, у вас есть возможность получить вид на жительство в Финляндии через наш IT-инкубатор. Эта программа иммиграции открывает двери на 2 года для специалистов IT-сектора: дизайнеров, 💻 программистов, 🔍 экспертов по SEO и 🚀цифровому маркетингу, позволяя им получить вид на жительство в Финляндии и переехать с семьей. Преимущества нашей программы: - срок рассмотрения ВНЖ через бизнес-инкубатор в среднем занимает всего 1-2 недели - полный доступ к государственной медицине, бесплатному образованию, а также получение различных пособий от КЕЛА - можете претендовать на получение ПМЖ через 4 года, гражданства - через 5 лет Для успешного участия в программе получения вида на жительство на 2 года в Финляндии через IT-инкубатор необходимо соблюсти️ 3 условия ⬇️: ❗️ Необходимо работать как фрилансер с постоянными клиентами 🤝 ❗️ Стабильный ежемесячный доход должен составлять не менее 5 300€. Этот уровень дохода позволит обеспечить комфортный уровень жизни и финансовую уверенность. ❗У вас должно быть законченное высшее образование в IT и/или опыт работы в сфере не менее 3 лет ☑️ Мы поможем с оформлением в качестве специалиста в финской компании 📈🏢 Вам не придется беспокоиться о мелочах, вы официально будете оформлены на работу в течение года в финской компании ((с опцией продления) 📋 ☑️ На каждом этапе вашего пребывания в Финляндии вы получите необходимую поддержку, начиная с открытия банковских счетов, получения дотаций и пособий, а также регистрации в магистрате, налоговой и КЕЛА. Наша команда обеспечит вам надлежащую помощь на пути к успешной адаптации в новой стране и облегчит весь процесс 📋. 💬 Дополнительные подробности о наших услугах и процессе получения ВНЖ в Финляндии - на нашем сайте по ссылке: https://rebrand.ly/40y5bhr 🌟 Не упустите шанс улучшить свою жизнь с нашим надежным сопровождением!

​​🔎 Moving Object Segmentation:All You Need Is SAM (and Flow) FlowSAM - новый инструмент для обнаружения и сегментации движущихся объектов на видео, который значительно превосходит все предыдущие модели, как для одного объекта, так и для множества объектов. ▪️ Project page: https://www.robots.ox.ac.uk/~vgg/research/flowsam/ ▪️ Code: https://github.com/Jyxarthur/flowsam ▪️Paper: https://arxiv.org/abs/2404.12389 ▪️ Data: https://drive.google.com/drive/folders/1tmDq_vG_BvY5po40Ux5OBds1avUM_CbR @DevspПодписаться

ААА! Авторы Академии Аналитиков Авито выпустили бесплатный курс по прикладной статистике. В нём две части — первая по базе, к
ААА! Авторы Академии Аналитиков Авито выпустили бесплатный курс по прикладной статистике. В нём две части — первая по базе, которую важно знать для работы с данными, вторая по более сложным критериям. Пройти можно здесь. Курс научит собирать и валидировать кастомные критерии на реальных данных, а ещё решать задачи бизнеса с применением прикладной статистики.

Если хотите развиваться в аналитике и Data Science и чувствуете, что нужно освежить и дополнить знания по математике, — пройд
Если хотите развиваться в аналитике и Data Science и чувствуете, что нужно освежить и дополнить знания по математике, — пройдите курс от Яндекс Практикума. На курсе: — дадим много практических кейсов; — расскажем, как подготовиться к собеседованиям: разберём типовые задачи от HR-менеджеров; — поможем с поиском работы. Начните учиться бесплатно, чтобы понять, ваше это или нет. Если понравится, платите за остальную часть как удобно: в рассрочку или целиком. Начать бесплатно

​​⚡️ UniMERNet: A Universal Network for Real-World Mathematical Expression Recognition UniMERNet значительно превосходит основные модели в распознавании реальных математических выражений, демонстрируя превосходную производительность для простых печатных выражений (SPE), сложных печатных выражений (CPE), выражений, снятых с экрана (SCE) и рукописных выражений (HWE), о чем свидетельствуют сравнительная оценка BLEU Score. • Github: https://github.com/opendatalab/unimernetPaper: https://arxiv.org/abs/2404.15254HF: https://huggingface.co/wanderkid/unimernet @DevspПодписаться

​​🔥 FlowMap: High-Quality Camera Poses, Intrinsics, and Depth via Gradient Descent Сквозной дифференцируемый метод, который определяет точные позы камеры, внутренние характеристики камеры и покадровую плотную глубину видеопоследовательности. Этот метод не только намного превосходит предшествующие методы корректировки пакетов на основе градиентного спуска, но и удивительно работает наравне с COLMAP, современным методом SfM, в последующей задаче синтеза новых представлений на 360 градусов. • Github: https://github.com/dcharatan/flowmapPaper: https://arxiv.org/abs/2404.15259Dataset: https://drive.google.com/drive/folders/1PqByQSfzyLjfdZZDwn6RXIECso7WB9IY @DevspПодписаться