Data Science | Machinelearning [ru]

Open in Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

Network:Frontender's notes [ru]Russia33 728 Technologies & Applications6 722...

📈 Analytical overview of Telegram channel Data Science | Machinelearning [ru]

Channel Data Science | Machinelearning [ru] (@devsp) in the Russian language segment is an active participant. Currently, the community unites 20 019 subscribers, ranking 6 722 in the Technologies & Applications category and 33 728 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 20 019 subscribers.

According to the latest data from 19 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -73 over the last 30 days and by -9 over the last 24 hours, overall reach remains high.

Verification status: Not verified
Engagement rate (ER): The average audience engagement rate is 8.09%. Within the first 24 hours after publication, content typically collects 3.89% reactions from the total number of subscribers.
Post reach: On average, each post receives 1 619 views. Within the first day, a publication typically gains 779 views.
Reactions and interaction: The audience actively supports content: the average number of reactions per post is 8.
Thematic interests: Content is focused on key topics such as llm, nvidia, контекст, openai, архитектура.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
“Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD”

Thanks to the high frequency of updates (latest data received on 20 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

20 019

Subscribers

-924 hours

-557 days

-7330 days

1 619

Post views

~ 77924 hours

~ 94848 hours

8.09%

Engagement rate

~ 1

Posts per day

Ads index

beta

Posts Archive

20 013

🔍Как мы построили сервис, который поможет сократить поиск видео контента в огромной базе данных В этой статье мы расскажем, как мы использовали современные AI-технологии, чтобы сделать поиск видео быстрым и точным. Читать...

20 013

🚀LLaVA-OneVision: простая визуальная передача задач LLaVA-OneVision — семейство открытых больших мультимодальных моделей (LMM), разработанных путем консолидации наших идей в области данных, моделей и визуальных представлений в серии блогов LLaVA-NeXT. Модель, которая может одновременно раздвигать границы производительности открытых LMM в трех важных сценариях компьютерного зрения: сценарии с одним изображением, несколькими изображениями и видео. Важно отметить, что конструкция LLaVA-OneVision допускает сильный перенос обучения между различными модальностями/сценариями, что дает новые появляющиеся возможности. В частности, сильное понимание видео и возможности кросс-сценариев демонстрируются посредством переноса задач с изображений на видео. 🤗 Hugging Face 💾 Arxiv 📂 PDF @Devsp — Подписаться

20 013

🗣Как мы сломали языковой барьер с помощью одной модели? В этой статье я расскажу о реализации моего бесшовного модуля мультиязычности. Читать...

20 013

Хотите зарабатывать на создании сайтов больше? Запускайте сайты, интернет-магазины и лендинги для заказчиков в удобном конструкторе Nethouse и получайте 30% от их оплат тарифов, услуг, продвижения и настройки рекламы. Отличное решение для веб-студий и фрилансеров. Преимущества Nethouse: – работает с 2011 года, более 1.5 млн пользователей; – готовые шаблоны сайтов разных тематик; – техподдержка без выходных и праздников; – удобные интеграции с популярными сервисами; – сайты отлично продвигаются в поисковых системах; – серверы находятся в РФ, защита от DDoS-атак. Узнать больше Реклама. Рекламодатель: ООО «Конструктор» ИНН 7814541386, erid: 2VtzqvyNkfd

20 013

🖥 Самые интересные статьи за последние дни: • Атрибутивное распознавание документов • Маршрутизация обращений: автоматизация в ИТ-поддержке с помощью ИИ и языковых моделей • Как анализировать тысячи отзывов с ChatGPT? Частые ошибки и пример на реальных данных

20 013

😵Как анализировать тысячи отзывов с ChatGPT? Частые ошибки и пример на реальных данных В этой статье автор расскажет про свой опыт решения рабочей задачи — анализ отзывов пользователей о компании, а также мы разберём возможные ошибки и посмотрим на пример кода и реальных данных. Читать...

20 013

✉️Маршрутизация обращений: автоматизация в ИТ-поддержке с помощью ИИ и языковых моделей В этой статье я расскажу, как нам удалось преобразовать подход к обслуживанию ИT‑запросов поддержки пользователей через проект интеллектуальной классификации и маршрутизации. Читать...

20 013

🥳 TexGen: генерация 3D-текстур на основе текста с многоракурсной выборкой и повторной выборкой Новая структура выборки и повторной выборки нескольких видов для генерации текстур, использующую предварительно обученную модель диффузии текста в изображение. Благодаря обширному количеству качественных и количественных оценок метод обеспечивает значительно лучшее качество текстур для разнообразных 3D-объектов с высокой степенью согласованности вида и богатой детализацией внешнего вида, превосходя современные методы. Кроме того, этот метод генерации текстур может также применяться для редактирования текстур с сохранением исходной идентичности. 🤗 Hugging Face 💾 Arxiv 📂 PDF @Devsp — Подписаться

20 013

📇Атрибутивное распознавание документов В этой статье хочу обсудить подходы к решению задачи атрибутивного распознавания, а также проблемы с которыми я сталкивался за 10 лет практики в этой области. Читать...

20 013

🖥 Самые интересные статьи за последние дни: • Наш опыт применения AI-технологий для классификации документов для подачи в суд • ИИ LLama3 без ограничений: локальный запуск, GROQ и интеграция в Телеграм бота с помощью Python • Агенты расширенного распространения: структура для эффективного исследования и передачи обучения

20 013

🤔Real AI Семантический Анализатор и решение задачи по извлечению поручений из распорядительных документов В этой статье мы расскажем о практической задаче – автоматическом заполнении карточек поручений в системе электронного документооборота путем анализа распорядительных документов, а также о нашем подходе к ее решению. Читать...

20 013

😎Meltemi: первая открытая большая языковая модель для греческого языка Модель имеет 7 миллиардов параметров и обучается на 40 миллиардах токенов греческого корпуса. Она содержит актуальную информацию по состоянию на сентябрь 2023 года. 🤗 Hugging Face 💾 Arxiv 📂 PDF @Devsp — Подписаться

20 013

🦙ИИ LLama3 без ограничений: локальный запуск, GROQ и интеграция в Телеграм бота с помощью Python В этой статье я расскажу, как использовать LLAMA3 ИИ в своих проектах. После небольшой подготовки мы приступим к созданию полноценного Telegram бота. Читать...

20 013

🥷Агенты расширенного распространения: структура для эффективного исследования и передачи обучения Diffusion Augmented Agents (DAAG), новую структуру, которая использует большие языковые модели, модели языка видения и модели диффузии для повышения эффективности выборки и переноса обучения в обучении с подкреплением для воплощенных агентов. DAAG hindsight перемаркирует прошлый опыт агента, используя модели диффузии для преобразования видео временно и геометрически согласованным образом для согласования с целевыми инструкциями с помощью техники, которую мы называем Hindsight Experience Augmentation. Большая языковая модель организует этот автономный процесс, не требуя человеческого надзора, что делает его хорошо подходящим для сценариев непрерывного обучения. 🤗 Hugging Face 💾 Arxiv 📂 PDF @Devsp — Подписаться

20 013

Осталось меньше месяца до окончания отбора научных статей по искусственному интеллекту и машинному обучению для публикации в журнале конференции AI Journey. Приз за лучшую статью составляет один миллион рублей. Ключевые исследования будут опубликованы в специальном выпуске журнала «Доклады Российской академии наук. Математика, информатика, процессы управления», а также в его англоязычной версии Doklady Mathematics. Научное издание выходит в рамках международной конференции AI Journey и доступно на мировых электронных библиотечных платформах, индексируясь в ведущих библиографических базах данных научного цитирования. Заявки на участие в конкурсе принимаются до 20 августа. Статьи должны быть оформлены в соответствии с Правилами отбора, написаны на русском или английском языках и содержать оригинальные, ранее не опубликованные данные. Решение о публикации и выборе победителя принимается экспертной комиссией. Не упустите возможность представить свои исследования на AI Journey 2024 и выиграть один миллион рублей! Ознакомьтесь с Правилами и отправьте свою статью на сайте AI Journey.

20 013

📄Наш опыт применения AI-технологий для классификации документов для подачи в суд В этой статье мы расскажем вам об опыте разработки этого решения для автоматизации труда юристов и взыскателей и трудностях, с которыми мы столкнулись. Читать...

20 013

📸 YandexART теперь может реставрировать архивные видеозаписи и кинохронику Этот навык будет полезен для кинокомпаний, музеев, историков и других специалистов, работающих с историческим наследием. С помощью нейросетевых технологий и компьютерной графики, команды компьютерного зрения Яндекса, Yandex Research и Плюс Студии уже смогли улучшить качество старых видеоматериалов для сериала «Игры» про Олимпиаду-80. Нейросеть научилась добавлять фактуру и недостающие детали на размытые и нечёткие кадры, такие как кирпичная кладка на стенах, узоры на женском платье, фары и поворотники у автомобилей. Особое внимание было уделено проблеме галлюцинаций — тенденции генеративных моделей добавлять несуществующие детали. Для её решения применили метод поэтапного обучения на данных низкого качества, что позволило повысить точность реконструкции. @Devsp — Подписаться

20 013

😇ThinK: более тонкий кэш ключей с помощью отсечения на основе запросов Новый метод обрезки кэша KV, зависящий от запроса, разработанный для минимизации потери веса внимания при выборочной обрезке наименее значимых каналов. Подход не только сохраняет или повышает точность модели, но и обеспечивает снижение затрат памяти более чем на 20% по сравнению с ванильными методами вытеснения кэша KV. Расширенные оценки моделей LLaMA3 и Mistral в различных наборах данных с длинными последовательностями подтверждают эффективность ThinK, устанавливая новый прецедент для эффективного развертывания LLM без ущерба для производительности. 🤗 Hugging Face 💾 Arxiv 📂 PDF @Devsp — Подписаться

20 013

👤Диалекты, зумеры и боты: секреты тестирования NLU-систем В этой статье обсуждаются проблемы, с которыми сталкиваются QA-инженеры при тестировании чат-ботов и голосовых помощников, а также методы, которые можно использовать для повышения эффективности этого процесса. Читать...

20 013

Аналитики-разработчики, станьте частью команды GigaChat 10 августа! 💻 Всего за один день вы пройдёте все этапы интервью, познакомитесь с командой и даже получите заветный оффер. Gigachat — мультимодальная языковая модель, способная генерировать тексты любой сложности и стиля, а также создавать изображения. Какие задачи решает команда GigaChat 👇 ✔️ Research: исследование и реализация перспективных подходов обучения, синтеза и фильтрации данных, конструирование метрик и бенчмарков LLM, разработка пайплайнов для решения продуктовых кейсов с помощью больших языковых моделей. ✔️ Code: реализация prod-ready кода по работе с LLM, БД, API. ✔️ Markup: формирование и контроль пайплайнов разметки данных. ✔️ Pretrain: повышение качества pretrain набора данных. ✔️ RL: эксперименты с RL, Reward и DPO подходами. Оставляйте отклик здесь, и до встречи на One Day Offer 10 августа! 😉