Data Science | Machinelearning [ru]

前往频道在 Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

显示更多

网络:Frontender's notes [ru]俄罗斯33 728 技术与应用6 722...

📈 Telegram 频道 Data Science | Machinelearning [ru] 的分析概览

频道 Data Science | Machinelearning [ru] (@devsp) 俄语语言赛道中的是活跃参与者。目前社区聚集了 20 019 名订阅者，在 技术与应用 类别中位列第 6 722，并在 俄罗斯 地区排名第 33 728 位。

📊 受众指标与增长动态

自 невідомо 创建以来，项目保持高速增长，吸引了 20 019 名订阅者。

根据 19 六月, 2026 的最新数据，频道保持稳定运转。过去 30 天订阅人数变化为 -73，过去 24 小时变化为 -9，整体触达仍然可观。

认证状态： 未认证
互动率 (ER)： 平均受众互动率为 8.09%。内容发布后 24 小时内通常能获得 3.89% 的反应，占订阅者总量。
帖子覆盖： 每篇帖子平均可获得 1 619 次浏览，首日通常累积 779 次浏览。
互动与反馈： 受众积极参与，单帖平均反应数为 8。
主题关注点： 内容集中在 llm, nvidia, контекст, openai, архитектура 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台：
“Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD”

凭借高频更新（最新数据采集于 20 六月, 2026），频道始终保持新鲜度与高覆盖。分析显示受众积极互动，使其成为 技术与应用 类别中的关键影响点。

20 019

订阅者

-924 小时

-557 天

-7330 天

1 619

帖子浏览量

~ 77924 小时

~ 94848 小时

8.09%

参与率

~ 1

每日帖子数

Ads index

beta

帖子存档

20 015

🏦Ликбез по компьютерному зрению в банках. Как технологии ИИ защищают ваши деньги В этой статье я на примере нескольких кейсов наших клиентов расскажу, как в банках и других финансовых организациях используют компьютерное зрение и чем оно полезно для конечных пользователей. Читать...

20 015

Встречаемся 14 сентября на Practical ML Conf в Москве и онлайн! Machine learning, проверенный практикой* * Сгенерировано YandexGPT Главная конференция Яндекса по ML для экспертов: качественные технические доклады от ключевых инженеров, максимум пользы и знаний о практическом применении. Ключевые темы конференции: CV / NLP / Speech / RecSys / MLOps / Data science В числе спикеров: – Степан Комков — Яндекс Поиск, старший разработчик службы синтеза речи; – Дмитрий Антипов — Сбер, АБТ, тимлид разработки; – Виктор Плошихин — Yandex Cloud, руководитель ML-лаборатории в Yandex Platform Engineering. Во вдохновляющем футуристичном пространстве «Суперметалл» мы поговорим о кейсах, которые не найти в научных статьях, ведь когда они появятся — вы уже не сможете оказаться в числе визионеров. Ждём вас, чтобы заглянуть в будущее вместе — офлайн и онлайн. Реклама. ООО "Яндекс", ИНН 7736207543.

20 015

🧐InfinityMATH: масштабируемый набор данных для настройки инструкций в программных математических рассуждениях Конвейер построения делает акцент на разделении чисел от математических задач для синтеза независимых от чисел программ, что обеспечивает эффективное и гибкое масштабирование при минимизации зависимости от конкретных числовых значений. Эксперименты по тонкой настройке с открытым исходным кодом языковых и кодовых моделей, таких как Llama2 и CodeLlama, демонстрируют практические преимущества InfinityMATH. Эти тонко настроенные модели показали значительные относительные улучшения как в области, так и вне области бенчмарков, в среднем от 184,7% до 514,3%. Кроме того, эти модели продемонстрировали высокую надежность на тестах GSM8K+ и MATH+, которые являются улучшенной версией тестовых наборов с простыми вариациями чисел. 🤗 Hugging Face 💾 Arxiv 📂 PDF @Devsp — Подписаться

20 015

⚡️Рекурсивный отбор признаков. Динамический шаг в танце feature selection В статье рассматривается выбор оптимального шага при рекурсивном отборе признаков (RFE), а также предлагаются три подхода: фиксированный шаг, динамический шаг, зависящий от количества признаков, и динамический шаг, основанный на значимости признаков. Читать...

20 015

Как подготовить данные без пропусков, дубликатов и некорректных значений? Расскажем как предварительно обработать сырые данные на открытом уроке «Подготовка данных в Pandas» 🔹Последовательно рассмотрим этапы обработки пропусков, дубликатов и поиск аномалий.

✅ Практика: Чистка данных при помощи библиотеки Pandas

Урок приурочен курсу «Machine Learning» от Otus. По окончанию обучение получите диплом государственного образца. 👉 Регистрация и подробности: https://otus.pw/7xOF/ Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

20 015

🤖UniT: унифицированное тактильное представление для обучения роботов Новый подход к обучению тактильному представлению, использующий VQVAE для изучения компактного скрытого пространства и служащий тактильным представлением. Он использует тактильные изображения, полученные от одного простого объекта, для обучения представлению с возможностью переноса и обобщения. Эффективность UniT в обучении политике продемонстрирована на трех реальных задачах, включающих разнообразные манипулируемые объекты и сложные взаимодействия робота-объекта-среды. Благодаря обширным экспериментам UniT показал себя простым в обучении, подключаемым и работающим, но широко эффективным методом обучения тактильному представлению. 🤗 Hugging Face 💾 Arxiv 📂 PDF @Devsp — Подписаться

20 015

😉Уроки, извлеченные из масштабирования до многотерабайтных датасетов В этой статье я расскажу, с какими сложностями столкнулся при увеличении масштабов датасета и как их удалось решить. Читать...

20 015

AI помогает бизнесу анализировать большие объемы данных, чтобы принимать обоснованные решения и повышать эффективность процессов. ➡️Сервисы речевой аналитики позволяют распознавать и глубоко анализировать голосовые и текстовые диалоги с помощью технологий машинного обучения и искусственного интеллекта. ✔️22 августа в 11.00 МСК MWS проведет вебинар о сервисе речевой аналитики, который они развернули в своем облаке совместно с UKTECH LAB. ↘️ На вебинаре вы узнаете, как MWS внедрили сервис речевой аналитики для сети клиник «Кремлёвская стоматология». В эфире расскажут: 🔴Что компании уже сегодня получают с помощью речевой аналитики в облаке. 🔴Как AI в облаке помог компании: - на 20% увеличить конверсию из обращений в запись, - на 14% снизить время на постобработку звонков. 🔴Какие облачные решения обеспечивают надёжное хранение и безопасную обработку персональных данных. Приходите на вебинар и задавайте свои вопросы - за лучший вопрос в чате трансляции - будет подарок :) Реклама. Информация о рекламодателе.

20 015

🦾ControlNeXt: Powerful and Efficient Control for Image and Video Generation ControlNeXt — мощный и эффективный метод для контролируемой генерации изображений и видео. Метод легко интегрируется с другими весами LoRA, позволяя изменять стиль без необходимости дополнительного обучения. Были проведены различные эксперименты с различными базовыми моделями для изображений и видео, продемонстрировав надежность нашего метода. 🤗 Hugging Face 💾 Arxiv 📂 PDF @Devsp — Подписаться

20 015

В чём особенность рекламы на маркетплейсах и как она связана с ранжированием и продвижением — обсуждают эксперты бигтехов в подкасте «Рандомные дрова» от Ozon Tech. Слушайте, чтобы узнать, как работает механизм аукциона изнутри, как ML-модели учитывают конверсию и какие метрики нужны для измерения качества рекламы в e-com. 🎧 Приятного прослушивания на любимой площадке!

20 015

🗣Fine-tuning больших языковых моделей в 2024 году В этой статье мы рассмотрим жизненный цикл LLM, включая этапы концепции, выбора модели и оценки точности. Читать...

20 015

🔥VITA: Towards Open-Source Interactive Omni Multimodal LLM Мультимодальная большая языковая модель (MLLM) с открытым исходным кодом, которая способна одновременно обрабатывать и анализировать модальности видео, изображений, текста и аудио, и в то же время обладает передовым мультимодальным интерактивным опытом. Она демонстрирует надежные базовые возможности многоязычного, визуального и аудиопонимания, о чем свидетельствует ее высокая производительность в ряде как унимодальных, так и мультимодальных тестов. 🤗 Hugging Face 💾 Arxiv 📂 PDF @Devsp — Подписаться

20 015

👾Transfer learning: подробный гайд для начинающих В этой статье мы расскажем, как работает TL, где оно используется, и разберем конкретные кейсы. Читать...

20 015

❓Ваши системы падают при любой удобной возможности? Хотите узнать, как обеспечить непрерывную работу с помощью PostgreSQL-кластера? Ждем вас на открытом вебинаре 15 августа в 20:00 мск, где мы разберём: - что такое доступность и как она достигается; - как построение архитектуры связано с доступностью; - реализацию failover в PostgreSQL и настройку кластера для обеспечения отказоустойчивости. Вы получите ценные знания и практические навыки, которые помогут вам настроить кластер так, чтобы падение одной из нод не приводило к сбоям всей системы. Спикер Антон Герасименко — опытный разработчик и преподаватель, .net developer + lead. Встречаемся в преддверии старта курса «Базы данных». Все участники вебинара получат специальную цену на обучение! 👉 Регистрируйтесь прямо сейчас, чтобы не пропустить бесплатный урок: https://otus.pw/436ki/ Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

20 015

🖥 Самые интересные статьи за последние дни: • Как мы построили сервис, который поможет сократить поиск видео контента в огромной базе данных • Опенсорс на арене: правда ли так хороша Llama 3.1 405B? • Оценка LLM с большим окном контекста

20 015

🦙Опенсорс на арене: правда ли так хороша Llama 3.1 405B? В этой статье мы проведем независимое расследование: сравним возможности Llama 3.1 405B с GPT-4o и Claude 3.5 Sonnet на ряду задач, от программирования до творческого письма, и попробуем понять, насколько она готова к практическому применению. Читать...

20 015

🤖Transformer Explainer: Интерактивное обучение текстогенерирующим моделям Этот инструмент помогает пользователям понять сложные концепции трансформеров, интегрируя обзор модели и обеспечивая плавные переходы между уровнями абстракции математических операций и структур моделей. Он запускает живой экземпляр GPT-2 локально в браузере пользователя, позволяя пользователям экспериментировать с собственным вводом и наблюдать в реальном времени, как внутренние компоненты и параметры трансформера работают вместе, чтобы предсказывать следующие токены. Инструмент не требует установки или специального оборудования, расширяя образовательный доступ общественности к современным генеративным методам ИИ. 🤗 Hugging Face 💾 Arxiv 📂 PDF @Devsp — Подписаться

20 015

👍Оценка LLM с большим окном контекста В этой статье мы расскажем как получилось достичь уровня gpt-4 на собственном ограниченном датасете большого контекста. Читать...

20 015

⚡️LLM-DetectAIve: инструмент для точного машинного обнаружения текста Система, разработанная для детального обнаружения MGT. Она способна классифицировать тексты по четырем категориям: написанные человеком, сгенерированные машиной, написанные машиной-очеловеченные и написанные машиной-отшлифованные. В отличие от предыдущих детекторов MGT, которые выполняют бинарную классификацию, введение двух дополнительных категорий в LLM-DetectiAIve дает представление о различных степенях вмешательства LLM во время создания текста. Это может быть полезно в некоторых областях, таких как образование, где любое вмешательство LLM обычно запрещено. Эксперименты показывают, что LLM-DetectAIve может эффективно определять авторство текстового контента, доказывая его полезность для повышения целостности в образовании, академической среде и других областях. 🤗 Hugging Face 💾 Arxiv 📂 PDF @Devsp — Подписаться

20 015

🔍Как мы построили сервис, который поможет сократить поиск видео контента в огромной базе данных В этой статье мы расскажем, как мы использовали современные AI-технологии, чтобы сделать поиск видео быстрым и точным. Читать...