Data Science | Machinelearning [ru]

前往频道在 Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

显示更多

网络:Frontender's notes [ru]俄罗斯33 725 技术与应用6 726...

📈 Telegram 频道 Data Science | Machinelearning [ru] 的分析概览

频道 Data Science | Machinelearning [ru] (@devsp) 俄语语言赛道中的是活跃参与者。目前社区聚集了 20 021 名订阅者，在 技术与应用 类别中位列第 6 726，并在 俄罗斯 地区排名第 33 725 位。

📊 受众指标与增长动态

自 невідомо 创建以来，项目保持高速增长，吸引了 20 021 名订阅者。

根据 18 六月, 2026 的最新数据，频道保持稳定运转。过去 30 天订阅人数变化为 -63，过去 24 小时变化为 -3，整体触达仍然可观。

认证状态： 未认证
互动率 (ER)： 平均受众互动率为 8.21%。内容发布后 24 小时内通常能获得 4.21% 的反应，占订阅者总量。
帖子覆盖： 每篇帖子平均可获得 1 645 次浏览，首日通常累积 843 次浏览。
互动与反馈： 受众积极参与，单帖平均反应数为 7。
主题关注点： 内容集中在 llm, nvidia, контекст, openai, архитектура 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台：
“Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD”

凭借高频更新（最新数据采集于 19 六月, 2026），频道始终保持新鲜度与高覆盖。分析显示受众积极互动，使其成为 技术与应用 类别中的关键影响点。

20 021

订阅者

-324 小时

-507 天

-6330 天

1 645

帖子浏览量

~ 84324 小时

~ 1 00948 小时

8.21%

参与率

~ 1

每日帖子数

Ads index

beta

帖子存档

20 020

➡️ Что такое технология TTS, как устроена и каких сферах используется синтез речи Вместе с Григорием Стерлингом, лидом команды TTS в SberDevices, разбираемся, как устроена технология, как разрабатывают синтезаторы речи и что нужно знать, чтобы работать в этой сфере. Читать...

20 020

👩‍💻 Линейная регрессия и её регуляризация в Scikit-learn Линейная регрессия — это метод обучения с учителем, который предсказывает значение y на основе признаков X. Основное допущение — линейная зависимость y от Xi, что позволяет оценить y через математическое выражение. Читать...

20 020

❓ Кто такой разметчик данных и сколько он зарабатывает? Все, что вам нужно знать о профессии Как нейросети распознают лица и управляют авто? Всё это благодаря разметчикам данных, которые учат ИИ видеть и понимать мир. Узнайте, сколько они зарабатывают и какие навыки нужны для работы. Читать...

20 020

🤔 Топология в нейросетях? Когда говорят о математике в ML, чаще всего вспоминают Байесовские методы и тензоры. Но математика в машинном обучении может затрагивать и фундаментальные направления, как топологический анализ данных (TDA) — ту самую науку про бублики и ленточки. Читать...

20 020

🎭 Двойная игра в Power BI: как совмещать роли разработчика и администратора Когда твой руководитель говорит: «А теперь ты еще и администратор сервера Power BI». Гид по выживанию для разработчика, внезапно ставшего многостаночником. Читать...

20 020

Первый кейс использования федеративного машинного обучения в медицине Центр технологий для общества Yandex Cloud совместно с Сеченовским Университетом и ИСП РАН впервые продемонстрировали на практике использование федеративного подхода в сфере медицины. Это метод обучения ML-моделей, при котором данные остаются на стороне владельца и не передаются внешним подрядчикам. Таким образом сразу несколько организаций смогут обучать модель на нескольких независимых наборах данных и при этом не передавать их за пределы своей организации. Федеративный подход будет особенно актуален для сфер, которые работают с чувствительной и конфиденциальной информацией: финансы, здравоохранение, промышленность. Первая проба подхода заключалась в обучении ML-модели, чтобы распознавать патологии сердца на основе данных ЭКГ. Yandex Cloud совместно с ИСП РАН продумали архитектуру и развернули решение, а Сеченовский Университет предоставил данные и медицинскую экспертизу. В ходе эксперимента специалисты обучили модель диагностировать фибрилляцию предсердий по ЭКГ. Чувствительность модели составила 99%, а специфичность — 95%. Результаты впечатляющие. Немного о деталях: При федеративном обучении модель тренируется на локальном сервере клиента, который является частью распределённой системы обучения. Данные остаются у клиента, а на центральный сервер отправляются только обновлённые параметры модели, где они объединяются с параметрами, полученными от других клиентов. Это позволяет сохранять конфиденциальность данных и объединять ресурсы нескольких организаций для развития и улучшения модели. В будущем подход можно будет применять для разработки ИИ в любых задачах, где данных мало или их передача ограничена

20 020

🧠Квантовать или не квантовать LLM? В этой статье расскажем о квантовании и как оно помогает в выборе оборудования, а также рассмотрим основные типы квантов в llama.cpp. Читать...

20 020

🔍 Поиск дубликатов в клиентском MDM на миллиард записей Статья расскажет о подходах к объединению крупных баз данных с клиентской информацией, несмотря на ошибки и опечатки. Описываются методы предотвращения неверных объединений, включая сложные случаи, такие как записи братьев-близнецов. Читать...

20 020

🔥Много хардовой инфы для любителей LMM: Яндекс опубликовал в все доклады с прошедшей Practical ML Conf 2024 Один из самых запоминающихся докладов — история создание Нейро (продукт синтеза поисковых и генеративных технологий компании). Екатерина Серажим, руководитель управления качества, рассказала про: — Метрику «подверженность». Она направлена на то, чтобы максимально фокусировать и настраивать модель на извлечение информации из данных, минимизируя галлюцинации — Выбор оптимальной архитектуры и баланса между количеством данных и необходимыми мощностями при запуске в продакшн. — Разнообразие (снижение дисперсии) разметки текстов благодаря инструкциям. Так, модель не учит второстепенную информацию, а фокусируется на извлечении информации из инфо-контекста. А еще были интересные доклады про оптимизацию RAG-систем, синтез речи, методики для оптимизации подсистемы генеративного ридера и рексис. Такое мы однозначно смотрим.

20 020

🤖 Обучение GigaChat с контекстом в сотни тысяч токенов Статья расскажет о том, как команда SberDevices увеличивала объем контекста в диалогах для модели GigaChat, чтобы она могла учитывать реплики, сказанные сотни шагов назад. Представлена расшифровка доклада. Читать...

20 020

🚀Быстрее, выше, сильнее - вместе с Greenplum! 👉Начните на бесплатном вебинаре онлайн-курса «Greenplum для разработчиков и архитекторов» - «Оптимизация производительности в аналитической СУБД Greenplum»: https://vk.cc/cC5AI3 На вебинаре вы узнаете о: - Распределении данных: Как оптимально распределять данные по сегментам. - Индексах и партиционировании: Их роль в ускорении запросов. Нужны ли они в Greenplum? - Оптимизации запросов: Эффективные SQL-запросы и планировщик. В практической части будут рассмотрены инструменты мониторинга, такие как gpperfmon и gpstate. 🤝Понравится урок — продолжите обучение на курсе по спеццене и даже в рассрочку! Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576

20 020

🥸Хочу как Гендальф: как создать бота для подбора паролей промптами В этой статье рассказываем, как сделать такого бота, и попробовать выведать у него тайну. Читать...

20 020

❓Хотите узнать, как эффективно работать с аналитическими запросами в PostgreSQL и оптимизировать большие данные? Ждем вас на открытом вебинаре 10 октября в 20:00 мск, где мы разберем: - проблемы аналитических запросов в PostgreSQL; - методы оптимизации и удачный выбор технологий; - продолжение изучения работы PostgreSQL с большими данными. Урок для аналитиков, инженеров, архитекторов БД и всех, кто интересуется большими данными. Встречаемся в преддверии старта курса «PostgreSQL. Advanced». Все участники вебинара получат специальную цену на обучение! 👉 Регистрируйтесь прямо сейчас, чтобы не пропустить мероприятие: https://otus.pw/mkVE/ Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

20 020

🫠 ChatGPT и Gemini не могут справиться даже с простой математической задачкой на логику Сегодня увидел на репетиторском канале простенькую задачку на логику. И решил попробовать скормить ее ChatGPT и Gemini. Просто интереса ради. Вспомнил, что когда вышла ChatGPT 4-o в демках показывали, как она якобы может заменить учителей. Читать...

20 020

❗️Устали от несогласованных, дублирующихся, неполных данных? 👉Приходите на бесплатный вебинар онлайн-курса «Архитектор Togaf 10» — «Управление основными данными организации»: https://vk.cc/cC5tFV Отсутствие консолидации данных приводит к тому, что организация не имеет полного и точного представления о своих клиентах и процессах. TOGAF помогает в управлении основными данными, в том числе данными клиентов (CMDM) путем создания единого источника данных, разработки архитектуры и стандартов управления, интеграции систем и улучшения качества информации. Узнайте, как создать единую архитектуру данных для централизованного хранения информации о клиентах, установить стандарты управления данными, интегрировать различные системы! Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

20 020

🔐Безопасность в машинном обучении: от проектирования до внедрения В этой статье описывается методология Crisp-DM, позволяющая структурировать процесс разработки, а также рассматриваются уязвимости и возможные атаки на ML-модели. Читать...

20 020

На канале Яндекса вышел новый выпуск «1x1», в котором стажеры делятся своими впечатлениями и опытом прохождения стажировки в компании. Спойлер: можно совмещать учебу с разработкой масштабных проектов, а команда всегда готова помочь с любыми трудностями. И супербонус — стажеры могут посещать десятки ивентов, где можно нетворкать, знакомиться с разными командами сервисов и просто чиллить. Программа стажировок работает круглый год. Оба героя выпуска занимаются машинным обучением в Яндексе. Если хочется подтянуть скиллы по ML и попробовать попасть в штат, то прямо сейчас можно записаться на Тренировки по Machine Learning 2.0.

20 020

😎Пока не исправили — модифицируй, или Анализ расширений атаки уклонения для LLM В статье рассматриваются уязвимости генеративных моделей к атакам уклонения, которые манипулируют входными данными для получения неверных ответов. Читать...

20 020

🥳Tutor CoPilot: A Human-AI Approach for Scaling Real-Time Expertise Новый подход Human-AI, который использует модель экспертного мышления для предоставления экспертного руководства репетиторам во время их репетиторства. Это исследование является первым рандомизированным контролируемым испытанием системы Human-AI в живом репетиторстве, в котором участвуют 900 репетиторов и 1800 учеников K-12 из исторически малообеспеченных сообществ. Tutor CoPilot демонстрирует, как системы «человек-искусственный интеллект» могут масштабировать экспертные знания в реальных областях, устранять пробелы в навыках и создавать будущее, в котором высококачественное образование будет доступно всем учащимся. 🤗 Hugging Face 💾 Arxiv 📂 PDF @Devsp — Подписаться