Data Science | Machinelearning [ru]

Open in Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

Network:Frontender's notes [ru]Russia33 725 Technologies & Applications6 726...

📈 Analytical overview of Telegram channel Data Science | Machinelearning [ru]

Channel Data Science | Machinelearning [ru] (@devsp) in the Russian language segment is an active participant. Currently, the community unites 20 021 subscribers, ranking 6 726 in the Technologies & Applications category and 33 725 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 20 021 subscribers.

According to the latest data from 18 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -63 over the last 30 days and by -3 over the last 24 hours, overall reach remains high.

Verification status: Not verified
Engagement rate (ER): The average audience engagement rate is 8.21%. Within the first 24 hours after publication, content typically collects 4.21% reactions from the total number of subscribers.
Post reach: On average, each post receives 1 645 views. Within the first day, a publication typically gains 843 views.
Reactions and interaction: The audience actively supports content: the average number of reactions per post is 7.
Thematic interests: Content is focused on key topics such as llm, nvidia, контекст, openai, архитектура.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
“Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD”

Thanks to the high frequency of updates (latest data received on 19 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

20 021

Subscribers

-324 hours

-507 days

-6330 days

1 645

Post views

~ 84324 hours

~ 1 00948 hours

8.21%

Engagement rate

~ 1

Posts per day

Ads index

beta

Posts Archive

20 020

➡️ Что такое технология TTS, как устроена и каких сферах используется синтез речи Вместе с Григорием Стерлингом, лидом команды TTS в SberDevices, разбираемся, как устроена технология, как разрабатывают синтезаторы речи и что нужно знать, чтобы работать в этой сфере. Читать...

20 020

👩‍💻 Линейная регрессия и её регуляризация в Scikit-learn Линейная регрессия — это метод обучения с учителем, который предсказывает значение y на основе признаков X. Основное допущение — линейная зависимость y от Xi, что позволяет оценить y через математическое выражение. Читать...

20 020

❓ Кто такой разметчик данных и сколько он зарабатывает? Все, что вам нужно знать о профессии Как нейросети распознают лица и управляют авто? Всё это благодаря разметчикам данных, которые учат ИИ видеть и понимать мир. Узнайте, сколько они зарабатывают и какие навыки нужны для работы. Читать...

20 020

🤔 Топология в нейросетях? Когда говорят о математике в ML, чаще всего вспоминают Байесовские методы и тензоры. Но математика в машинном обучении может затрагивать и фундаментальные направления, как топологический анализ данных (TDA) — ту самую науку про бублики и ленточки. Читать...

20 020

🎭 Двойная игра в Power BI: как совмещать роли разработчика и администратора Когда твой руководитель говорит: «А теперь ты еще и администратор сервера Power BI». Гид по выживанию для разработчика, внезапно ставшего многостаночником. Читать...

20 020

Первый кейс использования федеративного машинного обучения в медицине Центр технологий для общества Yandex Cloud совместно с Сеченовским Университетом и ИСП РАН впервые продемонстрировали на практике использование федеративного подхода в сфере медицины. Это метод обучения ML-моделей, при котором данные остаются на стороне владельца и не передаются внешним подрядчикам. Таким образом сразу несколько организаций смогут обучать модель на нескольких независимых наборах данных и при этом не передавать их за пределы своей организации. Федеративный подход будет особенно актуален для сфер, которые работают с чувствительной и конфиденциальной информацией: финансы, здравоохранение, промышленность. Первая проба подхода заключалась в обучении ML-модели, чтобы распознавать патологии сердца на основе данных ЭКГ. Yandex Cloud совместно с ИСП РАН продумали архитектуру и развернули решение, а Сеченовский Университет предоставил данные и медицинскую экспертизу. В ходе эксперимента специалисты обучили модель диагностировать фибрилляцию предсердий по ЭКГ. Чувствительность модели составила 99%, а специфичность — 95%. Результаты впечатляющие. Немного о деталях: При федеративном обучении модель тренируется на локальном сервере клиента, который является частью распределённой системы обучения. Данные остаются у клиента, а на центральный сервер отправляются только обновлённые параметры модели, где они объединяются с параметрами, полученными от других клиентов. Это позволяет сохранять конфиденциальность данных и объединять ресурсы нескольких организаций для развития и улучшения модели. В будущем подход можно будет применять для разработки ИИ в любых задачах, где данных мало или их передача ограничена

20 020

🧠Квантовать или не квантовать LLM? В этой статье расскажем о квантовании и как оно помогает в выборе оборудования, а также рассмотрим основные типы квантов в llama.cpp. Читать...

20 020

🔍 Поиск дубликатов в клиентском MDM на миллиард записей Статья расскажет о подходах к объединению крупных баз данных с клиентской информацией, несмотря на ошибки и опечатки. Описываются методы предотвращения неверных объединений, включая сложные случаи, такие как записи братьев-близнецов. Читать...

20 020

🔥Много хардовой инфы для любителей LMM: Яндекс опубликовал в все доклады с прошедшей Practical ML Conf 2024 Один из самых запоминающихся докладов — история создание Нейро (продукт синтеза поисковых и генеративных технологий компании). Екатерина Серажим, руководитель управления качества, рассказала про: — Метрику «подверженность». Она направлена на то, чтобы максимально фокусировать и настраивать модель на извлечение информации из данных, минимизируя галлюцинации — Выбор оптимальной архитектуры и баланса между количеством данных и необходимыми мощностями при запуске в продакшн. — Разнообразие (снижение дисперсии) разметки текстов благодаря инструкциям. Так, модель не учит второстепенную информацию, а фокусируется на извлечении информации из инфо-контекста. А еще были интересные доклады про оптимизацию RAG-систем, синтез речи, методики для оптимизации подсистемы генеративного ридера и рексис. Такое мы однозначно смотрим.

20 020

🤖 Обучение GigaChat с контекстом в сотни тысяч токенов Статья расскажет о том, как команда SberDevices увеличивала объем контекста в диалогах для модели GigaChat, чтобы она могла учитывать реплики, сказанные сотни шагов назад. Представлена расшифровка доклада. Читать...

20 020

🚀Быстрее, выше, сильнее - вместе с Greenplum! 👉Начните на бесплатном вебинаре онлайн-курса «Greenplum для разработчиков и архитекторов» - «Оптимизация производительности в аналитической СУБД Greenplum»: https://vk.cc/cC5AI3 На вебинаре вы узнаете о: - Распределении данных: Как оптимально распределять данные по сегментам. - Индексах и партиционировании: Их роль в ускорении запросов. Нужны ли они в Greenplum? - Оптимизации запросов: Эффективные SQL-запросы и планировщик. В практической части будут рассмотрены инструменты мониторинга, такие как gpperfmon и gpstate. 🤝Понравится урок — продолжите обучение на курсе по спеццене и даже в рассрочку! Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576

20 020

🥸Хочу как Гендальф: как создать бота для подбора паролей промптами В этой статье рассказываем, как сделать такого бота, и попробовать выведать у него тайну. Читать...

20 020

❓Хотите узнать, как эффективно работать с аналитическими запросами в PostgreSQL и оптимизировать большие данные? Ждем вас на открытом вебинаре 10 октября в 20:00 мск, где мы разберем: - проблемы аналитических запросов в PostgreSQL; - методы оптимизации и удачный выбор технологий; - продолжение изучения работы PostgreSQL с большими данными. Урок для аналитиков, инженеров, архитекторов БД и всех, кто интересуется большими данными. Встречаемся в преддверии старта курса «PostgreSQL. Advanced». Все участники вебинара получат специальную цену на обучение! 👉 Регистрируйтесь прямо сейчас, чтобы не пропустить мероприятие: https://otus.pw/mkVE/ Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

20 020

🫠 ChatGPT и Gemini не могут справиться даже с простой математической задачкой на логику Сегодня увидел на репетиторском канале простенькую задачку на логику. И решил попробовать скормить ее ChatGPT и Gemini. Просто интереса ради. Вспомнил, что когда вышла ChatGPT 4-o в демках показывали, как она якобы может заменить учителей. Читать...

20 020

❗️Устали от несогласованных, дублирующихся, неполных данных? 👉Приходите на бесплатный вебинар онлайн-курса «Архитектор Togaf 10» — «Управление основными данными организации»: https://vk.cc/cC5tFV Отсутствие консолидации данных приводит к тому, что организация не имеет полного и точного представления о своих клиентах и процессах. TOGAF помогает в управлении основными данными, в том числе данными клиентов (CMDM) путем создания единого источника данных, разработки архитектуры и стандартов управления, интеграции систем и улучшения качества информации. Узнайте, как создать единую архитектуру данных для централизованного хранения информации о клиентах, установить стандарты управления данными, интегрировать различные системы! Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

20 020

🔐Безопасность в машинном обучении: от проектирования до внедрения В этой статье описывается методология Crisp-DM, позволяющая структурировать процесс разработки, а также рассматриваются уязвимости и возможные атаки на ML-модели. Читать...

20 020

На канале Яндекса вышел новый выпуск «1x1», в котором стажеры делятся своими впечатлениями и опытом прохождения стажировки в компании. Спойлер: можно совмещать учебу с разработкой масштабных проектов, а команда всегда готова помочь с любыми трудностями. И супербонус — стажеры могут посещать десятки ивентов, где можно нетворкать, знакомиться с разными командами сервисов и просто чиллить. Программа стажировок работает круглый год. Оба героя выпуска занимаются машинным обучением в Яндексе. Если хочется подтянуть скиллы по ML и попробовать попасть в штат, то прямо сейчас можно записаться на Тренировки по Machine Learning 2.0.

20 020

😎Пока не исправили — модифицируй, или Анализ расширений атаки уклонения для LLM В статье рассматриваются уязвимости генеративных моделей к атакам уклонения, которые манипулируют входными данными для получения неверных ответов. Читать...

20 020

🥳Tutor CoPilot: A Human-AI Approach for Scaling Real-Time Expertise Новый подход Human-AI, который использует модель экспертного мышления для предоставления экспертного руководства репетиторам во время их репетиторства. Это исследование является первым рандомизированным контролируемым испытанием системы Human-AI в живом репетиторстве, в котором участвуют 900 репетиторов и 1800 учеников K-12 из исторически малообеспеченных сообществ. Tutor CoPilot демонстрирует, как системы «человек-искусственный интеллект» могут масштабировать экспертные знания в реальных областях, устранять пробелы в навыках и создавать будущее, в котором высококачественное образование будет доступно всем учащимся. 🤗 Hugging Face 💾 Arxiv 📂 PDF @Devsp — Подписаться