Data Science | Machinelearning [ru]

前往频道在 Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

显示更多

网络:Frontender's notes [ru]俄罗斯33 603 技术与应用6 683...

📈 Telegram 频道 Data Science | Machinelearning [ru] 的分析概览

频道 Data Science | Machinelearning [ru] (@devsp) 俄语语言赛道中的是活跃参与者。目前社区聚集了 19 966 名订阅者，在 技术与应用 类别中位列第 6 683，并在 俄罗斯 地区排名第 33 603 位。

📊 受众指标与增长动态

自 невідомо 创建以来，项目保持高速增长，吸引了 19 966 名订阅者。

根据 28 六月, 2026 的最新数据，频道保持稳定运转。过去 30 天订阅人数变化为 -97，过去 24 小时变化为 -9，整体触达仍然可观。

认证状态： 未认证
互动率 (ER)： 平均受众互动率为 6.80%。内容发布后 24 小时内通常能获得 3.96% 的反应，占订阅者总量。
帖子覆盖： 每篇帖子平均可获得 1 358 次浏览，首日通常累积 790 次浏览。
互动与反馈： 受众积极参与，单帖平均反应数为 5。
主题关注点： 内容集中在 llm, nvidia, контекст, openai, архитектура 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台：
“Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD”

凭借高频更新（最新数据采集于 29 六月, 2026），频道始终保持新鲜度与高覆盖。分析显示受众积极互动，使其成为 技术与应用 类别中的关键影响点。

19 966

订阅者

-924 小时

-427 天

-9730 天

1 358

帖子浏览量

~ 79024 小时

~ 91548 小时

6.80%

参与率

~ 1

每日帖子数

Ads index

beta

帖子存档

19 963

Когда data science была представлена , как отдельная дисциплина в науке?

Anonymous voting

19 963

10 трюков библиотеки Python Pandas, которые вам нужны Любите панд? Мы тоже. А еще мы любим эффективный код, поэтому собрали классные трюки, которые облегчат работу с библиотекой Python Pandas. https://proglib.io/p/pandas-tricks

19 963

na centre - чатбот, который поможет найти работу и оставаться в курсе карьерных возможностей. Чатбот позволяет получать интересные вакансии в одном месте, а не просматривать много телеграм-каналов, сайтов) @na_centre_bot поможет оставаться в курсе интересных вам вакансий с помощью настроек подписки по: - сфере деятельности - уровню зарплаты - локации (и по другим в будущем). Собирает вакансии из 100+ источников, постепенно список источников пополняется, добавляют персонализацию. Попробовать - @na_centre_bot 🚀

19 963

Kак появилась Data Science и при чем тут большие данные? От Википедии : " Data Science – это наука о данных, объединяющая разные области знаний: информатику, математику и системный анализ. Сюда входят методы обработки больших данных (Big Data), интеллектуального анализа данных (Data Mining), статистические методы, методы искусственного интеллекта, в т.ч машинное обучение (Machine Learning). DS включает методы проектирования и разработки баз данных и прикладного программного обеспечения " А подробнее про тему читайте по этой ссылке.

19 963

Всем привет! Мы сделали сервис, который отбирает вакансии по вашим интересам. Настройте личные фильтры: локация, точный технологический стек, и, конечно, не забудьте о деньгах. Все самые подходящие предложения рынка – в @GetMeIT_bot

19 963

Интервью с Data Scientist: «Я вижу, как моя работа влияет на жизнь людей» https://iot.ru/gadzhety/intervyu-s-data-scientist-ya-vizhu-kak-moya-rabota-vliyaet-na-zhizn-lyudey

19 963

Формула успеха: как стать востребованным экспертом по интеллектуальной обработке данных. https://telegra.ph/Formula-uspeha-kak-stat-vostrebovannym-ehkspertom-po-intellektualnoj-obrabotke-dannyh-03-29

19 963

Тонкая настройка предварительно обученных трансформаторов в RNN Microsoft + Deepmind + ... Трансформеры - это текущая СОТА в языковом моделировании. Но они сопряжены со значительными вычислительными затратами, поскольку механизм внимания квадратично масштабируется по длине последовательности. Потребление памяти также линейно растет с увеличением длины последовательности. Это узкое место ограничивает использование крупномасштабных предварительно обученных моделей генерации, таких как GPT-3 или преобразователи изображений. Недавно было предложено несколько эффективных вариантов трансформатора. Например, рекуррентный вариант линейной сложности (https://arxiv.org/abs/2006.16236) оказался хорошо подходящим для генерации авторегрессии. Он аппроксимирует внимание softmax с помощью рандомизированных или эвристических карт характеристик, но может быть трудно обучить или получить неоптимальную точность. Эта работа преобразует предварительно обученный преобразователь в его эффективный рекуррентный аналог линейной сложности с изученной картой функций для повышения эффективности при сохранении точности. Для этого они заменяют softmax Внимание в готовом предварительно обученном трансформаторе на его рекуррентную альтернативу линейной сложности, а затем тонкую настройку. ➕ Плюсы: + Процесс точной настройки требует гораздо меньше времени графического процессора, чем обучение повторяющихся вариантов с нуля + Преобразование большого стандартного трансформатора в облегченную модель вывода без повторения всей процедуры обучения очень удобно во многих последующих приложениях.

19 963

Сколько зарабатывает дата-сайентист: обзор зарплат и вакансий в 2021 https://telegra.ph/Skolko-zarabatyvaet-data-sajentist-obzor-zarplat-i-vakansij-v-2021-03-27

19 963

Мы много говорим о понятии data science , даже канал называется так, но многие всё еще путают данную науку с узкими отраслями IT сферы. Чтобы наши подписчики больше не путали данное понятие мы дадим понятное объяснени где и как используют data science. - Обнаружение аномалий, например, ненормальное поведение клиента, мошенничества; персонализированный маркетинг — электронные рассылки, ретаргетинг, системы рекомендаций; - Количественные прогнозы — показатели эффективности, качество рекламных кампаний и других мероприятий; - Cкоринговые системы — обработка больших объёмов данных, помощь в принятии решений, например, о предоставлении кредита; - Базовое взаимодействие с клиентом — стандартные ответы в чатах, голосовые помощники, сортировка писем по папкам. Пять основных этапов в работе с данными Сбор. Поиск каналов, где можно собирать данные, и выбор методов их получения. Проверка. Валидация, нивелирование аномалий, которые не влияют на результат и мешают дальнейшему анализу. Анализ. Изучение данных, подтверждение предположений. Визуализация. Представление информации в понятном для восприятия виде: графики, диа граммы. Реакция. Принятие решений на основе данных. Например, изменение маркетинговой стратегии, увеличение бюджета компании.

19 963

Что читать специалисту по Data Science в 2021 году В этом посте делимся с вами подборкой источников полезной информации о Data Science от сооснователя и CTO DAGsHub — сообщества и веб-платформы для контроля версий данных и совместной работы дата-сайентистов и инженеров по машинному обучению. В подборку попали самые разные источники, от аккаунтов в твиттере, до полноценных инженерных блогов, которые ориентированы для тех, кто точно знает, что ищет. Подробности под катом.

19 963

🔥Большой гайд по библиотеке pandas: анализ данных на Python https://telegra.ph/Vvedenie-v-pandas-analiz-dannyh-na-Python-03-24

19 963

Описание одиночного набора данных Факты - упрямая вещь, а статистика гораздо сговорчивее. -Марк Твен Благодаря полезному сочетанию живого слова и удачи социальная сеть DataSciencester выросла до нескольких десятков пользователей, и директор по привлечению фи нансовых ресурсов просит вас проанализировать, сколько друзей есть у пользова телей сети, чтобы он мог включить эти данные в свои "презентации для лифта" 2• Используя простые методы из главы 1, вы легко можете предъявить запрашивае мые данные. Однако сейчас вы столкнулись с задачей выполнения их описательно го аншlИза. Любой набор данных очевидным образом характеризует сам себя: # Число друзей nurn friends [100, 49, 41, 40, 25, # ... и еще много других ] Для достаточно малого набора данных такое описание может даже оказаться наи лучшим. Но для более крупного набора данных это будет выглядеть очень громоздко и, скорее всего, непрозрачно. https://telegra.ph/Opisanie-odinochnogo-nabora-dannyh-03-23

19 963

Big Data: что это такое, как искать, хранить и использовать В этой статье разберемся, что считается Big Data, а что нет, как эту информацию хранить, обрабатывать и получать пользу. https://telegra.ph/Big-Data-chto-ehto-takoe-kak-iskat-hranit-i-ispolzovat-03-22

19 963

Найти и обезвредить: как Big Data и Machine Learning сканируют ваши соцсети для предупреждения преступлений https://telegra.ph/Najti-i-obezvredit-kak-Big-Data-i-Machine-Learning-skaniruyut-vashi-socseti-dlya-preduprezhdeniya-prestuplenij-03-21

19 963

5 лучших библиотек Python для визуализации данных https://telegra.ph/5-luchshih-bibliotek-Python-dlya-vizualizacii-dannyh-03-20

19 963

Участие искусственного интеллекта в современном трейдинге Профессиональные трейдеры периодически вынуждены модернизировать свои наработки, так как прогресс делает трейдинг сложнее. В 2000–2015 гг. им пришлось конкурировать с торговыми ботами, а потом научиться настраивать их, чтобы силы уравнялись. Примерно с 2015 года трейдерам и их ботам приходится конкурировать уже с искусственным интеллектом. https://telegra.ph/Uchastie-iskusstvennogo-intellekta-v-sovremennom-trejdinge-03-19

19 963

Разбираем, чем отличается версионирование в ML-разработке по коду от версионирования по коду и состоянию. Ситуация: вы работаете над проектом, например занимаетесь ML-прототипированием или анализом данных. По ходу работы в системе сохраняется код, и вы спокойно продолжаете, не боясь что-то упустить из виду. Но в конце недели понимаете, что где-то свернули не туда. Вы откатываетесь на несколько шагов назад по коду, и все бы ничего, но вычисления ведь придется делать заново. Это главный недостаток версионирования по коду. Версионирование по коду и состоянию отличается тем, что во время работы сохраняется не только сам код, но и состояние вычислений. То есть состояние = код + вывод + переменные. Это значит, что если вы откатитесь назад, то получите не только прежний код, но и значения переменных. Вам не придется заново запускать вычисления, терять время и ресурсы. Попробуйте версионирование по коду и состоянию в Yandex DataSphere, где каждому новому пользователю доступны бесплатные ресурсы на ML-разработку: 👉 https://clck.ru/ToJNp

19 963

Как устроены камеры с искусственным интеллектом В каждой умной камере есть встроенная видеоаналитика, сегодня чаще всего здесь используются нейросети глубокого обучения или искусственный интеллект. Это стало возможным благодаря увеличению мощности процессоров видеокамер, раньше видеоаналитика могла существовать только на серверах. https://telegra.ph/Kak-ustroeny-kamery-s-iskusstvennym-intellektom-03-18

19 963

Построение графиков в Python при помощи Matplotlib Картиной можно выразить тысячу слов. В случае с библиотекой Python matplotlib, к счастью, понадобится намного меньше слов в коде для создания качественных графиков. https://telegra.ph/Postroenie-grafikov-v-Python-pri-pomoshchi-Matplotlib-03-17