ch
Feedback
Мир аналитика данных

Мир аналитика данных

前往频道在 Telegram

Пишу о рабочих буднях и о том как я сменила профессию. https://www.linkedin.com/in/валерия-шуваева/ Автор канала: @Valeria_Shuvaeva

显示更多
4 614
订阅者
-424 小时
-67
+230
吸引订阅者
七月 '26
七月 '260
在0个频道中
六月 '26
+55
在0个频道中
Get PRO
五月 '26
+60
在0个频道中
Get PRO
四月 '26
+48
在0个频道中
Get PRO
三月 '26
+41
在0个频道中
Get PRO
二月 '26
+65
在0个频道中
Get PRO
一月 '26
+55
在0个频道中
Get PRO
十二月 '25
+51
在0个频道中
Get PRO
十一月 '25
+89
在0个频道中
Get PRO
十月 '25
+84
在0个频道中
Get PRO
九月 '25
+156
在1个频道中
Get PRO
八月 '25
+77
在0个频道中
Get PRO
七月 '25
+88
在0个频道中
Get PRO
六月 '25
+77
在0个频道中
Get PRO
五月 '25
+101
在2个频道中
Get PRO
四月 '25
+132
在1个频道中
Get PRO
三月 '25
+454
在1个频道中
Get PRO
二月 '25
+154
在0个频道中
Get PRO
一月 '25
+301
在1个频道中
Get PRO
十二月 '24
+87
在0个频道中
Get PRO
十一月 '24
+167
在2个频道中
Get PRO
十月 '24
+102
在0个频道中
Get PRO
九月 '24
+70
在1个频道中
Get PRO
八月 '24
+162
在0个频道中
Get PRO
七月 '24
+265
在2个频道中
Get PRO
六月 '24
+1 191
在2个频道中
Get PRO
五月 '24
+139
在0个频道中
Get PRO
四月 '24
+92
在0个频道中
Get PRO
三月 '24
+152
在1个频道中
Get PRO
二月 '24
+103
在0个频道中
Get PRO
一月 '24
+90
在0个频道中
Get PRO
十二月 '23
+99
在0个频道中
Get PRO
十一月 '23
+112
在0个频道中
Get PRO
十月 '23
+212
在0个频道中
Get PRO
九月 '23
+112
在0个频道中
Get PRO
八月 '23
+212
在0个频道中
Get PRO
七月 '23
+103
在0个频道中
Get PRO
六月 '23
+91
在0个频道中
Get PRO
五月 '23
+50
在0个频道中
Get PRO
四月 '23
+68
在0个频道中
Get PRO
三月 '23
+81
在0个频道中
Get PRO
二月 '23
+133
在0个频道中
Get PRO
一月 '23
+119
在0个频道中
Get PRO
十二月 '22
+107
在0个频道中
Get PRO
十一月 '22
+111
在0个频道中
Get PRO
十月 '22
+54
在0个频道中
Get PRO
九月 '22
+429
在0个频道中
日期
订阅者增长
提及
频道
01 七月0
频道帖子
📊 А/Б-тесты. Считаем MDE до того, как запустим тест. Хочу показать вам рабочий код для расчета минимального детектируемого эффекта (MDE) - это самый маленький истинный эффект, который тест сможет признать значимым. 🎯 На каком примере будем считать? Покажу на примере конверсии (бинарная метрика). Её часто ставят как приемочную метрику. Она просто считается и легко интерпретируется. Например, вы хотите поменять что-то в приложении – дизайн какой-то карточки, ее рекомендательную систему или просто сделали что-то еще из улучшений. И вы можете рассчитать конверсию в добавление в корзину или открытие какого-то блока или прям в саму покупку. ⭐Пусть наша приемочная метрика - конверсия пользователей в заказ. Нам нужны два простых поля на каждого активного пользователя: ● active_user_id - кто заходил в приложение за последние 2 недели; ● order_flg - совершил ли он целевое действие (1 - да, 0 - нет). ✅ Генерируем синтетический датасет на 50 000 пользователей с базовой конверсией 5%:
n = 50000                   
baseline_conversion = 0.05
np.random.seed(42)
active_user_id = np.arange(1, n + 1)
order_flg = np.random.binomial(1, baseline_conversion, size=n)
df = pd.DataFrame({'active_user_id': active_user_id,'order_flg': order_flg})
df.head()
Смотрим на фактические цифры:
active_users = df['active_user_id'].nunique()
users_with_order = df[df['order_flg']==1]['active_user_id'].nunique()

share_users_with_order = users_with_order / active_users

print('Активные клиенты:', active_users)
print('Клиенты с заказом:', users_with_order)
print('Конверсия в заказ:', round(share_users_with_order * 100, 2), '%')
Формула расчёта MDE Я использую стандартный подход на основе z-критерия для двух пропорций Это означает, что мы предполагаем: при больших выборках распределение разности конверсий между тестом и контролем стремится к нормальному (ЦПТ). В функции n_total — это суммарное количество пользователей в обеих группах. То есть при n_total = 50 000 в каждой группе будет по 25 000 человек.
def mde_for_conversion(baseline, n_total, alpha=0.05, power=0.80, two_sided=True):
    """
    baseline - конверсия в контроле
    n_per_group - размер каждой группы
    """
    n_per_group = n_total / 2
    p = baseline 
    # Квантили нормального распределения
    if two_sided:  z_alpha = norm.ppf(1 - alpha/2) 
    else: z_alpha = norm.ppf(1 - alpha)
    z_beta = norm.ppf(power)
    
    se = math.sqrt(p * (1 - p) / n_per_group + p * (1 - p) / n_per_group)
    mde_abs = (z_alpha + z_beta) * se
    mde_rel = mde_abs / baseline * 100
    lower = baseline - mde_abs
    upper = baseline + mde_abs
    return mde_abs, mde_rel, lower, upper
Считаем mde
n_total = int(active_users) #всего пользователей для обеих групп
baseline_conversion =share_users_with_order
 
mde_abs, mde_rel, lower, upper = mde_for_conversion(baseline_conversion, n_total)
print("\n" + "=" * 60)
print("MDE ДЛЯ КОНВЕРСИИ (n_total=" + format(n_total, ",") + "):")
print("=" * 60)
print("Baseline:", round(baseline_conversion*100, 2), "%")
print("MDE: ±", round(mde_abs*100, 2), "п.п. (", round(mde_rel, 2), "% )")
print("Диапазон:", round(lower*100, 2), "% –", round(upper*100, 2), "%")
📈 Смотрим на вывод и делаем выводы 😀 MDE ДЛЯ КОНВЕРСИИ (n_total=50,000): Baseline: 4.94 % MDE: ± 0.54 п.п. ( 10.99 % ) Диапазон: 4.4 % – 5.48 % Как это читать? 1️⃣ Сейчас базовая конверсия - 4.94%. 2️⃣ Мы сможем статистически значимо зафиксировать изменение, только если конверсия в тесте выйдет за пределы коридора 4.4% – 5.48%. 3️⃣Это означает, что тест «увидит» только прирост от 10.99% относительно базового значения. Если ваше дизайн-решение даёт +5% к конверсии (а это очень даже неплохо!), то при 50 000 пользователях тест не сможет это доказать. 😭 Вы получите p-value > 0.05 и решите, что эффекта нет, хотя он есть. Но чтобы «поймать» +5%, нужно кратно увеличивать выборку, например держать тест не две недели, а три. 📎 Вот ноутбук, чтобы Вы смогли поэкспериментировать. Если нравятся такие посты с реальным кодом и разбором A/B, то ставьте огонечки 🔥😀

2
Ребята, привет! 👋 Хочу рассказать вам про штуку, которая Вам понравится. У Паши Бухтика (No Data No Growth) через 2 дня стартует новый поток по A/B. И формат в этот раз необычный 👀 Раньше аналитики и продакты учились отдельно. А тут он собрал их на одном потоке с общими обсуждениями и совместными домашками. И мне эта идея прям откликнулась. Если бы уже не проходила у него курс, то пошла бы сейчас точно 🔥 Потому что в реальной работе A/B – это всегда общая ответственность продакта и аналитика. И чем хуже они понимают друг друга, тем чаще тест превращается в формальность, а не в инструмент решений. Знакомо, да? 😄 🎯 Что заберут продакты: За 7 недель практики научатся говорить с аналитиком на одном языке, грамотно ставить задачи, видеть слабые места в дизайне теста до запуска, не подкручивать методологию под свои гипотезы и защищать решения перед руководством. 📊 Что заберут аналитики: Программа шире – кроме общей части есть отдельные занятия: ✔️ сплитование; ✔️ симуляции Монте-Карло; ✔️ ratio-метрики и стат. критерии; ✔️ множественное тестирование; ✔️ A/B без A/B, ускорение, сетевой эффект. И то, чему почти нигде не учат – объяснять выводы A/B нетехническим людям и видеть, как продакт реально использует их в решениях. Часто именно это и отделяет мидла от сеньора 👍 🔥 А самое интересное – практики: Они проходят вместе в мини-группах: ➡️ Продакты начинают понимать, как думают аналитики; ➡️ Аналитики – как устроена продуктовая логика. Редкий случай, когда обе стороны учатся друг у друга прямо в процессе, а не после ✨ 🎓 А если вы уже были на прошлых потоках. Можно прийти снова: досдать домашки, освежить материал, попробовать новый формат. Паша обещал спецусловия. Старт уже 5 июня. Заявку можно оставить тут: 👉 Для аналитиков: https://nodatanogrowth.com/product-analyst-ab-testing 👉 Для продактов: https://nodatanogrowth.com/product-manager-ab-testing На аналитическом треке осталось всего 4 места. Так что лучше написать сегодня, чем в июле жалеть, что не успел 😉
1 046
3
От новичка до мидла всего за год: Авито запустил буткемп для аналитиков Авито открыл набор на годовую программу Avito Analyst
От новичка до мидла всего за год: Авито запустил буткемп для аналитиков Авито открыл набор на годовую программу Avito Analyst Bootcamp, где новичок с базой SQL и Python может вырасти до мидл-специалиста всего за 12 месяцев. Никаких «принеси-подай» и бесполезных задач. Только реальная продуктовая аналитика и BI-разработка с живыми данными под руководством сотрудников. Участники получают именно те навыки, которые потом нужны на работе. Главный бонус — равные возможности для всех, независимо от города. Стажировка доступна удаленно (от 30 часов в неделю) или в одном из пяти офисов компании. Авито намеренно собирает таланты со всей России, а не только из Москвы. К участию приглашаются студенты 2-4 курсов бакалавриата, 1-2 курсов магистратуры или 3-5 курсов специалитета, а также выпускники с дипломом по технической, математической или IT-специальности. Плюс — сильное комьюнити стажеров и наставники, которые поддерживают и помогают обмениваться опытом. Лучшие выпускники смогут начать карьеру в Авито. Заявки и резюме принимаются до 4 июня.
1 079
4
📚 Посмотрела хэндбук по A/B-тестированию от команды Trisigma (платформа экспериментов от Авито). Он оказался прям очень непл
📚 Посмотрела хэндбук по A/B-тестированию от команды Trisigma (платформа экспериментов от Авито). Он оказался прям очень неплохим. Там внутри собрана хорошая база, которую полезно освежить даже тем, кто уже давно работает с экспериментами и метриками 👀 И конечно можно повторить основы статистики: что такое дисперсия, стандартное отклонение, стандартная ошибка, типы распределения данных. Там прям хорошо разобрано. А то нет, нет, да и забывается какая-то формула или информация если это что-то прям не часто используется. Что конкретно есть внутри: 🟢основы A/B-тестов и типы экспериментов 🟢как формулировать гипотезы 🟢классификация метрик: goal / proxy / guardrail / debug 🟢OEC и закон Кэмпбелла 🟢ошибки в экспериментах и как не словить ложные выводы 🟢атомарный дизайн метрик 🟢ну и введение в матстат: дисперсия, стандартное отклонение, распределения, ЦПТ и т.д. (расчеты на примерах) Понравилось, что всё объясняется на нормальных продуктовых примерах, даже расчеты внутри есть 🧮 Забрать можно в боте @trisigma_avito_bot за подписку на их канал. Реклама. ООО "Авито Тех".
1 355
5
没有文字...
0
6
🔥 Вчера побывала в офисе Яндекса на Digital day! Главная тема вечера - Яндекс Метрика. Поделюсь сухими фактами сначала: ✅ Чт+3
🔥 Вчера побывала в офисе Яндекса на Digital day! Главная тема вечера - Яндекс Метрика. Поделюсь сухими фактами сначала: ✅ Что нового: - ИИ-помощник (уже в бета-версии - можно тестить 👀) - Можно смотреть средние показатели продаж по рынку, нужно только поставить галочку в настройках "Получить доступ к ответу по рынку" ✅ Ключевые инсайты (и где деньги 💰): - Как меняется аналитика под разные индустрии - Глубина разметки - куда копать, чтобы не тонуть в данных - Какие отчёты смотрят лидеры рынка в Метрике - Как измеряют вовлечённость - Где искать потери в данных и как их чинить ✅ Огонь-фишка, которую полезно изучить: В Метрику можно передавать данные e-commerce по client_id 📌 Это значит - отслеживать офлайн-выручку и связывать её с действиями на сайте. Кейс из METRO - рабочий и успешный 🔥 В общем, было объемно и интересно🔥 А еще получилось пообщаться с разными людьми - нетворкинг в силе 🤝 И да, несколько человек зашли в канал после встречи - спасибо, что вы здесь! 👏 А чтобы быть на связи плотнее, я добавила LinkedIn в описание. Жду в контактах! 🍕🍽 Ну и, конечно, вкусно покормили - тоже важная метрика мероприятия! 📎Спикеры обещали прислать презу со всеми ссылками и темами. Как пришлют - прикреплю здесь!
0