H0H1: про HR-аналитику
الذهاب إلى القناة على Telegram
Канал про HR аналитику и всё, что с этим связано Обратная связь: Telegram: https://t.me/GOrwell1984 LinkedIn: https://www.linkedin.com/in/botvinaiu/
إظهار المزيد2 286
المشتركون
+124 ساعات
-27 أيام
-230 أيام
أرشيف المشاركات
Есть, чем поделиться
Habr провел очередной конкурс Технотекст и выложил результаты.
Мне чертовски приятно: моя статья «Конфаундинг, или как аналитику попасть в ловушку» победила в номинации «Аналитика» среди частных авторов.
Для меня это особенно ценно, потому что статья была не про модный инструмент, не про очередной дашборд и не про «как мы всё посчитали и стали молодцами». Она была про менее удобную, но гораздо более важную вещь — про настоящую аналитику и качество вывода.
Спасибо Habr, жюри и всем, кто читал статью, сохранял и обсуждал.
Руководство по каузальному мышлению
Сходил в отпуск и дочитал ещё одну книжу по одной из любимых мной тем.
Книга Квентина Галлеа — это ещё одна попытка рассказать про современный причинно-следственный анализ без сложных формул и кодинга. Такие материалы, на мой взгляд, важны: они помогают популяризировать тему и постепенно формируют сообщество людей, которые мыслят в каузальной парадигме.
Что примечательного в этой книге?
🟡Будущее принадлежит людям, которые мыслят каузально. Автор утверждает, что наиболее продвинутые организации будут не просто внедрять ИИ-системы для прогнозов, а строить каузальные системы — такие, которые могут объяснять, проверять гипотезы и учиться. ИИ автоматизирует прогнозы. Следующий фронтир — каузальное мышление.
🟡Много примеров из бизнеса и исследований. Книга изобилует примерами из бизнес-среды и прикладных исследований. Больше всего мне понравилась ссылка на исследование применения ИИ в HR-рекрутменте. В нём показано, что более качественная помощь ИИ может негативно повлиять на совместный результат человека и системы: человек начинает слишком сильно полагаться на подсказки и буквально «засыпает за рулём».
Заставляет о многом задуматься, правда?
🟡Автор предлагает простой каузальный фреймворк:
1. Что является контрольной группой или прокси-контрфактом? Определите, какое сравнение проводится, и оцените его качество. 2. Есть ли что-то ещё? Ищите скрытые факторы — конфаундеры или обратную причинность, — которые могут определять наблюдаемый результат. 3. Каково направление смещения? Определите, усиливают ли эти скрытые факторы истинный эффект или, наоборот, ослабляют его. 4. Уточнение и итерация. Усильте анализ, подбирая более качественные сравнения или, при необходимости, выделяя отдельные подгруппы. 5. Можно ли экстраполировать? Оцените, можно ли надёжно перенести полученные выводы на другой контекст или на будущее.🟡Мне понравилось, что в книге вводится понятие ошибки третьего рода: правильный ответ на неправильный вопрос. Это хорошая отсылка к ошибкам первого и второго рода из статистики, но с более управленческим и исследовательским смыслом. Иногда проблема не в том, что мы плохо посчитали. Проблема в том, что мы с самого начала решали не ту задачу. 🟡Ещё узнал, что феномен, при котором метрика становится целью и с этого момента перестаёт быть хорошим показателем, называется законом Гудхарта (Goodhart’s law). Вообще, то, как некоторые метрики создают ритуализованное поведение, — это отдельная и очень интересная для меня, как психолога-наблюдателя, тема. Я бы рекомендовал эту книгу в первую очередь тем, кто хочет лёгкого и быстрого входа в тему каузальности. Из всего, что мне попадалось, это пока самый простой и дружелюбный заход. #книги
+1
HR-аналитика: как превратить управление персоналом на основе данных и генеративного ИИ в бизнес-актив
В книге People Analytics: Using data-driven HR and Gen AI as a business asset Коул Неппер, опираясь на свой опыт и интервью из подкаста Directional Correct, рисует образ будущего HR-аналитики в эпоху ИИ.
Но гораздо интереснее, чем хайповое название, — его философия трансформации функции HR-аналитики. Она мне откликается, потому что наша команда живёт в этой парадигме ещё до появления ИИ.
💰 Суть проста: HR-аналитика должна перестать быть центром затрат и стать центром создания прибыли.
Это больше не пассивная функция по созданию дашбордов. Это функция, без которой менеджмент не может принимать решения. ИИ в этой модели — не замена, а усилитель.
На этом пути Неппер выделяет несколько ключевых шагов:
🟡 Фокус на бизнес-эффекте. Каждая аналитическая инициатива должна отвечать на вопрос: как она создаёт финансовую ценность?
🟡 Gen AI как ускоритель, а не замена. ИИ не заменит HR-аналитику — он устранит неэффективности, которые её сдерживали.
🟡Аналитика как механизм принятия решений. Данные больше не должны быть второстепенными — они должны в реальном времени определять стратегию.
🟡 Решение значимых задач. Вместо создания всё новых отчётов мы должны отвечать на ключевые бизнес-вопросы.
Отдельно интересное наблюдение: рост команд HR-аналитики в прошлом во многом был обусловлен низкими процентными ставками. Эта эпоха закончилась. Теперь важен не размер команды, а её способность создавать измеримый результат. Не уверен, что это полностью применимо к нашему контексту — у нас редко бывают команды по 30–50 человек. Но сама логика понятна: масштабироваться нужно не людьми, а инструментами.
И, пожалуй, главная аксиома из книги, которая стала для меня новым рабочим правилом:
Не стоит браться за проект, пока стейкхолдеры не возьмут на себя обязательство действовать на основе его результатов.И если честно — слишком часто HR-аналитика до сих пор делается ради HR, а не ради бизнеса. #книги
Исследование рынка аналитиков 2025
Вышло свежее исследование рынка аналитиков от NEWHR. Всем рекомендую ознакомиться.
В опросе — 1493 человека из 14 специализаций аналитики
Выделяют 3 сегмента:
🟡дата-, продуктовые, BI- и маркетинговые аналитики
🟡системные и бизнес-аналитики
🟡новое - руководители аналитики
Основные выводы
🟠Зарплаты: растут, но рынок — нет. У большинства специалистов доход растёт, но рынок в целом стагнирует. Рост — это в основном: индексации и внутренние повышения. Это не рост рынка, это перераспределение внутри него
🟠Деньги — главный фактор. Все разговоры про «миссию», «культуру» и «ценности» — вторичны, если не закрыт базовый уровень
🟠Российский и зарубежный рынки расходятся. Рынок становится более замкнутым и локальным.
🟠Поиск работы стал сложнее. Рынок кандидата в целом мертв. Конкуренция растёт, срок поиска: 3–6 месяцев.
🟠Репутация работодателей. Avito — лидер привлекательности, хуже всех — VK и Sber. Yandex за год потерял 18 пунктов и вошёл в антитоп. Моя личная боль😢
🟠ML/AI — уже must-have. AI активно изучают, но: основная работа аналитиков — всё ещё дашборды и ad-hoc
🟠Грейд = не только деньги. Грейд — это уже про жизненную опциональность, а не только зарплату
Очевиден тренд на рост требований к аналитикам и усиливающуюся конкуренцию. Это ставит перед специалистами новые вызовы и в очередной раз подтверждает простую, но неприятную истину: чтобы оставаться на месте, нужно постоянно бежать. И, кажется, скорость этой гонки только растёт.
#исследование
Читаю очередную книжку про People Analytics, расскажу попозже. Пока поделюсь одной картинкой
Я прочитал второе издание Handbook of Regression Modeling in People Analytics
Мой интерес к этой книге был вызван прежде всего новыми главами, посвящёнными байесовской статистике и causal inference. Эти две темы — наряду с вопросами эпистемологии — являются тем, чему я как аналитик уделяю наибольшее внимание в последние несколько лет.
Для своего канала я уже писал ряд статей, где рассматривал байесовскую статистику и causal inference в контексте HR-аналитики. Однако книга Кита МакНалти — пожалуй, первый пример, когда значимая фигура в мире HR-аналитики официально вводит эти современные методы в наше ремесло.
И это меня очень радует! Заодно убеждаюсь, что выбранный мной фокус внимания был верным.
Несколько дней назад также появился записанный мастер-класс Кита
Он посвящён применению байесовской статистики для анализа малых выборок — по сути, это наглядная демонстрация идей из книги. К сожалению, качество записи довольно плохое.
Но мне очень понравился один его небольшой квиз. Я взял из него два варианта ответов и немного переформулировал их — получилось очень ёмкое объяснение различия между классической и байесовской статистикой.
#книги
Влияние ИИ на рынок труда: новый метод измерения и первые данные
Немножко хайповых тем для канала.
Anthropic — те самые создатели Claude — выпустили исследование про влияние ИИ на рынок труда и предложили методологию, которая должна позволить отслеживать этот эффект в динамике.
Ключевые выводы исследования:
🟣Авторы ввели новый показатель риска вытеснения работников искусственным интеллектом — наблюдаемое воздействие/степень подверженности (observed exposure). Он объединяет теоретические возможности LLM и данные о реальном использовании, при этом больший вес придается автоматизации (а не аугментации) и применению в рабочих задачах.
🟣ИИ пока далёк от достижения своего теоретического потенциала: фактический охват задач составляет лишь небольшую долю от того, что в принципе возможно.
🟣Профессии с более высоким уровнем наблюдаемой экспозиции, согласно прогнозам Бюро трудовой статистики США, будут расти медленнее до 2034 года.
🟣Работники в наиболее подверженных воздействию профессиях с большей вероятностью старше, чаще женщины, более образованы и имеют более высокий доход.
🟣Авторы не обнаружили систематического роста безработицы среди работников из наиболее подверженных профессий с конца 2022 года, однако есть некоторые признаки того, что найм молодых работников в этих профессиях замедлился.
Статья в целом интересная и полезная как методологическая рамка для будущих исследований.
Но остаются вопросы.
Во-первых, неизбежно возникает вопрос ангажированности: исследование делает компания, которая сама разрабатывает LLM.
Во-вторых, авторы отдельно обсуждают контрфакты, но, честно говоря, я так и не понял, что именно имеется в виду.
Никакого явного контрфактического сценария в работе нет — есть лишь сравнение профессий с высокой и низкой подверженностью ИИ.
Оставлю на канале оригинальную статью для тех, кому хочется больше деталей.
#LLM
Repost from Антон Воскресенский. AI консалтинг
# Прогнозная модель vs Причинная модель
Работаю с прогнозированием каждый день и регулярно вижу одну и ту же проблему: бизнес просит инструмент для принятия решений, а команда в ответ обучает прогнозную модель. Кажется логичным, но проблема в том, что это разные задачи. Делюсь своим подходом как я ставлю в inDrive экспертизу по casual forecasting
Прогнозная модель отвечает на вопрос «Сколько заказов будет в городе, если тренд сохранится?». Бизнес спрашивает другое: «Что произойдет с поездками, если мы снизим комиссию для водителей на 10%?». Первое — forecasting. Второе — causal inference
## Почему нельзя «просто подставить новую комиссию в модель»
Почему не работает «просто подставить новую комиссию в модель»? Прогнозная модель минимизирует ошибку между историей и предсказанием. Она эксплицитно учится воспроизводить паттерны, а не изолировать влияние объясняющей переменной на целевую. Когда вы меняете комиссию на входе, удерживая остальные признаки, то вы предполагаете, что модель корректно разделила эффекты комиссии, сезонности, промо и конкурентов. Это не так
Классическое ML отлично отвечает на вопрос: «что будет?». Но бизнес почти всегда спрашивает другое: «что сделать, чтобы стало лучше?». И вот тут предиктивные модели упираются в потолок потому что прогноз это про мир «как он есть» а решение — это вмешательство: мы меняем цену, бюджет и пр.
## Проблема эндогенности
Есть и более фундаментальная проблема: эндогенность. Прогнозная модель не отличает «мы снизили комиссию» от «комиссия снизилась потому что на рынок пришел конкурент и демпингует». А для what-if сценариев это критично потому что бизнесу важен причинный эффект, а не корреляция
## Типовой пример
В городе одновременно растут заказы и падает комиссия. Прогнозная модель видит корреляцию и «запоминает»: низкая комиссия = много заказов. Но на самом деле заказы выросли из-за маркетинговой кампании, а комиссию снизили в ответ на вход конкурента. Если вы используете эту модель для решения «давайте снизим комиссию и получим рост заказов» — вы получите неверный ответ
## Что бизнес на самом деле хочет
Бизнес не хочет дашборд с прогнозами. Точнее сказать сначала он хочет дашборд с прогнозами и хорошие метрики на ретроспектиных данных, но по мере развития проекта он начинает хотеть хочет инструмент управления. «Куда направить маркетинговый бюджет?», «Какой канал реально приносит конверсии?»
Это не задачи прогнозирования. Это про causal inference, оценку причинного эффекта и выбор действий
## Как выглядит причинная модель на практике
На практике это выглядит так: модель строится специально под задачу. Например, комиссия -> количество заказов с контролем confounders. Каузальная модель медленнее в разработке, требует экспертизы в дизайне исследования и не дает красивых метрик на тесте. Но именно она отвечает на вопрос, который бизнес на самом деле задает
## Как их использовать вместе
Прогнозная модель хороша для планирования, причинная — для управления. У меня воркфлоу такой: forecasting для операционных задач (планирование), causal inference для стратегических решений (ценообразование, распределение бюджетов и пр.). Для простых задач планирования хватает прогноза. Для решений, где мы что-то меняем, всегда нужна причинная модель
Прогнозы полезны для планирования, но если цель управленческие решения, то бизнесу нужен не прогнозная, а причинная модель
📁 300+ экспертов и каналов, за которыми следят аналитики
В 2025 году мы в NEWHR завершили сбор данных для нашего ежегодного исследования рынка аналитиков. Такие исследования позволяют в динамике наблюдать за тем, как меняется профессия, задачи, зарплаты аналитиков, их амбиции, желанные и нежеланные компании для работы и многое другое.
Сейчас мы обрабатываем результаты, и уже готовы поделиться с вами первыми инсайтами. А именно — рейтингом экспертов отрасли и каналами, которые читают и смотрят наши респонденты-аналитики. Выборка респондентов в этом году — 1493 человека!
🔗 Полный список экспертов-аналитиков
Что вы найдёте на лендинге:
➖ Рейтинги ТОП-15 экспертов и ТОП-30 Telegram-каналов, интересных аналитикам
Они разделены специализациям: отдельно для продуктовых, маркетинговых, дата-, веб- и BI-аналитиков и отдельно для системных и бизнес-аналитиков — потому что предпочтения отличаются.
➖ Полные списки экспертов (100+), Telegram-каналов (130+), подкастов и YouTube-каналов которые аналитики находят интересными
Telegram-каналы для удобства разделены по темам: аналитика, обучение и карьера, BI/UX/Data Viz, Data Engineering и разработка, ML/DS, Product Managment, продуктовая и HR аналитика.
Отдельно мы выделили блок экспертов, которых читаем сами — именно к ним мы обратились за информационной поддержкой. Благодарим всех, кто помог собрать такую выборку 💙Полные результаты исследования мы опубликуем весной, следите за обновлениями!
Repost from People Analytics
📕 Второе издание Handbook of Regression Modeling in People Analytics
Кит МакНалти анонсировал второе издание Handbook of Regression Modeling in People Analytics ("Руководство по регрессионному моделированию в People Analytics"). Первое издание рекомендовал ранее, во втором издании добавлено 5 новых глав, содержит множество улучшений и доработок. Печатная версия второго издания выйдет позже в этом году. А пока можно смело читать онлайн-версию.
#analytics #datascience #statistics #peopleanalytics #R
Statistical Rethinking 2026
Год начался примечательно: после двухлетнего перерыва Ричард МакЭлрит вновь выкладывает свои лекции — теперь в рамках нового курса Statistical Rethinking 2026. В этот раз курс разбит на две секции: начальную (A) и для опытных (B).
Лекции выходят попеременно по секциям, и на текущий момент уже опубликовано по одной лекции в каждой. Формат записи изменился: лекции теперь записываются в аудитории, с включёнными вопросами студентов и без студийной пост-обработки.
Для меня вход в causal inference несколько лет назад начался именно с работ МакЭлрита. Я приходил за байесовской статистикой, а в итоге получил куда более глубокий сдвиг — переосмысление аналитического фреймворка. Моя статья о конфаундинге — по сути, прямое переложение и развитие его идей в прикладном HR-контексте. Поэтому я не перестаю рекомендовать Statistical Rethinking всем, кто интересуется причинно-следственным анализом.
Лично мне сейчас особенно любопытно посмотреть, как изменились лекции за эти два года.
И, как известно, repetitio est mater studiorum.
P.S. Из личных ожиданий на этот год: готовится третье издание книги Statistical Rethinking, а также второе издание Handbook of Regression Modeling in People Analytics от Кита МакНалти — в нём, как заявлено, появится отдельный блок про causal inference!
#causality #байес
Итоги 2025
Я редко делюсь здесь чем-то личным и рабочим, но сейчас момент подходящий.
2025 год для меня стал годом расширения горизонтов. Он начинался с ответственности за HR-аналитику Яндекс.Маркета, летом к этому добавилась Лавка, а ближе к концу года — аналитика по массовому персоналу всего Яндекса.😊
Для меня это новый масштаб задач: вдохновляющий, сложный и требующий большой отдачи и времени. Многое ещё только предстоит осмыслить и выстроить, поэтому в этом году меня было заметно меньше на канале.
Однако своим главным достижением я считаю статью о конфаундинге на Хабре. Если вы ещё не читали — новогодние каникулы подходят для этого идеально. Для меня это будет лучшим подарком на Новый год.😄
В январе 2026 каналу исполнится четыре года. И наступающий год будет первым, в который я захожу без чёткого плана его развития. Но мы остаёмся на связи: мир HR-аналитики по-прежнему захватывающий и увлекательный, и я буду делиться тем, что действительно зацепило, удивило или заставило задуматься.
Хочу сказать спасибо всем, кто прошёл этот непростой и насыщенный событиями год вместе со мной.
Моим близким и родным — за поддержку в сложные моменты, которых в этот раз было действительно много.
Моим руководителям, коллегам и команде — за вовлечённость, доверие и энтузиазм, которые делают работу не просто задачей, а делом, имеющим смысл.
Подписчикам канала — за интерес, внимание и диалог.
Всех с наступающим 2026 годом 🎄
Какие методы анализа персонала являются самыми передовыми? И что нужно, чтобы стать экспертом в HR-аналитике?
Наконец-то я добрался до выпуска подкаста Directionally Correct, где гостем был Людек Стехлик — человек, которого я считаю одной из важных фигур в нашей области.
Я, как известно, крайне скептичен к визионерам, футурологам и прочим «мыслителям», которые рассказывают, как должно быть устроено будущее HR-аналитики — при этом не умея построить элементарную регрессию.
В отличие от них, такие аналитики, как Людек, — мои ролевые модели.
Глубина, методичность, академичность, реальная практика, и — важный нюанс — способность объяснить сложное простыми словами.
И конечно же, Людек – как и я выходец их психологии, который, ко всему, совмещает академический опыт и работу в бизнесе.
🎓К слову, всех причастных с прошедшим 22 ноября Днём психолога!
Людек даёт очень интересный ответ на тему того, почему ему нравится делиться знаниями с окружающими, — и делает это с характерной психологической точностью, вплетая в рассказ многофакторную природу мотивации (психологи поймут) 😄 Часть его мотивов совпадает с тем, почему я веду этот канал.
Не обошлось и без разговора про причинно-следственный анализ и DAG. Людек справедливо замечает, что в психологии традиционно сильны экспериментальные дизайны, в то время как современная причинно-следственная аналитика гораздо лучше развита в эконометрической среде — с богатым инструментарием, строгими методами и сильной статистической культурой.
И нам в HR-аналитике есть, что оттуда заимствовать.
Поделился интересными примерами оценки эффекта (impact evaluation). Например, рассказал про кейс с платформой kudos/bravo и ощущением признания: они анализировали, влияет ли использование платформы на восприятие признания и справедливого вознаграждения.
Интересно, что смотрели не только на сам факт отправки благодарностей, но и на характеристики сообщений — какие из них дают наибольший эффект. Использовали регрессионный контроль, чтобы аккуратно отделить влияние платформы от других факторов.
И много других интересных вещей, поэтому очень рекомендую выпуск всем, кому HR-аналитика интересна всерьёз. А для лёгкого развлечения — там есть отличный момент про то, что американцы и правда плохо знают географию. Кто послушает — поймёт. 🙈😂
#разбор_видео
Ещё раз про стену Будро
Многие, конечно, наслышаны про «стену Будро» — концепцию, впервые появившуюся в книге Investing in People: Financial Impact of Human Resource Initiatives авторов Уэйна Касио и Джона Будро (2010). Признаем: всё ещё актуально.
Любопытно, что в оригинале она выглядела не так, как на картинке, которую я показываю. Этот визуальный вариант — адаптация от AIHR, а в России мы знаем его во многом благодаря популяризации Эдуарда Бабушкина.
Однако интереснее другое. На прошлой неделе я выступал перед HR-стажёрами Яндекса с лекцией по основам HR-аналитики. Фокус моего выступления был на каузальном аспекте современного анализа. И в момент подготовки я понял, что привычное изображение «стены Будро» устарело.
10–15 лет назад считалось, что вершина зрелости аналитики — это предсказания. Сегодня мы живём в эпоху продвинутых ML- и LLM-моделей, которые прогнозируют всё, что угодно — от увольнений до продуктивности. Но вместе с этим пришло понимание, что предсказание ≠ понимание. Поэтому многие уже наигрались с моделями прогнозирования увольнений. Дальше — вопрос «а что теперь?»
Понять, почему что-то происходит, оказалось сложнее и ценнее, чем просто угадать, что произойдёт. Поэтому сегодня настоящая «высшая точка» развития HR-аналитики — не за стеной Будро, а по другую сторону причинности.
Думаю, на знакомом изображении стены Будро по версии AIHR сегодня логичнее разместить причинность после предсказаний — именно там теперь проходит настоящая граница зрелости аналитики.
#causality #размышлизм
👀 Что происходит на рынке аналитиков?
Ты аналитик? Работаешь с данными? Мы запускаем очередное исследование рынка твоей профессии и хотим узнать твоё мнение.
Мы в NEWHR исследуем рынок аналитиков с 2018 года!
Выясняем, как меняется профессия, чего хочет бизнес от аналитиков, чего хотят сами аналитики, сколько стоят аналитики и какими технологиями пользуются.
Вот несколько инсайтов из исследования 2024 года: ➖ Зарплаты в 2024 году продолжали расти (и не зря — значимость хорошей зарплаты резко выросла по сравнению с 2023 годом) Больше половины респондентов признались нам, что деньги для них — на первом месте. В 2023 году так считали всего 25%. ➖ Аналитики стали реже менять работодателей При этом снижение активности по смене работы не повлияло на интерес к собеседованиям — мониторить рынок остаётся стабильной потребностью. ➖ Зарубежные компании уже не так привлекательны для аналитиков из России Это слом тренда 2022−2023 годов. Наши респонденты стали больше ориентироваться на рынок, который ближе к ним: в России — на российский, за рубежом — на зарубежный. ➖ 🤍 Авито — самая привлекательная компания-работодатель для аналитиков На втором месте — ❤️ Яндекс, на третьем — ✈️ Авиасейлс.Что поменялось за год? Помоги нам узнать, поучаствовав в новом исследовании! Опрос займёт около 20 минут. Участники получат ранний доступ к результатам и приглашение на закрытый эфир с инсайтами исследования. 🔤Пройти опрос🔤 Если ты хочешь «копнуть глубже» — вот результаты наших прошлых исследований: 2019, 2020, 2022, 2023, 2024. *️⃣ В первых исследованиях мы больше фокусировались на продуктовых и дата-аналитиках, но теперь, по многочисленным просьбам, мы адаптировали вопросы также для руководителей аналитики, системных и бизнес-аналитиков. P. S. Пожалуйста, поделись ссылкой на опрос с коллегами-аналитиками! Чем больше участников, тем точнее и интереснее результаты 💙
Шкала достоверности данных
Читаю Sex by Numbers Дэвида Шпигельхалтера. Книга напрямую не связана с HR-аналитикой — как понятно из названия. Однако, как вы, наверное, уже заметили, я люблю собирать методы из разных областей и применять их к нашему предмету.
В начале книги автор предлагает шкалу достоверности чисел, которая, на мой взгляд, заслуживает того, чтобы войти в инструментарий каждого аналитика. Она проста, и в то же время отлично показывает, насколько по-разному могут звучать цифры — в зависимости от их происхождения и основания.
🟠🟠 (numbers that we can believe) — числа, которым можно доверять.
Пример: фактический уровень текучести X%, рассчитанный на основе данных кадровых систем.
🟠🟠 (numbers that are reasonably accurate) — числа, которые достаточно точны.
Пример: оценка удовлетворённости сотрудников на основе опроса с репрезентативностью X%.
🟠🟠 (numbers that could be out by quite a long way) — числа, которые могут существенно отличаться от реальности.
Пример: оценка эффективности обучения, основанная на самоотчётах участников.
🟠🟠 (numbers that are unreliable) — ненадёжные числа.
Пример: X% сотрудников не читают корпоративную рассылку — без измерения.
🟠🟠 (numbers that have just been made up) — просто выдуманные числа.
Пример: сотрудники на удалёнке менее эффективны, чем офисные, на X% — на основе субъективных мнений руководителей.
Эта шкала — напоминание о том, что цифра не равна факту. Даже в аналитике цифры живут на разных уровнях уверенности: от твёрдых данных до риторических украшений и мнений людей.
#книги
Каузальный взгляд на парадоксы
Аналитики не понаслышке знакомы с парадоксами Монти Холла и Симпсона. Эти задачи регулярно звучат на собеседованиях — кандидатов просят объяснить их суть (я не исключение). Но пишу я не для того, чтобы в сотый раз пересказывать суть проблем и известные решения.
Читая The Book of Why Джуду Перла, я заново открыл для себя эти парадоксы — но уже через призму каузального анализа. Именно эта перспектива позволяет увидеть за привычными задачами глубинные механизмы и избавиться от кажущейся «магии».
🎲Парадокс Монти Холла
Представьте игровое шоу: за одной из трёх дверей стоит машина, за двумя другими — козы. Вы выбираете дверь №1. Ведущий, который знает, где машина, открывает дверь №3 с козой и предлагает вам переключиться на дверь №2. Стоит ли менять выбор?
Формально ответ таков: если остаться при своём выборе, шанс на выигрыш — 1/3, если сменить дверь — 2/3. И, если вас это смущает, не переживайте: когда Мэрилин вос Савант опубликовала этот ответ, с ней спорили даже учёные, математики и статистики с PhD.
Каузальный анализ даёт ключ к пониманию. Переменная «открытая дверь» — это коллайдер.
Как только ведущий открывает дверь с козой, все вероятности становятся обусловлены этим событием. Оно создаёт зависимость между выбором игрока и расположением машины, хотя изначально они были независимы. В результате вероятность смещается: остаётся 1/3 за вашей дверью и 2/3 — за другой закрытой.
Перл подчёркивает: если бы ведущий открывал дверь случайно, коллайдера не возникло бы — и тогда вероятность действительно была бы 1/2 для двух оставшихся дверей. Но в классическом шоу правила другие: ведущий всегда показывает козу.
📊 Парадокс Симпсона
Парадокс Симпсона — это ситуация, когда наблюдаемый тренд меняется на противоположный при разбиении данных на группы.
Классический пример, который описал Эдвард Симпсон в 1952 году: лекарство от сердечных приступов. В среднем оно полезно, но, если разделить пациентов по полу, окажется, что и для мужчин, и для женщин оно вредно.
Перл показывает, что за этим парадоксом могут скрываться разные каузальные структуры:
🟣Конфаундер (вилка, общая причина). В примере с лекарством общий фактор — пол. Если учесть его (стратифицировать данные), парадокс исчезает.
🟣Медиатор (труба). Если же переменная лежит на пути влияния (X → M → Y), ситуация трактуется иначе, и корректировка может исказить вывод.
Один и тот же статистический феномен может быть вызван: либо конфаундером, тогда контроль помогает, либо медиатором, тогда контроль вредит. И именно каузальное мышление позволяет отличить одно от другого.
#книги #causality
متاح الآن! بحث تيليغرام 2025 — أهم رؤى العام 
