fa
Feedback
Канал влияния

Канал влияния

رفتن به کانال در Telegram

Канал Анны Ставнийчук (к.э.н., н.с. ЭФ МГУ) и Ольги Марковой (к.э.н., с.н.с. ЭФ МГУ)* об оценке эффектов, поведенческой экономике и антитрасте с юмором и полезными материалами causal.channel@gmail.com *Мнение авторов не является позицией ЭФ МГУ

نمایش بیشتر
1 301
مشترکین
اطلاعاتی وجود ندارد24 ساعت
+127 روز
+3130 روز
آرشیو پست ها
👨‍⚖️ Я на тебя промпт напишу! Как ИИ изменил самопредставительство в судах Свежая статья Ананд Ша и Джошуа Леви показывает (
👨‍⚖️ Я на тебя промпт напишу! Как ИИ изменил самопредставительство в судах Свежая статья Ананд Ша и Джошуа Леви показывает (Shah, Levy, 2026): после появления мощных LLM доля дел, где люди выступают без адвокатов (pro se), резко выросла. Около 20 лет она была стабильна на уровне ~11%, а к 2025 году поднялась до 16,8%. В абсолютных числах pro se дел почти вдвое больше, при том что число дел с адвокатами почти не меняется – в систему заходят новые люди, которые раньше до суда просто не доходили ⏯ Откуда данные? • Авторы собрали около 4,6 млн гражданских дел в федеральных судах США за 2005–2026 годы • Добавили ~46 млн записей из судебных картотек, чтобы видеть, что происходит внутри дела – сколько ходатайств, приказов, ответов и т.д. • Взяли выборку реальных исковых заявлений и прогнали их через детектор генеративного текста, чтобы напрямую поймать использование ИИ ⏯ Что считали? Авторы признают, что доступ к LLM появился почти у всех сразу, «чистой» контрольной группы без ИИ не осталось. Вместо этого они: • опираются на длинный стабильный до‑ИИ период: доля pro se около 11% почти не меняется десятилетиями и не реагирует на кризисы и политические волны; на этом фоне резкий сдвиг после 2022 года выглядит как структурный разрыв, а не продолжение тренда • сравнивают «простые» и «сложные» типы дел: там, где pro se были распространены ещё до ИИ (споры о нарушении гражданских прав, дела из потребительского кредитования, споры об обращении взыскания на предмет ипотеки), генеративный ИИ должен давать максимальный эффект — и именно в этих категориях доля pro se после 2022 года и растёт, тогда как в сложных (патенты, ценные бумаги и т.п.) почти не двигается • проверяют наличие ИИ‑текста в реальных документах: до 2022 года детектор почти ничего не находит, к 2026‑му видит признаки генеративного текста примерно в каждом пятом иске ⏯ Что нашли? • Рост почти полностью идёт за счёт истцов и сосредоточен в «простых» делах, где главный барьер — написать понятный и формально корректный иск, а не вести длинный сложный процесс • Географически эффект почти повсеместный: в большинстве штатов число pro se‑дел уже превысило свои исторические максимумы. • Длительность дел почти не меняется: доля дел, закрывающихся за 6 месяцев, до и после ИИ примерно одинакова. Зато внутри дел работы стало больше: число записей в картотеке за первые 180 дней по pro se‑делам выросло примерно на 30–40%, суммарная нагрузка на суд — в полтора–два раза В совокупности это довольно убедительно указывает на генеративный ИИ: он реально расширяет доступ к правосудию для тех, кто не может оплатить юриста, но одновременно ощутимо увеличивает текстовую нагрузку на суды. И будет интересно наблюдать за тем, как суды и законодатели будут отвечать на это #канал_обозревает @causal_channel

🪄 ЛевиОса, а не левиосА Лето высвободило немного времени, и мы решили написать несколько постов о типичных эмпирических забл
🪄 ЛевиОса, а не левиосА Лето высвободило немного времени, и мы решили написать несколько постов о типичных эмпирических заблуждениях – открываем рубрику #канал_развенчивает_мифы Начинаем с теста Грейнджера: что он на самом деле измеряет, чего не измеряет и почему это важно 💡 Откуда взялся тест? Идея принадлежит не Грейнджеру. Математик Норберт Винер первым сформулировал принцип: переменную можно назвать «каузальной», если включение её истории улучшает прогноз другой (Wiener, 1956). В 1969 году Клайв Грейнджер операционализировал это в рамках линейных авторегрессионных моделей (Granger, 1969): если прошлые значения X улучшают прогноз Y сверх того, что даёт история самого Y, то X «является причиной» Y. Формально это F-тест в VAR-модели Занятно, что в 1974 году сам Грейнджер показал, что регрессия нестационарных рядов порождает значимые коэффициенты там, где их нет (Granger, Newbold, 1974), то есть подсветил наивное применение своего же теста. А в нобелевской лекции сказал: «Of course, many ridiculous papers appeared». Нобелевскую премию он получил, кстати, не за тест причинности, а за анализ в условиях коинтеграции 🪜 Снова о лестнице причинности Ранее мы писали [см. пост], что Джудеа Перл разграничил три типа утверждений (Pearl, 2000): 1) Взаимосвязь: «X связан с Y?» 2) Воздействие: «Что произойдёт, если сделать X?» 3) Контрфакт: «Что было бы, если бы X было другим?» Тест Грейнджера относится к уровню 1. Вопрос «влияет ли X на Y?» – это уровни 2 и 3. Этот переход требует структурных предположений, которые данные сами по себе не дают 🙅‍♂️ Когда тест не говорит о причинности?
Иногда в ответ на вопрос об эндогенности в модели можно услышать: «мы применили тест Грейнджера и обратной причинности не обнаружили». Это существенное заблуждение! Тест проверяет, улучшают ли лаги Y прогноз X и ничего больше. Он не тестирует эндогенность в смысле корреляции регрессора с ошибкой, не контролирует одновременность и не заменяет инструментальные переменные. Отклонение нулевой гипотезы о нулевых коэффициентах при лагах – это не то же самое, что отсутствие обратной причинности в структурном смысле (Maziarz, 2015)
Перечислим остальные проблемы: • Конфаундеры. Если Z влияет и на X, и на Y, тест зафиксирует X→Y при отсутствии прямой связи. Шоуджи и Фокс (Shojaie, Fox, 2022) показали численно: один параметр модели меняет направление «причинности» при неизменных данных • Нестационарность. Два независимых случайных блуждания дают значимый F-тест – это свойство метода, а не сигнал о реальной связи (Granger, Newbold, 1974) • Нелинейность. Линейная модель не видит нелинейные механизмы и может инвертировать направление (Liu et al., 2018) • Рациональные ожидания. Если фирмы сегодня реагируют на ожидаемую инфляцию завтра, тест покажет «инфляция влияет на инвестиции» – хотя направление обратное. Будущая переменная попадает в информационное множество настоящего, нарушая ключевое допущение о том, что причина предшествует следствию (Maziarz, 2015) • Чувствительность к лагу. Разные критерии выбора порядка VAR (AIC, BIC, HQIC) нередко приводят к противоположным выводам на одних и тех же данных (Maziarz, 2015) 👍 Когда тест использовать можно? • Разведовательный инструмент – описать информационные потоки и сформулировать гипотезы о механизме • При наличии теории: Уайт и Лу (White, Lu, 2010) показали, что причинность по Грейнджеру совпадает со структурной при одновременном выполнении трёх условий: нет латентных конфаундеров, модель верно специфицирована, лаг выбран корректно. Все три требуют предварительного теоретического обоснования • Для описания функциональной связности (functional connectivity) – именно так тест используется в нейронауках и финансах: не как доказательство причинности, а как описание того, как информация распространяется между переменными (Shojaie, Fox, 2022) Как всегда скажем, что нет плохих инструментов – важно то, уместно ли они используются. Для ответа на вопрос «влияет ли X на Y?» нужны другие инструменты, позволяющие идентифицировать причинно-следственные связи #канал_развенчивает_мифы #канал_обозревает @causal_channel

📢 Вебинар AMLEDS Сегодня вечером пройдёт вебинар, который стоит посетить! Спикер: Скотт Каннингем (Baylor University) Тема:
📢 Вебинар AMLEDS Сегодня вечером пройдёт вебинар, который стоит посетить! Спикер: Скотт Каннингем (Baylor University) Тема: "AI-агенты для исследователей: инструменты, применение и открытые вопросы" Скотт Каннингем – настоящая рок-звезда современной эконометрики. Автор одного из первых и любимого многими учебника по причинно-следственному выводу "Causal Inference: The Mixtape" (мы с нетерпением ждём грядущего переиздания The Remix 🎶). Автор подкаста с ведущими учёными, стример, организатор классных воркшопов и человек, который сделал очень много для популяризации эконометрики В последнее время он активно экспериментировал с AI-инструментами в научной работе – и похоже, накопленный опыт вырос в отдельный полноценный воркшоп 🗓 26 июня 2026 года 🕒 18:00 Мск 🎙 Формат: Zoom-вебинар (онлайн, бесплатно) 📝 Регистрация по ссылке #канал_зовёт @causal_channel

📚 Чему учат в университете – и имеет ли это значение? Многие об этом любят рассуждать, но ответить на него эмпирически очень
📚 Чему учат в университете – и имеет ли это значение? Многие об этом любят рассуждать, но ответить на него эмпирически очень сложно: стандартные административные данные не содержат информации о содержании курсов. В новой работе Барбара Биази и Сун Ма (Biasi, Ma, 2026) решают эту проблему с нуля 🗂 Что сделали авторы? • Собрали 459 410 силлабусов (программ курсов) семи крупных университетов Техаса и сопоставили их с корпусом из 107 млн академических публикаций (OpenAlex) • Для каждого курса построили меру близости к переднему краю науки (frontier knowledge proximity) – насколько содержание курса текстуально похоже на недавние научные работы относительно старых Если курс оперирует концепциями, которые только-только появились в литературе – proximity высокая. Если те же концепции давно стали стандартом учебников – низкая. Граница между «новым» и «старым» задаётся отдельно для каждой дисциплины, исходя из лагов цитирования в этой области 👨‍🏫 Вариация огромная, и она определяется преподавателем • Переход от 25-го к 75-му перцентилю proximity эквивалентен замене ~30% содержания курса на более свежий материал • При этом декомпозиция Шепли-Оуэна показывает: различия между университетами объясняют лишь 0,3% этой вариации, между дисциплинами – 5% • Основной вклад вносят конкретный курс (26%) и конкретный преподаватель (21%) • Два студента одного факультета одного вуза могут получить принципиально разное образование – в зависимости от того, к кому они попали 🪄 Идентификация • Очевидная проблема – эндогенный выбор: более способные и мотивированные студенты могут сами выбирать «передовые» курсы • Авторы решают её, используя институциональную особенность техасских университетов: при записи на курс студент видит только силлабус прошлого семестра, но не обновлённый. Значит, изменения proximity между семестрами – условно экзогенны с точки зрения студента • Контролируя на лаги proximity, фиксированные эффекты преподавателей и пересечения «университет × специальность × когорта», авторы идентифицируют эффект воздействия (ITT) frontier knowledge на исходы студентов • Плацебо-тест (замена реализованной proximity на proximity того же курса 2 года спустя) даёт нулевые коэффициенты – в поддержку условной экзогенности 🎓 Результаты Одно стандартное отклонение в frontier proximity (~замена 27% содержания курсов на более свежее) улучшает все измеренные образовательные исходы: • вероятность получить диплом ↑ на 1,7% • время до диплома ↓ на 0,4 года • вероятность поступить в аспирантуру ↑ на 16% • заработок через 1–6 лет после выпуска ↑ на 2,8% (для аспирантов – 5,3%) Причём эффект особенно силён в первый год обучения, что указывает на механизм мотивации и усилий, а не просто накопления знаний 💰 Неравенство и механизм Эффекты асимметричны [см. рисунок]: • Студенты из семей с низким доходом (нижний квартиль, <$40 тыс/год) выигрывают прежде всего от завершения учёбы (+2,1 п.п. к completion против +1,2 п.п. у верхнего квартиля), но не показывают значимого прироста в поступлении в аспирантуру • У студентов из обеспеченных семей (>$90 тыс/год) – наоборот: скромный прирост в completion, зато +4,8 п.п. к вероятности пойти в аспирантуру Медиационный анализ объясняет, почему: • Для студентов из малообеспеченных семей контроль на образовательные исходы (диплом, GPA, время до степени, аспирантура) убирает почти весь эффект на заработки • Для студентов из обеспеченных семей значимая премия к заработку сохраняется после контроля – что указывает на прямой возврат к приобретённым навыкам сверх того, что даёт диплом (Becker, 1964; Spence, 1973; Arteaga, 2018) Исследование показывает, что ключ к высоким результатам не в строительстве новых корпусов и не в реформировании учебных программ, а в том, кто стоит у доски. Поддержка научно активных преподавателей способна дать отдачу, сопоставимую с куда более дорогостоящими вмешательствами. Инвестиции в исследования при этом генерируют двойную отдачу: новые знания и более актуальное обучение через тех, кто эти знания производит #канал_обозревает @causal_channel

🧠 The Causal Summit 2026 Уже сегодня вечером пройдет бесплатный онлайн-саммит по Causal Inference и Causal AI. Ведущие иссле
🧠 The Causal Summit 2026 Уже сегодня вечером пройдет бесплатный онлайн-саммит по Causal Inference и Causal AI. Ведущие исследователи и практики со всего мира расскажут о новинках и своем опыте в причинном выводе Модерирует Quentin Gallea – автор The Causal Mindset Handbook, обучил 15 000+ специалистов, проводил воркшопы для Google и других крупнейших компаний В программе 5 треков: 1️⃣Введение – почему предсказание и причинность — это не одно и то же, и как совмещать оба подхода. Примеры из Spotify, Amazon, Netflix 2️⃣Причинный вывод на практике – как это работает в реальном бизнесе и что мешает внедрению • Robson Tigre (Recast) – causal inference в финтехе, e-commerce, маркетинге и крипте: как избежать неоправданных допущений, и получить интерпретируемые результаты, заслуживающие доверия • Jamilla Cooiman (CausAI) – технические и организационные барьеры внедрения, и как компании делают первые шаги в сфере применения причинного анализа 3️⃣Causal Discovery в бизнесе – не только тестировать гипотезы, но и находить их • Paul Hünermund (TUM) – как как последние достижения в области causal discovery помогают понять, что вообще стоит тестировать, прежде чем запускать A/B тест • Martin Huber (Fribourg) – нетехническое введение в то, как извлекать причинно-следственные связи из данных без экспериментов 4️⃣Новые подходы в Causal ML – когда предсказания недостаточно • Philipp Bach (FU Berlin) – Double Machine Learning: от базовых идей до современных разработок с реальными бизнес-примерами • Matheus Facure (Nubank) – почему модель вероятности оплаты долга бесполезна без uplift; на примере реального кейса взыскания долгов показано, что в отличие от ML переход к причинно-следственной uplift модели дает ответ на вопрос о том, на что именно направить усилия для достижения наибольшего эффекта 5️⃣Causal AI и LLMs — что языковые модели уже умеют в причинном анализе, а что – нет • Carlos Trujillo (Wise) – байесовский фреймворк для оценки LLM-агентов: каким задачам можно доверять, а каким — нет • Nick Huntington-Klein (Seattle U.) – эксперимент с реальными данными: LLM пока плохо справляются с идентификацией конфаундеров и дают несогласованные результаты 🗓 23 июня, 18:00-21:00 Мск 🎟 Онлайн, регистрация: causalsummit.com #канал_зовёт @causal_channel

😮 Начни с себя Часто, когда говорят об обучении этичности, представялют себе специальные уроки про честность или формальные
😮 Начни с себя Часто, когда говорят об обучении этичности, представялют себе специальные уроки про честность или формальные беседы о правилах. Но на самом деле мы учимся честности или этичности не на занятиях и не благодаря плакатам, а в те моменты, когда учитель своим примером показывает, что ты можешь делать с правилами: строго соблюдать, обойти или подогнать под ситуацию
Представьте: учитель завышает вам годовую оценку по математике, чтобы вы точно прошли порог для поступления. Это подарок. Вопрос: вы после этого будете честнее на выпускном экзамене или, наоборот, почувствуете, что "правила — это лишь условность"?
В новой статье Виктор Леви и Мозес Шайо на результатах израильских экзаменов Bagrut демонстрируют, как разделить эти мотивы (Lavy, Shayo, 2026) Как устроены школьные выпускные экзамены в Израиле? В израиле аналог нашего ЕГЭ – это выпускные экзамены Bagrut, где по каждому предмету ученик получает внутреннюю школьную оценку (которую ставит учитель) и внешнюю национальную. Итоговый балл школьника обычно считается как их среднее Министерство образования отслеживает средние разрывы между этими двумя оценками по школе и предмету, классифицируя крупные завышения или занижения как нарушения Авторы исследуют то, как нечестность учителей влияет на склонность учеников списывать: они смотрят отличия в списывании для учеников этичных и неэтичных учителей (измеренного по данным предшествующих лет), контролируя на характеристики ученика, школы и года, ряд характеристик сообщества и прошлые санкции Имитировать или отплатить? Авторы предлагают разложить реакцию учеников на два механизма: 1️⃣Имитирование: если учитель нарушает правила (завышает или занижает оценки), ученик делает вывод, что правила гибкие и их можно обходить 2️⃣Взаимность: если нарушение приносит пользу, возникает благодарность – и ученик меньше списывает. Если же учитель занижает баллы, появляется обида — и ученик может решить нарушить правила в ущерб школе Когда учитель занижает оценку, все действительно прямолинейно: ученик чувствует несправедливость и одновременно видит, что взрослый нарушает нормы => расте вероятность списывания на внешнем экзамене (см. красные столбики на рисунке) При завышении ситуация двоякая, и это ключевой результат статьи: 🔵В больших, социально гетерогенных школах, где ученики живут в разных районах и слабо связаны друг с другом: ▫️Учитель завышает оценки => ученики видят, что правила можно обойти "во имя добра" ▫️Здесь побеждает "имитация" ▫️В итоге мы видим более высокую вероятность того, что такой ученик будет уличен в списывании на внешнем экзамене То есть завышение оценок учителем обучает неэтичности: ребенок усваивает, что честность – это опция, а не норма 🔵В однородных, тесных сообществах завышения оценок воспринимаются иначе: ▫️"Учитель нас выручил, дал шанс на поступление" ▫️Здесь включается позитивная взаимность: ученики не хотят подставлять "своего" учителя и школу, меньше списывают, чтобы не спровоцировать санкции ▫️В итоге мы видим снижение вероятности дисквалификации за списывание среди тех, для кого "подтянули" оценки В таком контексте завышение оценок укореняет норму: своих берегут, даже когда правила нарушаются Так это же только те, которых поймали! И да, и нет: с одной стороны, это нижняя граница оценки эффекта С другой стороны, они используют: 🔵фиксированные эффекты ученика (один и тот же ученик подвержен примерно одной и той же "ловимости") 🔵фиксированные эффекты школы и года (разная строгость мониторинга на уровне школ/лет вычитается) 🔵"этичность" учителей берется с лагом: завышения/занижения в t–1 вряд ли связаны с тем, поймали ли конкретного ученика в период t Нам кажется, в вопросах этики надо начинать с себя. И это не абстрактное "быть хорошим человеком", а очень конкретные решения: завысить ли оценку, закрыть ли глаза на мелкое нарушение, обойти ли формальность "во имя добра". Каждый из нас своими действиями создаёт нормы. Пусть это будут такие нормы, в которых нам самим не стыдно жить #канал_обозревает @causal_channel

Пока наши студенты защищают выпускные работы, а мы с интересом следим за их защитами 👋, решили поделиться с вами свеженькими полезными находками Питер Халл обновил свои материалы по эконометрике на странице Metrics Notes теперь лежат свежие слайды бакалаврского и магистерского курсов за весну 2026 года с расширенными материалами и исправленными неточностями и опечатками прошлых версий Там же собраны другие полезные материалы его авторства: ускоренный курс по design-based эконометрике, а также заметки про effective populations, propensity score, residualized regressions, instrumented DiD, shift‑share IV и weak IV – по сути, полноценный toolbox для современных исследований #канал_обозревает #канал_рекомендует @causal_channel

Программа_КС_бизнес_власть_22_мая_26.pdf6.43 KB

IV Круглый стол "Практики эффективного диалога бизнеса и власти" посвящен доказательному подходу в ОРВ. Место проведения: УрГЭУ (Екатеринбург) с онлайн подключением Время: 13.00 Мск (15.00 Екб) ❗️Обращаем внимание на изменение времени начала   Ключевые направления дискуссии:  Когда нужно регулировать — Елена Артюх (Уполномоченный по защите прав предпринимателей в СО) и Какое регулирование считать эффективным - Владимир Чураков (Мосстратегия)  Доказательный подход и «Голос рынка» — Георгий Богатырев (Банк России)   Мнение бизнеса — Михаил Андронов («Аскорт», Москва) и Барзыкина Галина (Курская область)   Региональный опыт — новые инструменты: представители органов власти Москвы, Чувашии, Владимирской и Свердловской областей  Научный взгляд — эксперты МГУ (Ольга Маркова, Анна Ставнийчук) и руководитель ЦРК Ирина Рахмеева (УрГЭУ) 📋 Программа круглого стола и приглашение на субъекты РФ👇 Кому нужно именное приглашение - пишите в чат Центра Ссылка для регистрации #новостиОРВ #обсудим

📌 В пятницу на круглом столе у нас ответственная миссия — будем обсуждать как научные аргументы и доказательный подход могут помочь выстраивать диалог между бизнесом и властью

Разыгрываем один билет на AHA'26! Как и обещали, возвращаемся с подробностями розыгрыша 🎟 Мы уже успели заглянуть на онлайн-часть AHA'26 и нам понравилось - классные спикеры рассказывают о том, с чем сталкиваются в работе и как это решают: 🔸Ксения Бокша (VK) рассказала, что для объединения множества сервисов в единую Data Platform нужен свой "технодесант" - ребята, которые могут прийти и на "собственной тяге" переписать все, что угодно 🔸Кирилл Ли (Купер.Тех) поделился тем, как они управляют запасами и создают положительный опыт пользователей через работу с заменой/отменой позиций при заказе. Для того, чтобы посчитать эффект от их новой модели, они перешли к within subject оценкам (мы давно планируем рассказать об особенностях таких экспериментов - ждите в новых постах) 🔸Надежда Белякова (Яндекс.Такси) рассказала, что алгоритм параллельной рассылки предложений водителям (multi-offer dispatch) в 2 раза сократил время на вызов такси И теперь к главному 👇
Как и обещали, сегодня мы хотим разыграть 1 билет на AHA'26 - конференцию о продуктовой аналитике, AI и масштабировании цифровых продуктов Чтобы участвовать, до 23:59 17 мая напишите в комментариях: 1️⃣на какой доклад вы хотите попасть 2️⃣коротко почему именно на него Можно в духе: «Хочу на доклад про ..., потому что мне не дает покоя вопрос...» Победителя выберем случайным образом 18 мая ❗️Важно: 🔵мы проводим розыгрыш только среди подписчиков канала 🔵одного комментария достаточно (дублирующие комментарии мы увы не сможем учесть)
Удачи и до встречи на AHA'26! #канал_зовёт @causal_channel

Наша секция на Конференции по вычислительным социальным наукам в ЕУ 14–16 мая в Европейском пройдет Конференция по вычислительным социальным наукам. Мы организовали двухдневную секцию, посвященную вычислительным методам в изучении права, — приходите или подключайтесь к трансляции. Для обоих форматов участия необходима регистрация. Вот что будет: 14 мая, четверг 14:15 — 16:40, ауд. 429 ▪️Влияние ИИ на российский LegalTech: индивидуальный и индустриальный уровень, Якуненко Екатерина Сергеевна, Яндекс, автор телеграм-канала Делай RAG ▪️ИИ-агент для задач правовой экспертизы и регуляторной политики, Рахмеева Ирина Игоревна, УрГЭУ ▪️Суды окружного уровня влияют на размещение юридических фирм, Сёмин Павел Олегович, ПГНИУ ▪️Правонарушения акционеров и директоров как беловоротничковое преступление, Леденев Виктор Владимирович, ЕУ СПб 15 мая, пятница 12:15 — 17:45, ауд. 429 ▪️Платформа Телеграм в современных социальных исследованиях: база данных и примеры применения, Седашов Евгений Александрович, НИУ ВШЭ ▪️Когда диплом не спасает: нелинейные эффекты образования в российском правосудии (на примере ст. 264 УК РФ), Жучкова Светлана Васильевна, Янкевич Семён Васильевич, НИУ ВШЭ ▪️Профессиональный бэкграунд судей как экстралегальный фактор вынесения судебных решений, Капустина Лика Владимировна, НИУ ВШЭ ▪️Влияние антимонопольного правоприменения на вход новых компаний в России, Зварич Андрей Александрович, Ставнийчук Анна Юрьевна, Маркова Ольга Анатольевна, МГУ им. М.В. Ломоносова ▪️Цена преступности, Скугаревский Дмитрий Анатольевич, ЕУ СПб Программа конференции обширная, там еще много чего интересного: шесть других секций, мастер-классы, открытые лекции, — полный список вот здесь.

Пока мы в пути на классную конференцию в Питере, хотим вам рассказать, что к ней можно подключиться онлайн и послушать интересные доклады. Речь, конечно же, не только о наших 😄 – мы сами присмотрели несколько секций в разные дни, выбор действительно очень широкий

Мы стараемся по мере возможностей отвечать в комментариях – не всегда успеваем, но стараемся. Если вам кажется, что есть что-то интересное, о чём стоит рассказать, присылайте в комментарии или в личные сообщения канала – если будут классные идеи, обсудим в следующих постах #канал_отвечает #канал_обозревает @causal_channel

В комментариях к прошлому посту задали вопрос: что значит «отдельно оценить эффект на P(Y>0) и на Y среди «участников» и помогает ли тут Тобит. Вопрос действительно хороший, и мы решили даже написать вторую часть поста Напомним, мы обсуждали, что делать с нулевыми наблюдениями при логарифмировании и как в этом месте возникает проблема разделения эффектов для перехода от Y(0)=0 к Y(1)>0 (экстенсивная маржа) и для участников (интенсивная маржа) - что здесь можно использовать? 🔠 Две независимые регрессии Самая простая и интуитивная идея, которая приходит в голову, это разделить задачу на две независимые части. Сначала оценить регрессию на бинарный исход «участвует – не участвует», затем на вторую на непрерывном исходе, состоящем из ненулевых значений 1) экстенсивная маржа: эффект тритмента на индикатор 1{Y>0} – обычный probit, logit или даже МНК 2) интенсивная маржа: эффект тритмента на Y в подвыборке тех, у кого Y>0. И вот тут подвох. Подвыборка участников выбирается после тритмента, и её состав сам зависит от T. Поэтому простое сравнение средних среди T=1, Y>0 и T=0, Y>0 – это уже не причинный эффект, а смесь интенсивности и эффекта состава. Классический пост-тритмент отбор 🔠 Lee bounds Поскольку среди T=1, Y>0 смешиваются switchers и always-takers, Lee (2009) предложил обрезать switchers. Оставшиеся наблюдения показывают эффект для always-takers – людей, которые участвовали бы при любом тритменте и для которых интенсивный эффект уже причинно интерпретируем Плюс: причинная оценка без жёстких параметрических допущений Минус: интервальная оценка, а не точечная Допущение: монотонность отбора (тритмент никого не «выключает» из участия) 🔠 Two-part / hurdle Если хочется не интервал, а точку для оценки интенсивной маржи, то стандартный приём – two-part модель (Cragg, 1971; Mullahy, 1998) Идея: средний Y можно разложить на (1) произведение вероятности «участвовать» и (2) среднего среди «участников». Оцениваем обе части отдельно: (1) probit на всей выборке для вероятности и (2) обобщённая линейная модель с гамма-распределением и логарифмической функцией связи на подвыборке участников для среднего. Затем перемножаем предсказания и усредняем разность между «как было бы при T=1» и «как было бы при T=0» Важно: коэффициенты второй регрессии не нужно интерпретировать как причинный эффект для интенсивной маржи. Они выступают лишь полуфабрикатом для предсказания. Именно поэтому пост-тритмент отбор не превращается в bad control Минус – стандартное selection-on-observables: всё держится на правильной спецификации обеих моделей и отсутствии ненаблюдаемых конфаундеров 🔠 Heckman / Tobit II Если опасаетесь, что есть ненаблюдаемая переменная, которая одновременно влияет и на «участие», и на уровень Y среди «участников», two-part её не поймает. Здесь выручает модель отбора Хекмана (Heckman, 1979): отдельное уравнение участия, отдельное уравнение исхода, и явная коррекция на корреляцию ошибок между ними Минус – нужна exclusion restriction: переменная, которая влияет на участие, но не на сам Y. И оценки чувствительны к предположению о нормальности ошибок 🔠 Tobit I Tobin (1958) моделирует цензурирование, а не «не участие». Предполагается, что есть скрытое значение, которое могло бы быть отрицательным, но Y обрезается до нуля. Классический пример – желаемое пожертвование -50, фактически 0 Если ноль действительно «латентное значение, обрезанное снизу», Tobit подходит, и формулы McDonald & Moffitt (1980) дают красивое разложение на экстенсивный и интенсивный вклад Минус: в Тобите один и тот же параметр управляет обеими маржами, плюс модель чувствительна к нормальности и гомоскедастичности. Если нули – это «не участвует», а не цензурирование, Tobit объединяет две маржи в один параметр и почти всегда уступает two-part. Подробное обсуждение – у Wooldridge (2010) 🔠 Poisson PML База, которую предлагают Chen & Roth для оценки процентного эффекта (Gourieroux, Monfort, Trognon, 1984; Silva, Tenreyro, 2006)

Встретимся на АНА’26? Мы знаем, что нас читают и люди из академии, и аналитики из самых разных компаний. Сегодня у нас анонс,
Встретимся на АНА’26? Мы знаем, что нас читают и люди из академии, и аналитики из самых разных компаний. Сегодня у нас анонс, который будет полезен и понравится всем! 22 мая в Москве пройдет АНА’26 – конференция о продуктовой аналитике, AI и масштабировании цифровых продуктов. В программе полный цикл data/AI‑разработки: от MLOps и внедрения LLM до архитектуры AI‑систем, экономики масштабирования решений и, конечно, много интересного про эксперименты Мы были на АНА в прошлом году и получили большое удовольствие от докладов про A/B‑тесты! В этом году для подписчиков канала особенно рекомендуем два трека: • Методы системного снижения стоимости проверки гипотез – про подходы, которые позволяют чаще запускать эксперименты, дешевле валидировать идеи и быстрее принимать продуктовые решения на данных. Отдельный бонус для любителей causal inference: в программе есть доклад про синтетическую разность разностей и оценку эффектов региональных экспериментов ❤️ • R&D и экономика масштабирования продуктов – про то, как считать экономику AI‑фичей и R&D‑инициатив, когда и как выгодно масштабировать решения В АНА’26 примут участие спикеры из Яндекса, Авито, Wildberries, VK, X5 Tech, Т‑Банка, Сбера, Lenta Tech, ВкусВилл и других продуктовых и AI‑команд. Форматы участия: онлайн и офлайн, с доступом к записям и корпоративными скидками Полная программа и регистрация — на сайте конференции
🎁 И ещё один приятный момент: вместе с организаторами АНА’26 мы разыграем один билет на конференцию среди подписчиков нашего канала – следите за постами в ближайшую неделю!
#канал_зовёт @causal_channel

СМИ продолжают изучать академические публикации #ЭФМГУ⤵️ https://tass.ru/ekonomika/27346335 «Ученые выяснили, что после того,
СМИ продолжают изучать академические публикации #ЭФМГУ⤵️ https://tass.ru/ekonomika/27346335 «Ученые выяснили, что после того, как крупные цифровые экосистемы покупают другие компании, количество подобных сделок в той же отрасли увеличивается. <…> Поглощения и слияния, проводимые цифровыми гигантами, стимулируют "дробление" сделок: в соответствующей отрасли число последующих сделок растет в среднем на 2,27 сделки в месяц, тогда как их совокупная стоимость в среднем не меняется. То есть сделки становятся более частыми, но в среднем менее капиталоемкими». Статья Анны Ставнийчук и Ольги Марковой «Способствуют ли сделки цифровых экосистем росту слияний?» - по ссылке ⤵️ https://ej.hse.ru/article/view/33623 #исследования_ЭФМГУ #ЭФМГУвСМИ

Рады быть частью #ЭФМГУ ❤️

🔎 Что от нас скрывает log(1+Y)? Часто мы используем логарифмы, когда данные сильно скошены вправо (например, доходы) или ког
🔎 Что от нас скрывает log(1+Y)? Часто мы используем логарифмы, когда данные сильно скошены вправо (например, доходы) или когда хотим получить коэффициент с интерпретацией процентного эффекта (лог‑линейные модели) или эластичности (лог‑лог модели). Всё это работает красиво, пока зависимая переменная строго положительна Но как только в зависимой переменной встречаются нули, log(Y) не определён, и логарифмирование ведёт к выбрасыванию наблюдений с Y=0. Чтобы не терять данные, мы прибегаем к на первый взгляд безобидному трюку: берём log(1+Y) или arcsinh(Y). Эти функции ведут себя почти как логарифм при больших значениях Y, но определены при нуле Кажется, что мы починили проблему, но в причинной постановке именно здесь и начинается подвох, о котором говорят в своей статье Цзяфэн Чэнь и Джонатан Рот (Chen, Roth, 2023) 😇Что происходит в нуле? Для положительных Y оценка на логарифмах не зависит от единиц измерения: хоть в рублях считай, хоть в копейках, ATE в логах будет одинаковым При нулях это свойство ломается. Если тритмент влияет на экстенсивную маржу (extensive margin) (меняет вероятность того, что Y>0), то ATE для лог‑подобных функций вроде log(1+Y) или arcsinh(Y): 🟤зависит от того, в каких единицах вы измеряете Y 🟤меняется в разы, если просто перейти от рублей к копейкам 🟤в пределе может стать сколь угодно большим по модулю, если достаточно «накрутить» масштаб Это видно на репликациях статей AER: при умножении исхода на 100 оценки в лог‑подобных единицах в половине работ меняются более чем на 100% по модулю (см. рисунок) Интуитивно: человек, у которого Y(0)=0,Y(1)>0, вносит в ATE вклад log(1+Y(1))−log(1+0). Если вы домножаете все Y на α (рубли → копейки), этот вклад становится log(1+αY(1))−log(1+0) = log(1+αY(1)). При достаточно большом α разница растёт примерно как log(α). Выбор единиц фактически задаёт, насколько сильно вы «подкручиваете» вклад переходов из 0 в положительное значение Для тех, у кого и Y(0)>0, и Y(1)>0, вклад в ATE почти не меняется при смене масштаба: разность логов (или лог‑подобных значений) остаётся примерно той же
В итоге при крупном масштабе лог‑подобный ATE в основном отражает эффект на экстенсивную маржу (изменение доли с Y>0), а не среднее процентное изменение среди тех, у кого Y уже положителен
😇Почему это не техническая мелочь Процентный эффект – это объект, который не должен зависеть от единиц измерения. Если вы видите «+40%», это должно означать одно и то же, независимо от того, в рублях это посчитано или в копейках Лог‑подобный ATE при нулях этого не гарантирует. По сути вы измеряете не «процентный эффект», а некоторую функцию, в которой: 🟤интенсивная маржа (изменения среди тех, у кого Y>0) даёт вклад, почти независимый от масштаба 🟤экстенсивная маржа (переходы из 0 в положительное) даёт вклад, масштаб которого фактически задается единицей измерения 😇Что вместо log(1+Y)? Если всё же нужен процентный эффект на среднем, гораздо аккуратнее: 1) Сначала оценить эффект на уровнях: Δ=E[Y(1)]−E[Y(0)] 2) Затем выразить его в процентах относительно базового среднего: Δ/E[Y(0)] Это и есть настоящий процентный эффект: на сколько процентов средний Y изменился из‑за тритмента. Эта величина не меняется при переходе от рублей к копейкам. Оценивать её можно привычными способами, в том числе через Poisson/PML‑регрессию, которая хорошо работает с нулями 😇Мораль – отделяйте две маржи Во многих задачах нас на самом деле интересуют две разные вещи: 🟤экстенсивная маржа: как тритмент влияет на вероятность того, что Y>0 (участие, выход на рынок, наличие дохода и т.п.) 🟤интенсивная маржа: как тритмент влияет на размер Y среди тех, кто уже участвует Вместо того чтобы пытаться совместить обе маржи через лог‑подобную трансформацию, лучше: 🟤отдельно оценить эффект на Pr(Y>0) 🟤отдельно оценить эффект на уровни Y среди «участников» (и явно проговаривать допущения, нужные для интерпретации этого эффекта как интенсивного) Так вы получите два понятных числа, вместо одного «процентного» коэффициента, который на деле зависит от того, в каких единицах вы измерили исход #канал_обозревает @causal_channel

🚕 Кто заказывал такси на Дубровку? Помните, мы рассказывали про динамическое ценообразование в такси – как сурж помогает «ра
🚕 Кто заказывал такси на Дубровку? Помните, мы рассказывали про динамическое ценообразование в такси – как сурж помогает «расчистить» дисбалансы и почему водители выезжают именно туда, где нужны? А ещё – как на лекции в Музеоне мы говорили про городской транспорт и доказательную политику?
В канале мы много пишем про causal inference – ex post оценку эффектов, которая отлично подходит, когда политика уже проведена, данные накопились, и мы хотим ретроспективно понять, «сработало или нет» и для кого именно. Но когда задача другая – ex ante спрогнозировать последствия ещё не реализованного вмешательства (оценить контрфактический сценарий регулирования наперёд), привычных причинно-следственных методов уже недостаточно. Здесь нужны структурные модели, которые явным образом описывают поведение агентов и механизм работы рынка
Именно такой подход мы использовали в нашей новой статье, опубликованной в журнале «Экономическая политика» (Маркова, Ставнийчук, 2026)В чём дискуссия? Регуляторы по всему миру (в т.ч. и в России) периодически обсуждают ограничение комиссий платформ такси и доставки. Логика простая: «платформа берёт себе слишком много, надо защитить водителей и пассажиров». Но очевидный и правильный ли это вывод? Мы показываем, что фиксация комиссии – это не нейтральное регуляторное решение, а вмешательство в многокритериальный механизм балансировки рынка, последствия которого затрагивают всех: водителей, пассажиров и саму платформу ⏮Что делает гибкая комиссия? Комиссия – это не просто «процент платформы». Это один из трёх ключевых рычагов, которыми одновременно управляет платформа: 🟤цена поездки для пассажира 🟤выплата водителю 🟤собственная комиссия Варьируя комиссию, платформа перераспределяет ресурсы: например, снижает её (увеличивает долю водителя), чтобы удержать достаточное предложение в зонах и временных окнах с повышенным спросом. Именно это позволяет смягчать пространственные и временные дисбалансы – включая тот самый wild goose chase, о котором мы уже писали, когда рассказывали, как водителей могут отправлять за «дальними» заказами, создавая лишний пробег и ожидание ⏮Как мы это исследуем? Поскольку ограничение только обсуждается, невозможно оценить его так же, как уже реализованное регулирование в духе «до/после», поэтому мы: 🟤строим теоретическую структурную модель рынка такси 🟤явно задаём, как агенты реагируют на цены, комиссию и сурж 🟤затем калибруем модель на открытых данных по российскому рынку такси Это позволяет не только описать наблюдаемое равновесие, но и просчитать контрфактические сценарии: что произойдёт, если «заморозить» комиссию на определённом уровне, как изменятся доходы водителей, качество сервиса для пассажиров и устойчивость платформы ⏮К чему мы приходим? Гибкая комиссия: 🟤снижает вероятность провалов мэтчинга (несостоявшихся поездок) 🟤увеличивает доходы водителей за счёт лучшей координации 🟤позволяет платформе адаптироваться к изменениям спроса без потери качества сервиса Фиксированная комиссия: 🟤ограничивает адаптивность платформы 🟤снижает прибыль и устойчивость 🟤ухудшает благосостояние всех участников – в том числе водителей и пассажиров, которых регулятор и хотел защитить Причём потери от фиксации зависят от того, насколько фиксированный уровень отличается от оптимального ⏮Зачем это всё регулятору? Классические методы причинного анализа хорошо отвечают на вопрос «что случилось после уже проведённой реформы». Но при проектировании регуляторных ограничений ex ante важно понимать, как изменится поведение агентов и новое равновесие рынка Наша статья показывает, что: 🟤ограничение одного параметра (комиссии) без учёта связки «цена–комиссия–вознаграждение водителей» ведёт к ошибкам I и II рода 🟤для цифровых платформ в транспорте более осмысленным выглядит комбинированный подход: оставить платформе гибкость в оперативной настройке параметров, а фокус регулирования смещать на прозрачность, мониторинг и экс-пост контроль злоупотреблений И было бы здорово, если гибкое балансирование рынков все-таки не записывали в реинкарнацию плановой экономики 😄 #канал_влияет @causal_channel