fa
Feedback
Yandex for Analytics

Yandex for Analytics

رفتن به کانال در Telegram

Канал для аналитиков от Яндекса. Рассказываем о событиях, обсуждаем кейсы, знакомимся с командами и внимательно смотрим на данные. Чат: t.me/YandexDataDriven Вопросы: @Ekaterina_Lyagina Все каналы Яндекса по стекам: https://t.me/addlist/Hrq31w2p1vUyOGZi

نمایش بیشتر
8 788
مشترکین
+724 ساعت
+517 روز
+16930 روز
آرشیو پست ها
🛎 Приходите на вечеринку для аналитиков 23 апреля мы собираемся в Санкт-Петербурге на вечернем митапе для аналитиков. На это
🛎 Приходите на вечеринку для аналитиков 23 апреля мы собираемся в Санкт-Петербурге на вечернем митапе для аналитиков. На этот раз поговорим о решениях сложных продуктовых и исследовательских задач — от оценки безопасности автопилота до экспериментов без A/B-тестов. Разберём реальные кейсы, где данные, модели и продуктовые решения пересекаются. Спикеры и доклады: 🔵 Елмурат Темиргалиев, руководитель группы сбора датасетов команды Автономного транспорта Яндекса, расскажет, как статистически доказать безопасность системы и сократить годы тестов до одной недели с помощью симуляции и бережливой дедупликации сцен 🔵 Тимур Шаймуханов, аналитик-разработчик команды алгоритмов ценообразования Яндекс Такси, расскажет о согласованном ценообразовании тарифов в сервисе и о том, как учёт состояния маркетплейса «Комфорта» помог снизить цены в «Экономе» и повысить эффективность платформы 🔵 Иван Меренков, аналитик команды Data AI Lab Яндекса, поделится личным опытом сборки команды AI-агентов для эффективной повседневной работы 🔵 Николай Олигеров, аналитик-разработчик Яндекс Путешествий, расскажет, чем заменить A/B-тесты, когда они невозможны: обсудим применение propensity score matching и проверку результатов ⏭️ Переходите на сайт, чтобы узнать больше о программе и зарегистрироваться! 💠 До встречи на Analytics Party! Подписывайтесь: 💬 @Yandex4Analytics

🎙 Зачем ставить цели, если всё поменяется? Как планировать работу, когда рынок штормит, а «чёрные лебеди» прилетают один за другим? Разбираем, почему постановка целей часто превращается в головную боль. В этом выпуске ведущие — Дима, Ксюша и Саша — обсудили, как ставить цели с учётом постоянно меняющихся вводных, как к этому подходят разные команды Яндекса и почему ставить цели, на самом деле не так страшно. ⏭️ Смотрите полный выпуск на ютубе и в VK Видео или слушайте в Яндекс Музыке Подписывайтесь: 💬 @Yandex4Analytics

🧑‍💻 Как построить чувствительную метрику для экспериментов Привет! Я Артём Германский, аналитик-разработчик из группы анали
+8
🧑‍💻 Как построить чувствительную метрику для экспериментов Привет! Я Артём Германский, аналитик-разработчик из группы анализа экспериментов еком-сценариев Поиска. Бывает так: вы запускаете эксперимент, изменение выглядит однозначно полезным, но метрика выдаёт p-value = 0,3. Незначимо. Не спешите откладывать фичу. Часто проблема не в изменениях, а в слишком грубой метрике, которой вы их измеряете. В этом посте расскажу про подход, который помогает с этим справиться. Идея в том, чтобы построить составную метрику, которая будет кратно чувствительнее стандартных. 👳 Читайте все подробности в карточках выше Подписывайтесь: 💬 @Yandex4Analytics

🛴 Самокаты и симуляции: рассказываем, как устроен диспатч Привет, сегодня с вами: 🔵 Александр Карбышев, руководитель операц
+8
🛴 Самокаты и симуляции: рассказываем, как устроен диспатч Привет, сегодня с вами: 🔵 Александр Карбышев, руководитель операционной аналитики самокатов 🔵 Ашера Дюсенова, аналитик-разработчик команды шеринговых сервисов 🔵 Степан Деревянченко, руководитель операционной аналитики шеринговых сервисов Мы хотим рассказать про диспатч в Самокатах. Это алгоритм, который прокладывает маршрут для тех, кто меняет батареи в наших устройствах. 🈂️ Как это работает У нас есть зарядные станции, в которых хранятся батареи. Исполнитель забирает их и развозит по району. Какие самокаты заряжать и в каком порядке — решает алгоритм диспатча. 👳 Можно было пойти простым путём: заряжать самые близкие к станции устройства с наименьшим остатком батареи. Но мы поступили иначе, а как именно — рассказали в карточках выше. Подписывайтесь: 💬 @Yandex4Analytics

🤔 Как понять, что вас ждёт в новой команде? Если на собеседовании вам не рассказали про аналитическую культуру компании — спросите сами! Так вы сразу поймёте, будет ли у вас мэтч и чего ожидать от работы. А если рассказали — задавайте уточняющие вопросы. Это отличный способ заочно познакомиться с командой и её подходами. 🎙 В новом выпуске подкаста «Доверительный интервал» лиды аналитики Дима, Ксюша и Саша обсудили: 🔵 Из чего складывается аналитическая культура 🔵 Что спросить на собеседовании у потенциального руководителя 🔵 Как любимый предмет в университете помог в работе ⏭️ Смотрите полный выпуск на ютубе и в VK Видео или слушайте в Яндекс Музыке. Подписывайтесь: 💬 @Yandex4Analytics

🗳 Приходите знакомиться с командой R&D Нетворкинг, технологии и закулисье реальных проектов — всё это ждёт вас на встрече, к
🗳 Приходите знакомиться с командой R&D Нетворкинг, технологии и закулисье реальных проектов — всё это ждёт вас на встрече, которая пройдёт в штаб-квартире Яндекса. Приглашаем дата-сайентистов, дата-аналитиков и продуктовых аналитиков, у которых есть опыт работы с LLM/VLM и Python от трёх лет. На этот раз демонстрировать внутреннюю кухню и отвечать на вопросы будет команда R&D. Смотрите, какие доклады ребята подготовили: 🔵 Ирина Барская, руководитель отдела аналитики и исследований. Раскроет, зачем генеративным моделям аналитики 🔵 Иван Дёгтев, руководитель службы аналитики Alice AI LLM. Расскажет, как улучшать мозг Алисы, даже если вы не разбираетесь в нейрохирургии 🔵 Наталия Селюто, руководитель группы аналитики генеративных ответов Алисы. Объяснит, как Алису сделали человечнее 🔵 Арина Челпанова, руководитель группы аналитики YandexART. Раскроет, как её команда делает аналитику генераций изображений в YandexART 🔵 Арсений Нестюк, руководитель аналитики распознавания речи. Расскажет про голосовые технологии Алисы После докладов все желающие смогут проверить свои навыки матстата и аналитики. Интервьюер подсветит сильные стороны и покажет зоны роста. А хорошие результаты засчитаем как одну техническую секцию, если решите пройти собеседование в Яндекс в течение двух лет 😎 🗺 Где: Москва, Льва Толстого, 16 📆 Когда: 11 апреля, 12:00 ⏭️ Регистрируйтесь тут До встречи на Welcome Time! Подписывайтесь: 💬 @Yandex4Analytics

🔋 Как ML-скоринг помогает нам выбирать места для станций пауэрбанков Привет, меня зовут Степан Деревянченко, я руководитель
+8
🔋 Как ML-скоринг помогает нам выбирать места для станций пауэрбанков Привет, меня зовут Степан Деревянченко, я руководитель операционной аналитики шеринговых сервисов. «Бери заряд» — бизнес ситуативного потребления, который сильно зависит от правильной локации. Цена ошибки высока: нам нужно примерно 30 дней, чтобы понять, что у станции плохая экономика. Если мы разместим её в точке, где нет трафика или подходящей аудитории, то потеряем время и ресурсы. Мы знаем, что выручка зависит от двух основных свойств локации: проходимости и популярности. Раньше у нас было довольно много ручной аналитики, мы полагались на экспертов и проверяли характеристики вручную. В результате увеличивалось time to decision. 🧑‍💻 Мы решили пересмотреть подход и построили ML-скоринг Нам нужна была модель, которая умеет выделять локации с сильным потенциалом. Перед ней мы поставили несколько задач: уменьшить количество ручной работы, ускорить общий процесс и максимизировать удельную выручку на ячейку. 👳 Как у нас это получилось — читайте в карточках Подписывайтесь: 💬 @Yandex4Analytics

🎙 Как данные, процессы, люди и решения формируют культуру компании Вышел второй выпуск подкаста «Доверительный интервал», в котором лиды аналитики из команд Недвижимости, Практикума и Яндекс Еды Саша, Ксюша и Дима разобрали:
🔵 Как на этапе собеседования выяснить, в команду с какой аналитической культурой вы попадёте? 🔵 Можно ли повлиять на эту культуру снизу вверх? 🔵 Как понять, с какой командой будет мэтч именно у вас?
А ещё обсудили, как устроена аналитическая культура в компаниях, от чего зависит её зрелость и почему даже в соседних командах одного бигтеха процессы могут существенно различаться. 🎧 Смотрите полный выпуск на ютубе и в VK Видео или слушайте в Яндекс Музыке. Подписывайтесь: 💬 @Yandex4Analytics

🧙 Как открыть порталы в темы В Поиске Яндекса вы могли заметить специальные разделы: финансы, квартиры, товары и медицина. М
+5
🧙 Как открыть порталы в темы В Поиске Яндекса вы могли заметить специальные разделы: финансы, квартиры, товары и медицина. Мы называем их темами или тематическими поисками. В них интерфейс поиска заточен под специфику конкретной сферы. Например, в «квартирах» результаты можно отфильтровать по цене и числу комнат. Тематический поиск разработчикам приходилось создавать практически с нуля. Для этого команда научилась пользоваться новым типом данных, построила DWH и единые дашборды. ⏬ Но мало просто создать тематический поиск Нужно, чтобы пользователь узнал о нем. Для этого существуют точки входа — кликабельные объекты для перехода в нужную тему. Вопрос в том, где их расположить и как не сломать привычный флоу. 👳 Обо всём этом мы поговорили с Владимиром Никитиным, старшим аналитиком-разработчиком в Поиске. В карточках он рассказал, с какими вызовами пришлось столкнуться в 2025 году и как пара слов в нужном месте может оказать сильный импакт на метрики. А ещё ищите на странице все мероприятия для аналитиков на 2026 год! Возможно, встретимся с вами вживую 😎 Подписывайтесь: 💬 @Yandex4Analytics

🧑‍💻 Подписывайтесь на email-рассылку от Yandex for Analytics Вы можете подписаться на ежемесячную email-рассылку без лишнего — только материалы от аналитиков и для аналитиков. Наши коллеги регулярно просматривают профильные источники и собирают то, что читают и смотрят сами. В рассылке — короткие подборки статей с Хабра, подкасты и видео, новости индустрии, полезные инструменты, а также ключевые мероприятия и технологические анонсы Яндекса. ⏭️ Подписаться на ежемесячную рассылку можно здесь 💎 В форме выберите дайджест Yandex for Analytics. По этой же ссылке можно подписаться и на общую рассылку для разработчиков — Yandex for Developers. Подписывайтесь: 💬 @Yandex4Analytics

🥤 Устраивайте Friday Party Wins Как не забывать про маленькие победы в команде? Можно внести их в календарь — например, сделать регулярный созвон по пятницам. На таких небольших встречах команда будет делиться своими достижениями и промежуточными результатами. Это простой способ держать всех в курсе закрытых задач и не терять ощущение прогресса в длинных проектах. 🎙 Идею подсмотрели у Димы, Ксюши и Саши в первом выпуске подкаста для аналитиков «Доверительный интервал». Смотрите на ютубе и в VK Видео или слушайте в Яндекс Музыке. Подписывайтесь: 💬 @Yandex4Analytics

🎉 Приходите на вечеринку для аналитиков 23 апреля мы собираемся в Санкт-Петербурге на вечернем митапе для аналитиков. На это
🎉 Приходите на вечеринку для аналитиков 23 апреля мы собираемся в Санкт-Петербурге на вечернем митапе для аналитиков. На этот раз поговорим о решениях сложных продуктовых и исследовательских задач — от оценки безопасности автопилота до экспериментов без A/B-тестов. Разберём реальные кейсы, где данные, модели и продуктовые решения пересекаются. Спикеры и доклады: 🔵 Елмурат Темиргалиев, руководитель группы сбора датасетов команды Автономного транспорта Яндекса, расскажет, как статистически доказать безопасность системы и сократить годы тестов до одной недели с помощью симуляции и бережливой дедупликации сцен 🔵 Тимур Шаймуханов, аналитик-разработчик команды алгоритмов ценообразования Яндекс Такси, расскажет о согласованном ценообразовании тарифов в сервисе и о том, как учёт состояния маркетплейса «Комфорта» помог снизить цены в «Экономе» и повысить эффективность платформы 🔵 Иван Меренков, аналитик команды Data AI Lab Яндекса, поделится личным опытом сборки команды AI-агентов для эффективной повседневной работы 🔵 Николай Олигеров, аналитик-разработчик Яндекс Путешествий, расскажет, чем заменить A/B-тесты, когда они невозможны: обсудим применение propensity score matching и проверку результатов ⏭️ Переходите на сайт, чтобы узнать больше о программе и зарегистрироваться! 🗳 До встречи на Analytics Party! Подписывайтесь: 💬 @Yandex4Analytics

🥤 Культура срочности, приоритет задач и быстрый дофамин Мы запускаем подкаст «Доверительный интервал» — проект от аналитиков для аналитиков. В нём друзья из разных команд Яндекса делятся, чем живут на работе и за её пределами. 🎙 В студии: 🔵 Дима Ефимов, руководитель отдела эффективности и аналитики логистики в Еде 🔵 Ксюша Колесникова, руководитель департамента аналитики в Практикуме 🔵 Саша Купцов, руководитель службы аналитики в Недвижимости 🈂️ В первом эпизоде они обсудили жизнь аналитика в культуре срочности Типичная ситуация: вы распланировали и приоритизировали работу на полгода, а уже через неделю появляются задачи со скорыми дедлайнами. И вот вы ощущаете знакомое чувство, что всё вокруг горит. 🈂️ Подумали, почему так происходит Порой дело в дофаминовых качелях: долгие проекты не дают быстрых наград, в отличие от мелких задач. В некоторых случаях нам просто трудно отказать коллегам, когда им нужна помощь. А иногда мелкие задачи помогают разогреться перед работой над более сложным проектом или, наоборот, отвлечься от тяжёлого тикета и ненадолго переключиться. 🎧 В полном выпуске Дима, Ксюша и Саша вывели лайфхаки, которые помогут справиться со срочными задачами. Смотрите на ютубе и в VK Видео, а также делитесь в комментариях, какие советы заберёте себе. Подписывайтесь: 💬 @Yandex4Analytics

پیام ویدیو01:00

⏬ Кейс: как поставить эксперимент, когда A/B-тест невозможен Привет, меня зовут Николай Олигеров, я работаю продуктовым анали
Кейс: как поставить эксперимент, когда A/B-тест невозможен Привет, меня зовут Николай Олигеров, я работаю продуктовым аналитиком в Яндекс Путешествиях. В этом посте я хочу рассказать про Propensity Score Matching — статистический метод, который позволяет корректно сравнивать группы в ситуациях, когда нельзя провести честный A/B-тест. 🈂️ Ситуация Мы хотим выяснить, какой инкрементальный GBV (gross booking value, общая стоимость бронирования) приносят новые подключённые отели. Предположим, в городе N в радиусе X километров можно забронировать пять отелей в Яндекс Путешествиях. Рядом с ними есть ещё два заведения, которые не подключены к нашему сервису. 🈂️ Вопрос Увеличим ли мы общее количество бронирований, если подключим эти отели? У нас есть две гипотезы: ✅ Да, ведь через них пойдут заказы ❌ Нет, ведь пользователи всё равно заехали бы в уже подключённые заведения 🈂️ Проблема: почему нельзя использовать обычный A/B-тест 🔵 Во-первых, нельзя полностью изолировать тестовую группу от контрольной. Пользователи могут выбирать заведение через разные аккаунты: например, муж посмотрит отель и скинет его жене, а та зайдёт со своего профиля и ничего не увидит 🔵 Во-вторых, мы не хотим, чтобы даже в рамках эксперимента подключённые к нам заведения теряли часть заказов 🔵 В-третьих, если компании-новички дают высокий инкремент, то проведение такого эксперимента обойдётся нам в копеечку 🔵 В-четвёртых, такой эксперимент нужно было бы крутить очень долго, ведь нужно сравнить поведение пользователей на разном горизонте заказов: и на неделю, и на год вперёд 🈂️ Решение: Propensity Score Matching PSM позволяет сравнить тестовую и контрольную группы на основе тритмента (воздействия) — в нашем случае это показ отелей-новичков в ленте. Задача в том, чтобы правильно оценить эффект и минимизировать влияние на результат ключевых характеристик пользователей, например их среднего чека в сервисе. Для этого нужно подобрать каждому пользователю с тритментом пару — максимально похожего на него человека, который не получал воздействия. После этого можно сравнить метрики и оценить желаемый эффект. ⏭️ В статье на Хабре я рассказываю, сколько пользователей нужно подбирать для тестовой и контрольной групп, как PSM выглядит в коде, что делать с валидацией результатов и какие ключевые характеристики юзеров выбирать, чтобы уменьшить смещение. Подписывайтесь: 💬 @Yandex4Analytics

🧑‍💻 Как мы обманули сами себя с помощью среднего арифметического (и что с этим сделали) Привет, меня зовут Иван Лузин, я ру
🧑‍💻 Как мы обманули сами себя с помощью среднего арифметического (и что с этим сделали) Привет, меня зовут Иван Лузин, я руководитель группы аналитики. Бывает, что в работе с данными нас может подводить не только математика, но и собственное восприятие. Классический пример — парадокс Симпсона, когда объединение двух сонаправленных зависимостей вызывает разворот на 180 градусов. Мы столкнулись с этим, когда анализировали цены на задачи в проектах. Вот что это значит на примерах. Представьте, что у нас есть: 🔵 Проект №1. 100 задач со средней ценой 10 🔵 Проект №2. 1000 задач со средней ценой 1 Общая средневзвешенная стоимость равна 1,82. Теперь представим, что у обоих проектов выросла цена, как и количество задач в них: 🔵 Проект №1. 120 задач со средней ценой 11,67 🔵 Проект №2. 2000 задач со средней ценой 1,10 Логично ожидать, что и средневзвешенная стоимость подрастёт? Но нет — после объединения данных она упала до 1,70. ♾ В сервисе Yandex Crowd тысячи проектов с миллионами задач в них, поэтому интерпретировать каждое такое изменение было сложно Решением здесь для нас стал индекс цены. Мы считаем его по методу Тёрнквиста и сравниваем стоимость в двух периодах. Если индекс выше 1 — цены в среднем увеличились, если ниже 1 — снизились. Эта метрика позволила нам увидеть, как меняются тарифы в проектах на платформе, и обойти парадокс Симпсона. ⏬ О том, как мы прошли путь от формулирования до внедрения этой и других метрик, я расскажу на Welcome Time 21 марта 👀 Это неформальная офлайн-встреча для дата-сайентистов и дата-аналитиков, где вы сможете: 🔵 Пообщаться со специалистами из команд Crowd и Безопасности 🔵 Обсудить технологии и задать вопросы о проектах 🔵 Если есть желание, пройти диагностику ваших навыков ⏭️ Ждём вас на Welcome Time Подписывайтесь: 💬 @Yandex4Analytics

🐚 Как коммуницировать с пользователями и не надоесть им Для аналитиков, которые работают с маркетинговыми коммуникациями, ва
+8
🐚 Как коммуницировать с пользователями и не надоесть им Для аналитиков, которые работают с маркетинговыми коммуникациями, важно понимать, как слать push-уведомления чаще. Но делать это по-умному, чтобы не испортить пользовательский опыт. Своим вариантом решения этой проблемы поделились наши коллеги из QuQu — внутренней системы Яндекс Go для CRM-коммуникаций. 👳 Передаём слово в карточках Антону Диденко, руководителю команды платформенной аналитики, и Льву Барабанщикову, ML-разработчику. Подписывайтесь: 💬 @Yandex4Analytics

Insightus: как мы автоматизируем рутину и управляем качеством AI-решений 40% времени аналитика уходит на технические задачи: написание SQL-запросов и кода, поиск данных, изучение домена. 15% занимает общение с заказчиком. Ещё 30% уходит на дашборды. В итоге на поиск реальных инсайтов остаётся лишь 15%. Рутина поглощает творчество. Что делать? Автоматизировать её: для этого мы разрабатываем Insightus. Это AI-ассистент для аналитиков, который берёт на себя рутинные дела и возвращает время на реальные задачи. 👨‍💻 В докладе на Матемаркетинге Константин Бабалян, руководитель службы Яндекс Технологий, рассказал, как команда искала баланс между автоматизацией и точностью. Вот три ключевых вывода: 🈂️ Качество бесполезно, если им не управлять Точность ответов можно измерить метриками pass@3 и pass^k: так мы получаем долю задач, где хотя бы одна из трёх попыток ответить на вопрос оказалась верной (или каждая из них соответственно). Но это число само по себе ничего не даёт. Если система ошибается, важно понимать, где именно. Поэтому команда сегментировала ошибки по типам: проблемы с агрегацией, неверные источники, потеря контекста. Только так можно чинить системные проблемы, а не латать дыры по отдельности. 🈂️ Контекст — краеугольный камень системы AI-аналитики Его много, и он сложный. Управление им — ключ к росту качества системы. Наивная RAG с загрузкой всех документов компании почти ничего не даёт. LLM тонет в шуме и не понимает, о чём её спросили. Когда команда оставила в контексте только знания по нужному домену (например, только метрики Такси), метрика pass@3 подскочила до 35%. Гибридный (векторный + полнотекстовый) поиск увеличил качество ещё на 15 процентных пунктов. Дальше — больше. Экспертный промпт с чёткой схемой рассуждения аналитика дал +19%. Детерминированные инструменты вместо свободной генерации кода добавили ещё 8%. Так команда пришла к 86% качества. 🈂️ Лучше не ответить, чем ответить неверно Последний шаг — оценка неопределённости. Система учится говорить «я не знаю», если сомневается. Формально качество падает на 6 процентных пунктов. Но доля неверных ответов снижается почти вдвое. В аналитике цена ошибки высока. Лучше отправить запрос на уточнение, чем кормить бизнес ложными инсайтами. 📺 А в полном докладе Константин детально разбирает каждый шаг эволюции от 0 до 86% качества и показывает, как команда тестировала гипотезы. Смотрите на платформах: 🔵 Ютуб 🔵 VK Видео Подписывайтесь: 💬 @Yandex4Analytics

🧑‍💻 Сыграем в «Сапёра»? Привет, это команда Yandex for Analytics. Вместе с командой Яндекс Практикума мы собрали для вас по
+8
🧑‍💻 Сыграем в «Сапёра»? Привет, это команда Yandex for Analytics. Вместе с командой Яндекс Практикума мы собрали для вас пост по мотивам олдскульной игры на Windows. Выбирайте наугад любую карточку и проверьте интуицию, попадёте в безопасную зону или нет. Если у вас открылась только одна карточка, нажмите на другую. Продолжайте играть, пока не откроете остальные. А если открылись все сразу, то прочитайте, на каких клетках были опасности, и постарайтесь избегать их в реальной жизни. Подписывайтесь: 💬 @Yandex4Analytics

🧑‍💻 Мы делимся материалами для аналитиков не только в Telegram Вы можете подписаться на ежемесячную email-рассылку без лишнего — только материалы от аналитиков и для аналитиков. Наши коллеги регулярно просматривают профильные источники и собирают то, что читают и смотрят сами. В рассылке — короткие подборки статей с Хабра, подкасты и видео, новости индустрии, полезные инструменты, а также ключевые мероприятия и технологические анонсы Яндекса. ⏭️ Подписаться на ежемесячную рассылку можно здесь 💎 В форме выберите дайджест Yandex for Analytics. По этой же ссылке можно подписаться и на общую рассылку для разработчиков — Yandex for Developers. Подписывайтесь: 💬 @Yandex4Analytics