Yandex for Analytics
Open in Telegram
Канал для аналитиков от Яндекса. Рассказываем о событиях, обсуждаем кейсы, знакомимся с командами и внимательно смотрим на данные. Чат: t.me/YandexDataDriven Вопросы: @Ekaterina_Lyagina Все каналы Яндекса по стекам: https://t.me/addlist/Hrq31w2p1vUyOGZi
Show more8 745
Subscribers
+324 hours
+287 days
+17030 days
Posts Archive
8 745
CLI-агенты помогают разработчикам писать код и напрямую взаимодействуют с файлами проектов.
8 745
🤨 А точно ли я всё делаю правильно?
Работу аналитика сложно оценить по результату здесь и сейчас: она часто не приводит к «видимому эффекту», и из-за этого легко начать сомневаться в себе.
В новом выпуске «Доверительного интервала» ведущие разбираются:
🔵 Как справляться с синдромом самозванца
🔵 Что даёт понять, что ты правда хорошо работаешь
🔵 Как отвлекаться от задач правильно (нет, скроллинг ленты не считается)
🔵 Почему даже сильные специалисты продолжают сомневаться в себе
🎙 В этот раз в гостях Маша Медведева, аналитик-разработчик Техплатформы Городских сервисов.
⏭️ Смотрите на YouTube и в VK Видео, слушайте в Яндекс Музыке.
Подписывайтесь:
💬 @Yandex4Analytics
8 745
🧠 Готовые датасеты: почему они важнее, чем могут казаться
Для начинающих аналитиков и ML-специалистов это отличная тренировка навыков. Готовые датасеты позволяют быстро проверить идею, собрать воспроизводимый пример, сравнить методы на нейтральной территории и отладить пайплайн без доступа к продовым или персональным данным.
⏬ Датасеты можно разделить по классам источников:
🔵 Kaggle, OpenML. Для сравнения методов, baseline и быстрого эталонного пайплайна
🔵 Hugging Face Datasets, TensorFlow Datasets. Для NLP/CV/Audio и быстрого старта
🔵 BigQuery Public Datasets, Registry of Open Data on AWS, Azure Open Datasets. Для SQL-анализа в больших объёмах
🔵 Common Crawl, Wikimedia Dumps, Stack Exchange Data Dump. Для работы с масштабными текстовыми корпусами
🔵 Data.gov, World Bank Open Data, Eurostat Database. Для надёжных временных рядов
🔵 OpenStreetMap, OpenAlex, NOAA. Для геоданных, анализа климата и графов
Кстати, ссылки на все эти датасеты вы можете найти в комментариях 😉
👳 А ещё мы сделали для вас чек-лист, который поможет выбрать датасет и не наступить на грабли. Подробности — в карточках выше
Этот пост нам помог подготовить Александр Вальд, старший эксперт и академический руководитель магистратур по аналитике данных в Яндекс Практикуме. Заглядывайте в его канал Thinking Face. Там он вместе с коллегами рассказывает про исследования в маркетинге и data-driven-аналитику 📊
Подписывайтесь:
💬 @Yandex4Analytics
8 745
+5
🚕 Динамическое ценообразование в Такси и как мы его строили
Привет, это Тимур Шаймуханов, аналитик-разработчик в группе алгоритмов ценообразования. Одна из ключевых метрик в Такси — эффективность платформы. Это доля времени, которую водитель проводит в машине с пассажиром, от всего рабочего дня. В идеальном мире вместе с исполнителем всегда должен быть клиент.
♾ Но раньше у нас была проблема: спрос пользователей мог концентрироваться в каком-то конкретном тарифе. И когда такое происходило, остальным водителям приходилось пересаживаться на него — или тратить время в ожидании заказов.
Чтобы исправить эту проблему, мы научили «Эконом» и «Комфорт» работать согласованно — и в итоге повысили эффективность всего сервиса.
👳 Читайте в карточках, как у нас это получилось
Подписывайтесь:
💬 @Yandex4Analytics
8 745
🤔 Почему «серые» результаты в экспериментах нужны
Иногда тесты показывают «серые» результаты, но при этом бизнес продолжает настаивать на развитии продукта.
Порой причина в том, что результаты отражают текущие состояния и решения, которые могут измениться при развитии продукта и его дальнейшей стратегии.
🎙 Мы ответили на этот и многие другие вопросы подписчиков в шестом выпуске подкаста «Доверительный интервал». В этот раз к нам в гости пришёл Роман Васильев, руководитель аналитики международного Поиска.
⏭️ Смотрите на ютубе, в VK Видео и слушайте в Яндекс Музыке.
Подписывайтесь:
💬 @Yandex4Analytics
8 745
+8
🧑💻 Какие метрики помогают повышать качество ответов LLM
На связи Иван Дёгтев, руководитель службы аналитики Alice AI LLM. Наша миссия — научить модель решать самые разнообразные задачи и при этом сохранить баланс между главными метриками качества ответов.
👳 В карточках я рассказываю, как мы его оцениваем и какие трудности преодолеваем в процессе
⏭️ А если вас заинтересовала работа нашей команды, то мы рады поделиться новостью: 6–7 июня пройдёт Weekend Offer Analytics. Сейчас мы ищем аналитиков с опытом от 3 лет на Python в Москве и Петербурге, готовых к работе в офисе или гибридном формате.
📆 Регистрируйтесь до 12:00 мск 27 мая, проходите всего две секции вместо трёх в обычном найме и получите офер, если всё пройдёт успешно.
Подписывайтесь:
💬 @Yandex4Analytics
8 745
🐚 Ответили на вопросы подписчиков
Недавно мы собрали вопросы от аналитиков, чтобы ответить на самые интересные из них в подкасте «Доверительный интервал». Для нового выпуска мы выбрали 10 самых интересных, которые ведущие Саша, Ксюша и Дима обсудили вместе с гостем выпуска. Да, теперь у нас будут гости, и первым из них стал Рома Васильев — руководитель международного Поиска.
📺 Смотрите в выпуске:
🔵 Что учить, если есть всего один час в день
🔵 Как без опыта в А/В вкатиться в команду, которая проводит A/B-тесты
🔵 Чем хороший аналитик отличается от плохого
⏭️ Ответы на эти и другие вопросы уже на ютубе, в VK Видео и Яндекс Музыке.
Подписывайтесь:
💬 @Yandex4Analytics
8 745
⏬ Когда метрики сходят с ума: автоматические детекты инцидентов в Monium
В инфраструктуре Яндекса работают тысячи микросервисов, которые каждую секунду генерируют миллионы метрик: от процента ошибок API и потребления памяти до времени ответа. Все они хранятся и обрабатываются в общеяндексовой системе Monium. Эти значения мы представляем как временные ряды, чтобы видеть происходящие изменения в динамике.
Для детекта аномалий — резких отклонений от метрик — в системе Monium существует механизм алертов. Скачок времени ответа может предвещать перегрузку сервиса, необычное падение конверсии — намекать на поломку в UI и так далее.
Пороговые алерты работают по принципу «если RPS выше 1000 — отправить уведомление дежурному». Но вот проблема: почему порог именно 1000? Как учесть праздники, сезонность, время суток? Что делать, если поведение метрики меняется?
Поэтому нужна автоматическая детекция аномалий. Система должна анализировать исторические данные, запоминать нормальные паттерны поведения и определять статистически значимое отклонение.
🈂️ Но универсального решения не существует
Чтобы выбрать оптимальный подход к автоматизации, мы ориентировались на результаты тестов алгоритмов на датасетах с размеченными аномалиями. Мы использовали шесть публичных датасетов — всего 834 ряда.
Каждый из них подаётся в детектор. Модель анализирует ряд и возвращает степень аномальности для каждой точки — anomaly-score. Далее рассчитываются метрики качества детекции. За основу берём anomaly-score и эталонную разметку.
При этом в качестве основной метрики качества мы рассматривали величину F1-best, которая вычисляется как наилучшая F1-мера по всем возможным порогам.
🈂️ Как выяснилось, тяжёлые и сложные модели часто проседают по качеству детекции
Простые алгоритмы нередко превосходят тяжеловесные архитектуры. В итоге мы остановились на двух лёгких и предсказуемых детекторах:
🔵 Авторегрессия — легко учить в рантайме, немного гиперпараметров, отличный выбор для метрик без чёткой сезонности
🔵 MEDIFF — хорошо засекает негладкие паттерны и подходит для ярко выраженных сезонных рядов
🈂️ Переходим к практике
В качестве испытательного полигона для умных алертов мы выбрали Яндекс Такси. Для пилота взяли 46 ключевых регионов по объёму GMV и количеству ежедневных поездок. На каждый из них настроили алерты по четырём критическим метрикам:
🔵 created — общее количество созданных заказов
🔵 assigned — те, в которых назначен водитель
🔵 found_share — доля заказов, в которых был найден исполнитель
🔵 seen_timeout — заказы, которые мы не успели предложить водителю
Вот что мы поняли:
🔵 Одиночная аномальная точка редко означает инцидент. Для дежурного важнее не разовый выброс, а устойчивое отклонение
🔵 Для разных метрик важно учитывать направление аномалии. Резкий рост числа заказов не обязательно говорит о проблеме в сервисе — это может быть дождь, снегопад или локальное событие. А вот рост seen_timeout или падение found_share уже гораздо больше похожи на ситуацию, требующую реакции
🔵 Уровень естественного шума различается от города к городу. То, что для крупного региона выглядит как нормальная флуктуация, для небольшого города может быть заметным отклонением, и наоборот
После калибровки и доработки механизм прекрасно справился с обнаружением аномалий в дикой природе. Сейчас мы переносим подход на доступность тарифов, количество водителей на линии и готовим интеграцию с системами анализа инцидентов на основе LLM.
⏭️ А больше о детекции аномалий читайте на Хабре. Там мы рассказываем, как стабилизировали авторегрессию, адаптировали дисперсию для MEDIFF и оценивали качество детекторов.
Подписывайтесь:
💬 @Yandex4Analytics
8 745
🤩 3 главных фактора для роста
Как подготовиться к повышению? Какие типичные ошибки совершают аналитики в процессе развития карьеры? В чём реальная разница между лидами и сеньорами?
🎙 В новом выпуске подкаста «Доверительный интервал» ведущие Дима, Ксюша и Саша разобрали:
🔵 Как поговорить с руководителем о повышении
🔵 Сколько времени занимает рост до сеньора
🔵 Чем ответственность за свои задачи похожа на мытьё посуды
⏭️ Смотрите на ютубе и в VK Видео или слушайте в Яндекс Музыке.
А на какой вы сейчас позиции и сколько занял ваш рост? Пишите нам в комментариях 👇
Подписывайтесь:
💬 @Yandex4Analytics
8 745
⏬ Из экономической теории в Антифрод Яндекса
👨💻 Всем привет, меня зовут Далер Джабборов, я старший аналитик-разработчик в команде Антифрода. Я рос в то время, когда экономическая парадигма менялась буквально на глазах. Спрятаться было негде — вот и получилось, что я заинтересовался всем этим ещё в детстве 😃
Я поступил в экономико-математическую школу при МГУ, а потом и в сам университет. В программе была сильная математическая база и большой спектр теоретических направлений. На третьем курсе я начал заниматься политической экономией, а продолжил уже в аспирантуре, где получил степень кандидата наук. Тема моей кандидатской — «Трансформация отношений товарного производства под влиянием креативного труда». Это достаточно специфичное направление со своими особенностями ценообразования и мотивации.
Я продолжил изучать креативный труд в Институте экономики РАН, а параллельно преподавал дисциплины в РАНХиГСе и Финансовом университете. К слову, тогда мы с группой коллег изучали деглобализацию (ещё до того, как это стало мейнстримом) и опубликовали монографию. И вот тут-то мне и пришлось поизучать и Python, и R, и аналитику данных.
Меня очень заинтересовала тема машинного обучения. Во время исследований мне нужно было строить модели в контексте планирования производства, оптимизации цепочек поставок, прогнозирования спроса.
🈂️ В конечном счёте ML перетянул меня в Data Science
Мне хотелось видеть больше осязаемых результатов моей работы. В теоретической науке они становятся заметны очень нескоро, поэтому я перешёл в IT: окончил несколько курсов по Data Science, поучаствовал в соревнованиях и решил начать ходить на собеседования.
В итоге через пару месяцев устроился в маркетинговую платформу Flocktory, где занимался ранжированием и прогнозированием отклика клиентов. У нас была небольшая команда, и мы напрямую влияли на бизнес: модели выкатывались в прод практически сразу, а уже через пару дней было видно, сколько денег приносили наши решения.
После этого я занимался прогнозированием цен на недвижимость в компании «Домклик». Тут экономический бэкграунд помогал находить инсайты и строить дополнительные фичи.
🈂️ А теперь я работаю в Антифроде Яндекса
Мне нравится, что в этом проекте есть прикладная ценность, социальная сторона и интересная интеллектуальная составляющая. Мы помогаем пользователям защищаться от мошенников, а командам — очищать сервисы от фрода, точнее считать метрики и улучшать рекомендательные системы.
🈂️ Экономика и аналитика
Их объединяет особый склад мышления: нужно хотеть и уметь погружаться в данные, глубоко копать, видеть причинно-следственные связи, искать нужные подходы. И математическая база у них общая. Так что экономический бэкграунд всегда со мной и помогает мне постоянно (пускай часто и неосознанно).
Ещё аналитику и экономику объединяет желание предсказывать. Но у них присутствует и общий предел: даже с учётом развития нейросетей и рекомендательных систем, предугадывать движение общества, его мотивы и поведение очень сложно. Так что аналитика, как и экономика, — это не просто математика.
Когда я только пришёл в IT, мне хотелось параллельно оставаться и в науке. К сожалению, так у меня не получилось: на всё вместе не хватает времени. Но я не закрываю для себя эту дверь: идея вернуться в науку с накопленным практическим опытом всегда лежит в моём мысленном бэклоге.
Подписывайтесь:
💬 @Yandex4Analytics
8 745
🧑💻 На Analytics Party было жарко!
На прошлой неделе в нашем офисе в Санкт-Петербурге мы собрали больше 120 аналитиков, чтобы вместе послушать доклады о сложных продуктовых и исследовательских задачах.
После этого на афтерпати обсудили работу AI-агентов, разметку событий мобильных приложений, тестирование без A/B и аналитику качества технологий. Было так огненно, что даже пожарная тревога не выдержала 🔥
🗳 Спасибо, что провели этот вечер четверга с нами!
📷 Ищите себя на фото по ссылке.
📺 Записи докладов уже доступны на YouTube и в VK Видео.
Подписывайтесь:
💬 @Yandex4Analytics
8 745
🎲 Сыграем в игру с кубиком?
Майские уже не за горами! В преддверии праздников мы принесли вам немного полезных квестов, которые можно выполнить в свободное время. А какой из них достанется вам — решит удача:
🔵 Бросайте кубик 🎲 в комментах
🔵 Запоминайте результат
🔵 Открывайте спойлер для выпавшего числа
🔵 Держите квест на выходные 📝
⬇️ Список заданий
1️⃣ Послушать подкаст «Доверительный интервал». Награда: 500 XP и клад лайфхаков, которые помогут справиться со срочными задачами
2️⃣ Почитать настольные книги аналитика. Награда: 1000 XP и сундук с классикой о системном анализе, математике и подходах к метрикам: тут подборка 2025-го, а здесь — 2026-го
3️⃣ Выяснить, как поставить эксперимент без A/B-теста. Награда: 500 XP и новое заклинание — Propensity Score Matching
4️⃣ Порешать задачки. Награда: 300 XP и +1 к теории вероятностей. А если войдёте во вкус — переходите по хештегу #задачи_для_аналитиков
5️⃣ Посмотреть доклады с Data Driven 2025. Награда: 500 XP и способность трансмутировать данные в артефакты и инсайты. Плейлисты по трекам: Data to Artifacts (ютуб и VK Видео), Data to Insights (ютуб и VK Видео)
6️⃣ Завести пет-проект. Награда: 1000 XP и верный компаньон, который поможет в приключениях (и в поиске работы квестов, за которые платят голдой 💰)
Подписывайтесь:
💬 @Yandex4Analytics
8 745
+5
☁️ Как перестать выгорать к обеду
Часто кажется, что главный ограничивающий ресурс в работе — это время. Но на самом деле бутылочным горлышком нашей эффективности является концентрация и способность принимать решения. Наш мозг эволюционировал в те времена, когда ещё не существовало бесконечных уведомлений и видеозвонков. И он просто не успел адаптироваться к современным нагрузкам.
👳 Мы собрали несколько советов, которые помогут вам сберечь драгоценный ментальный ресурс, успевать больше и чувствовать себя лучше. Читайте их в карточках выше.
⏬ Дополнительные материалы
Об усталости и восстановлении:
🔵 Статья The restorative power of small habits. Рассуждения о важности микроперерывов
🔵 Книга Тони Шварца The way we are working isn’t working. Фундаментальный труд об управлении энергетическими ресурсами, а не временем
🔵 Исследование Nature exposure and cognitive performance. Научные данные о влиянии природы на когнитивные функции
О коммуникациях и фокусе:
🔵 «Почему важно отвечать не сразу». Разбор культурных установок, которые мешают глубокой работе
🔵 «А они же ждут!». Телеграм-пост о вреде реактивного режима работы
О видеозвонках и самопрезентации:
🔵 Zoom fatigue and the curse of the self-view. Анализ психологических причин усталости от видеоконференций
Подписывайтесь:
💬 @Yandex4Analytics
8 745
🤔 Хард-навыки vs аналитическое мышление
В четвёртом выпуске подкаста «Доверительный интервал» разбираем, что важнее для современного аналитика: глубокое знание инструментов или аналитическое мышление.
🎙 Ведущие — Дима, Ксюша и Саша — поделились своим бэкграундом образования и навыками, которые им помогли вкатиться в аналитику, а также обсудили:
🔵 Нужно ли учить Python и SQL в 2026 году
🔵 Зачем на собеседованиях спрашивают формулы из матстата
🔵 Почему Excel не теряет свою актуальность
🔵 Кто ценнее для бизнеса: профессионал в одной области или T-shaped-специалист
⏭️ Смотрите новый выпуск на ютубе и в VK Видео или слушайте в Яндекс Музыке.
Подписывайтесь:
💬 @Yandex4Analytics
8 745
🗳 Как сделать нетворкинг полезным
Нетворкинг — это системная работа с людьми: знакомства, связи и общее понимание, кто чем занимается и где вы можете быть полезны друг другу. В этом посте разберём, как делать это с пользой для карьеры и жизни.
🈂️ Самое важное правило
Общайтесь с теми, кто вам интересен. Находите удовольствие в том, чтобы узнавать других людей. Так вы сделаете нетворкинг нативным, а это помогает выстроить тёплую и крепкую связь с человеком.
🈂️ Знакомства — это не единственный результат общения
Если хорошо понимаешь людей, то начинаешь подмечать их сильные и слабые стороны. Это помогает:
🔵 Грамотно распределять задачи
🔵 Понимать, к кому с каким вопросом можно обратиться
🔵 Находить подход к каждому человеку, в том числе в нерабочих ситуациях
🈂️ Как вкатиться в нетворкинг, если никогда не пробовал
Начните с команды и смежников — людей, с которыми вы регулярно взаимодействуете. Нетворкинг можно найти в офисе, на тематических тусовках, конференциях, митапах и в соцсетях. Главное — не бойтесь завязать разговор!
🈂️ Какие инструменты вам помогут
🔵 Рандомный кофе: чтобы быстро находить нужных собеседников через бота
🔵 Чаты и сообщества: чтобы залететь в тематическое комьюнити и попросить совет
🔵 Elevator speech: чтобы сразу понять темы для разговора
🔵 Календарь мероприятий: чтобы быть в курсе, где найти нужных людей
🔵 Организация контактов: чтобы помнить не только ФИО, но и факты и интересы
🔵 Артефакты: чтобы вы открывали переписку и видели селфи или кружок, которые напомнят контекст знакомства
🔵 Смол-ток: чтобы поболтать у кофепойнта и заложить первый кирпичик в фундаменте сотрудничества
🔵 Напоминание о себе: чтобы скинуть полезный материал или спросить, как дела, и поддержать контакт
🈂️ О чём стоит помнить
🔵 Не будьте навязчивым. Даже открытых людей можно отпугнуть
🔵 Не нужно усложнять коммуникацию. Если хочется что-то узнать, лучше просто спросить
🔵 Вопросы можно задавать любому, и неважно, какая у человека должность. Это культура Яндекса, и это правило записано в наших генах
♾ Что, если вы задали кому-то вопрос в личку, а вам не ответили
Такое бывает. Это нормально. Человек может быть занят, а вопрос — непонятен.
Правильным формулировкам тоже стоит учиться. Но тот, кто вообще ничего не спрашивает, никогда не получит никаких ответов.
Подписывайтесь:
💬 @Yandex4Analytics
8 745
🐚 Аналитический Q&A: задайте вопрос, пока никто не видит
Есть вопросы, которые крутятся в голове, но обсудить их с руководителями и коллегами как-то неловко.
✨ Задайте их нашим ведущим подкаста «Доверительный интервал».
В новом выпуске мы ответим на вопросы и разберём реальные ситуации, которые волнуют аналитиков в работе и карьере.
Спрашивайте всё, что волнует:
🔵 Карьера и актуальные направления роста в 2026-м
🔵 Сложные рабочие ситуации, из которых непонятно как выбраться
🔵 Взаимодействие с командой и бизнесом
🔵 Всё, о чём обычно молчат, но думают
🎙 Самые интересные вопросы разберём в эфире.
⏭️ Заполняйте форму — всё анонимно!
Подписывайтесь:
💬 @Yandex4Analytics
8 745
🛎 Приходите на вечеринку для аналитиков
23 апреля мы собираемся в Санкт-Петербурге на вечернем митапе для аналитиков. На этот раз поговорим о решениях сложных продуктовых и исследовательских задач — от оценки безопасности автопилота до экспериментов без A/B-тестов. Разберём реальные кейсы, где данные, модели и продуктовые решения пересекаются.
Спикеры и доклады:
🔵 Елмурат Темиргалиев, руководитель группы сбора датасетов команды Автономного транспорта Яндекса, расскажет, как статистически доказать безопасность системы и сократить годы тестов до одной недели с помощью симуляции и бережливой дедупликации сцен
🔵 Тимур Шаймуханов, аналитик-разработчик команды алгоритмов ценообразования Яндекс Такси, расскажет о согласованном ценообразовании тарифов в сервисе и о том, как учёт состояния маркетплейса «Комфорта» помог снизить цены в «Экономе» и повысить эффективность платформы
🔵 Иван Меренков, аналитик команды Data AI Lab Яндекса, поделится личным опытом сборки команды AI-агентов для эффективной повседневной работы
🔵 Николай Олигеров, аналитик-разработчик Яндекс Путешествий, расскажет, чем заменить A/B-тесты, когда они невозможны: обсудим применение propensity score matching и проверку результатов
⏭️ Переходите на сайт, чтобы узнать больше о программе и зарегистрироваться!
💠 До встречи на Analytics Party!
Подписывайтесь:
💬 @Yandex4Analytics
8 745
🎙 Зачем ставить цели, если всё поменяется?
Как планировать работу, когда рынок штормит, а «чёрные лебеди» прилетают один за другим? Разбираем, почему постановка целей часто превращается в головную боль.
В этом выпуске ведущие — Дима, Ксюша и Саша — обсудили, как ставить цели с учётом постоянно меняющихся вводных, как к этому подходят разные команды Яндекса и почему ставить цели, на самом деле не так страшно.
⏭️ Смотрите полный выпуск на ютубе и в VK Видео или слушайте в Яндекс Музыке
Подписывайтесь:
💬 @Yandex4Analytics
Available now! Telegram Research 2025 — the year's key insights 
