en
Feedback
Yandex for Analytics

Yandex for Analytics

Open in Telegram

Канал для аналитиков от Яндекса. Рассказываем о событиях, обсуждаем кейсы, знакомимся с командами и внимательно смотрим на данные. Чат: t.me/YandexDataDriven Вопросы: @Ekaterina_Lyagina Все каналы Яндекса по стекам: https://t.me/addlist/Hrq31w2p1vUyOGZi

Show more
8 925
Subscribers
+124 hours
+587 days
+21330 days
Posts Archive
🧠 Как руководителю правильно подбирать состав команды? Есть разные способы построить сильный коллектив. Можно искать людей, похожих друг на друга, а можно — тех, кто дополняет коллег и усиливает команду. 🎙 Об этом и не только поговорили с Михаилом Эюбовым, новым CDO Яндекс Лавки, в последнем выпуске «Доверительного интервала». Обсудили: 🔵 как понять, когда пора становиться лидом; 🔵 каким образом выстраивать химию в команде; 🔵 должен ли руководитель быть сильным аналитиком. 📺 Смотрите на ютубе и в VK Видео, слушайте в Яндекс Музыке. Подписывайтесь: 💬 @Yandex4Analytics

🍫 Как устроены А/B-тесты в Лавке В продуктовой аналитике Лавки проводятся десятки A/B-тестов в неделю. Но чтобы понять, что
🍫 Как устроены А/B-тесты в Лавке В продуктовой аналитике Лавки проводятся десятки A/B-тестов в неделю. Но чтобы понять, что получилось в итоге, нужно много времени, часть которого съедает рутина. В этом посте мы покажем несколько простых пунктов, которые помогли значительно ускорить работу аналитиков с экспериментами. ⏬ Единая база всех А/B-тестов Наша очередь в трекере LavkaAB — это реестр, который хранит: 🔵 Запущенные тесты и выводы по ним 🔵 Проблемные А/B 🔵 Тесты, готовящиеся к запуску в будущем ⏬ Создание тикетов через форму Дерево решений и набор метрик в тикете проставляются автоматически. Например, для экспериментов с поиском в Лавке у нас такой набор метрик: 🔵 GMV товаров, купленных из поиска 🔵 Глубина доскролла 🔵 Конверсия из поисковой сессии в добавление в корзину 🔵 Доля запросов с добавлением в корзину 🔵 Число поисковых запросов с пустой выдачей ⏬ Что нужно прикладывать к тикету 🔵 Описание изменения: визуальное, техническое, в каких частях приложения, для какой группы пользователей 🔵 Гипотеза и ответ на вопрос «Зачем?»: например, если пользователи будут видеть в поиске переключалку на AI-режим, то им начнут больше пользоваться 🔵 Пространство в приложении: поиск, рекомендации, каталог. Это нужно, чтобы коллеги понимали, что изменение может коснуться и их экспериментов тоже ⏬ Автопроверка наблюдений и метрик Если метрики прокрашиваются — AI-модель сигнализирует о самом важном и отправляет алерты. Раньше мы могли заметить проблему через пару недель, а теперь оперативно подхватываем все ошибки. ⏬ AI в анализе А/B-теста Когда эксперимент завершается, модель автоматически собирает из тикета гипотезу, дерево решений и ссылки c рассчитанными метриками на АБшнице — нашей A/B-платформе. Затем модель формирует ответ по интегральному и целевому наблюдению и дополняет его аномалиями — нетипичными приростами или падениями метрик. Далее AI связывает всё в общую картину в таком духе: «Мы изменили экран N, его метрики изменились, пользователи начали переходить на другой, суммарные изменения дают положительный эффект». Человеку остаётся проверить и отредактировать выводы. ⏬ В итоге мы: 🔵 Сократили время аналитиков на анализ одного эксперимента с 1 рабочего дня до 1 часа 🔵 Организовали быстрый вход в A/B для продакт-менеджеров: теперь тесты запускает в два раза больше продактов 🔵 Снизили число ошибок по запущенным экспериментам Подписывайтесь: 💬 @Yandex4Analytics

🤨 Руководитель = самый сильный аналитик? Или руководителю необязательно быть центром технической экспертизы? Как меняется уровень ответственности, стресса и круг задач на разных ступенях — от первой лид-позиции до CDO? 🎙 В новом выпуске подкаста «Доверительный интервал» вместе с новым CDO Яндекс Лавки Михаилом Эюбовым обсудили, как понять, что пора идти в руководство (и стоит ли), как сохранить сильную экспертность и что самое сложное в работе руководителя аналитики. ⏭️ Смотрите на ютубе и в VK Видео, слушайте в Яндекс Музыке. Подписывайтесь: 💬 @Yandex4Analytics

🧠 Как в Спамообороне Яндекс Почты обучали детектор логотипов На связи Никита Подледнев, ML-инженер в Спамообороне Яндекс Поч
+8
🧠 Как в Спамообороне Яндекс Почты обучали детектор логотипов На связи Никита Подледнев, ML-инженер в Спамообороне Яндекс Почты. Однажды мы столкнулись с проблемой картиночного спама: в нём рекламировались назойливые онлайн-казино и использовались логотипы известных брендов, чтобы вводить пользователей в заблуждение. ⏬ Существующие методы не всегда справлялись с такими атаками, поэтому мы решили разработать новый подход. Сегодня я расскажу, как мы научились бороться с картиночным спамом с помощью детектора логотипов. 👳 Читайте в карточках Подписывайтесь: 💬 @Yandex4Analytics

🧑‍💻 Признаки в рантайме без тикетов разработчикам: как мы построили Avalon Меня зовут Паша Попов, я руковожу группой разраб
🧑‍💻 Признаки в рантайме без тикетов разработчикам: как мы построили Avalon Меня зовут Паша Попов, я руковожу группой разработки технологий эффективности Такси. В этом посте я расскажу про Avalon — наш Feature Store. Он позволяет хранить пользовательские признаки любой структуры и получать их из рантайма с задержкой в миллисекунды — без тикетов команде разработки. 🈂️ Всё началось с задачи: «Раз в сутки мы размечаем атрибуты пользователей. А дальше, в рантайме, хотим принимать решения в зависимости от того, проставлен атрибут на пользователя или нет». 🈂️ Что нам нужно было сделать: Дать сервисам универсальный способ получать обновляемые данные с низкой latency без участия разработчиков или других команд. 🔍 Что было до Avalon В Городских сервисах уже существовал сервис на PostgreSQL для бинарных признаков. Аналитики использовали его для экспериментальной разметки аудитории: смотрели на результат, а затем заказывали нормальную доработку в нужном продукте. ♾ Инструмент быстро стал популярным и с ростом аудитории столкнулся с двумя ограничениями: 1️⃣ Пользователи хотели загружать всё больше данных. PostgreSQL нельзя масштабировать автоматически — каждый раз нужна операция с участием инженеров 2️⃣ Признаки — только бинарные: «есть» или «нет». Хранить количество поездок водителя или сумму заказов клиента невозможно 🈂️Так появился Avalon Мы создали инструмент с тремя ключевыми принципами: 🔵 Любой тип данных. Бинарный флаг, число, структура с любой глубиной вложенности — схему описывает сам аналитик 🔵 Масштабирование без участия команды. Если нужно больше данных — просто принесите их. Под капотом YDB берёт шардирование на себя 🔵 Реестр признаков. Видно, кто потребляет каждый признак в рантайме, с каким объёмом нагрузки, как долго он должен жить 🈂️Как аналитик работает с системой Разработчик один раз описывает логическую схему данных и настраивает интеграцию. После этого аналитики сами обновляют наборы признаков — никаких согласований с другими командами. Данные приходят из YT-таблицы. Внешний сервис считает разницу между текущим состоянием и новым набором, а Avalon загружает изменения батчами и записывает прогресс, чтобы при сбое продолжить с нужного места. После загрузки признак доступен через эндпойнт fetch. Сервис запрашивает конкретный атрибут по идентификатору: /service-general/123/features/with_attribute Или весь набор признаков по одному ID: /service-general/123/features 🈂️ CDC: история изменений для аналитики Для аналитических задач Change Data Capture — одна из самых ценных функций. Часто важно знать не только актуальное значение признака, но и его историю: когда и что поменялось, каким оно было раньше, кто инициировал изменение. Например, есть сервис, который хранит текущий размер скидки для каждого пользователя. Аналитику нужна полная картина: когда цифра росла, когда падала, что на неё влияло. Механизм фиксирует каждое изменение в потоке событий с метаданными: старое и новое значение, метку времени, контекст запроса. Подписчики топика получают эти события и строят на их основе любую аналитику. 🈂️ Жизненный цикл признака В реестре видно, кто потребляет каждый признак, кому он нужен и с каким RPS. Удаление происходит безопасно и предсказуемо — с этим и помогает явный контроль над жизненным циклом данных в системе. Результат Сейчас в системе хранится около 3 Тб данных и 6,5 млрд ключей. Всего используется 2048 шардов YDB. Нагрузка — 100 000 RPS на чтение, 30 000 RPS на запись, при этом задержка в P95 — около 5 мс. Главное — после первичной настройки аналитики добавляют данные самостоятельно. На дежурство разработчиков крупные запуски не влияют: мониторинг молчит, система справляется. ⏭️ Все технические подробности: устройство YDB, шардирование, механизм CDC и схемы данных — в статье на Хабре. Подписывайтесь: 💬 @Yandex4Analytics

🍔 Как мы показываем пользователям выгоду в Яндекс Еде Привет! Меня зовут Ингвар Сильницкий, я руковожу продуктовой аналитико
🍔 Как мы показываем пользователям выгоду в Яндекс Еде Привет! Меня зовут Ингвар Сильницкий, я руковожу продуктовой аналитикой в Яндекс Еде. Моя главная задача — следить за целостностью продуктовой воронки: вовремя находить проблемы и делать так, чтобы выбор заведения и блюда был для пользователя быстрым и приятным. Сегодня расскажу про один интересный кейс. В какой-то момент команда Еды решила запустить сквозную дистрибуцию скидок — транслировать выгоду пользователю на каждом этапе воронки, чтобы он видел максимально привлекательные условия для заказа. А что получилось в итоге — читайте ниже. 🈂️ Элементы, которые подсвечивают выгоду для пользователя В приложении Еды таких фич несколько. В каталоге заведений мы показываем: 🔵 Бейджи на карточке места. Рассказывают про скидки на меню 🔵 Чипсы. Показывают условия доставки А внутри заведения пользователь видит: 🔵 Информеры. Подсвечивают все актуальные скидки на меню — от Еды и от партнёра 🔵 Футер с прогресс-баром. Показывает скидку на доставку или то, сколько нужно добрать, чтобы она стала бесплатной 🈂️ Мы хотели показывать выгоду на каждом этапе максимально прозрачно После разработки мы перешли к тестированию — и сразу получили холодный душ. Результаты по основным метрикам оказались красными. Гипотеза казалась железной: чем прозрачнее показываешь пользователю выгоду, тем выше конверсия в заказ. Начали разбираться. Разделили аудиторию на сегменты и обнаружили, что в разных сценариях тест вёл себя неодинаково: в одном был рост заказов, в другом эффект отсутствовал, а в третьем мы просели по основной метрике. 🈂️ Начали искать, чем сегменты отличаются друг от друга Быстро нашли базовый критерий — количество заказов на сервисе за последний период. Спустились глубже и начали разбираться, как пользователи вообще доходят до выбора заведения. Мы разделили сценарии на два типа: 🔵 Исторический. Знакомое пользователю место, в котором он уже что-то заказывал 🔵 Дискавери. Новое для пользователя заведение Мы знаем, что в исторических местах конверсия в заказ выше. Пользователь заранее понимает, чего ожидать. Но дальше стало интереснее — оказалось, что количество заказов напрямую влияет на то, как люди пользуются приложением: 🔵 Частотники хорошо ориентируются внутри 🔵 Редкие пользователи легко теряются 🈂️ Картина начала проясняться Скидки — мощный инструмент вовлечения. Чем ярче они подсвечены, тем лучше пользователь их замечает и тем сильнее они его магнитят — даже туда, куда без скидки он изначально бы не зашёл. Нередко получалось так, что яркий бейдж заводил пользователя именно в незнакомое ему ранее заведение. А конверсия в таких местах, как мы уже знаем, значительно ниже. 🈂️ Почему это критично Внимание пользователя не бесконечно. Особенно когда он голоден и хочет сделать заказ как можно быстрее. У нас же получилась система, которая тратила этот ресурс на нерелевантные заведения: пользователь заходил не туда, не находил то, что хотел, — и уходил без заказа. В итоге мы стали показывать скидки по-разному в зависимости от сегмента пользователя. Персонализировали и размер бейджа, и то, в каких заведениях он вообще отображается. Для этого с ML-командой мы вытащили ключевой сигнал — коэффициент вероятности покупки в конкретном месте для конкретного пользователя. 🈂️ В результате — рост заказов Сейчас мы адаптируем решение дальше: формируем понятные продуктовые сегменты, в которых видим разное поведение пользователей внутри приложения. А объяснять, почему оно именно такое, мы уже умеем. Подписывайтесь: 💬 @Yandex4Analytics

От выбора удобной IDE зависит скорость работы и удовольствие от неё.

CLI-агенты помогают разработчикам писать код и напрямую взаимодействуют с файлами проектов.

Сейчас LLM вовсю автоматизируют рутину и внедряются в рабочие процессы.

🤨 А точно ли я всё делаю правильно? Работу аналитика сложно оценить по результату здесь и сейчас: она часто не приводит к «в
🤨 А точно ли я всё делаю правильно? Работу аналитика сложно оценить по результату здесь и сейчас: она часто не приводит к «видимому эффекту», и из-за этого легко начать сомневаться в себе. В новом выпуске «Доверительного интервала» ведущие разбираются: 🔵 Как справляться с синдромом самозванца 🔵 Что даёт понять, что ты правда хорошо работаешь 🔵 Как отвлекаться от задач правильно (нет, скроллинг ленты не считается) 🔵 Почему даже сильные специалисты продолжают сомневаться в себе 🎙 В этот раз в гостях Маша Медведева, аналитик-разработчик Техплатформы Городских сервисов. ⏭️ Смотрите на YouTube и в VK Видео, слушайте в Яндекс Музыке. Подписывайтесь: 💬 @Yandex4Analytics

🧠 Готовые датасеты: почему они важнее, чем могут казаться Для начинающих аналитиков и ML-специалистов это отличная тренировк
+5
🧠 Готовые датасеты: почему они важнее, чем могут казаться Для начинающих аналитиков и ML-специалистов это отличная тренировка навыков. Готовые датасеты позволяют быстро проверить идею, собрать воспроизводимый пример, сравнить методы на нейтральной территории и отладить пайплайн без доступа к продовым или персональным данным. ⏬ Датасеты можно разделить по классам источников: 🔵 Kaggle, OpenML. Для сравнения методов, baseline и быстрого эталонного пайплайна 🔵 Hugging Face Datasets, TensorFlow Datasets. Для NLP/CV/Audio и быстрого старта 🔵 BigQuery Public Datasets, Registry of Open Data on AWS, Azure Open Datasets. Для SQL-анализа в больших объёмах 🔵 Common Crawl, Wikimedia Dumps, Stack Exchange Data Dump. Для работы с масштабными текстовыми корпусами 🔵 Data.gov, World Bank Open Data, Eurostat Database. Для надёжных временных рядов 🔵 OpenStreetMap, OpenAlex, NOAA. Для геоданных, анализа климата и графов Кстати, ссылки на все эти датасеты вы можете найти в комментариях 😉 👳 А ещё мы сделали для вас чек-лист, который поможет выбрать датасет и не наступить на грабли. Подробности — в карточках выше Этот пост нам помог подготовить Александр Вальд, старший эксперт и академический руководитель магистратур по аналитике данных в Яндекс Практикуме. Заглядывайте в его канал Thinking Face. Там он вместе с коллегами рассказывает про исследования в маркетинге и data-driven-аналитику 📊 Подписывайтесь: 💬 @Yandex4Analytics

🚕 Динамическое ценообразование в Такси и как мы его строили Привет, это Тимур Шаймуханов, аналитик-разработчик в группе алго
+5
🚕 Динамическое ценообразование в Такси и как мы его строили Привет, это Тимур Шаймуханов, аналитик-разработчик в группе алгоритмов ценообразования. Одна из ключевых метрик в Такси — эффективность платформы. Это доля времени, которую водитель проводит в машине с пассажиром, от всего рабочего дня. В идеальном мире вместе с исполнителем всегда должен быть клиент. ♾ Но раньше у нас была проблема: спрос пользователей мог концентрироваться в каком-то конкретном тарифе. И когда такое происходило, остальным водителям приходилось пересаживаться на него — или тратить время в ожидании заказов. Чтобы исправить эту проблему, мы научили «Эконом» и «Комфорт» работать согласованно — и в итоге повысили эффективность всего сервиса. 👳 Читайте в карточках, как у нас это получилось Подписывайтесь: 💬 @Yandex4Analytics

🤔 Почему «серые» результаты в экспериментах нужны Иногда тесты показывают «серые» результаты, но при этом бизнес продолжает настаивать на развитии продукта. Порой причина в том, что результаты отражают текущие состояния и решения, которые могут измениться при развитии продукта и его дальнейшей стратегии. 🎙 Мы ответили на этот и многие другие вопросы подписчиков в шестом выпуске подкаста «Доверительный интервал». В этот раз к нам в гости пришёл Роман Васильев, руководитель аналитики международного Поиска. ⏭️ Смотрите на ютубе, в VK Видео и слушайте в Яндекс Музыке. Подписывайтесь: 💬 @Yandex4Analytics

🧑‍💻 Какие метрики помогают повышать качество ответов LLM На связи Иван Дёгтев, руководитель службы аналитики Alice AI LLM.
+8
🧑‍💻 Какие метрики помогают повышать качество ответов LLM На связи Иван Дёгтев, руководитель службы аналитики Alice AI LLM. Наша миссия — научить модель решать самые разнообразные задачи и при этом сохранить баланс между главными метриками качества ответов. 👳 В карточках я рассказываю, как мы его оцениваем и какие трудности преодолеваем в процессе ⏭️ А если вас заинтересовала работа нашей команды, то мы рады поделиться новостью: 6–7 июня пройдёт Weekend Offer Analytics. Сейчас мы ищем аналитиков с опытом от 3 лет на Python в Москве и Петербурге, готовых к работе в офисе или гибридном формате. 📆 Регистрируйтесь до 12:00 мск 27 мая, проходите всего две секции вместо трёх в обычном найме и получите офер, если всё пройдёт успешно. Подписывайтесь: 💬 @Yandex4Analytics

🐚 Ответили на вопросы подписчиков Недавно мы собрали вопросы от аналитиков, чтобы ответить на самые интересные из них в подкасте «Доверительный интервал». Для нового выпуска мы выбрали 10 самых интересных, которые ведущие Саша, Ксюша и Дима обсудили вместе с гостем выпуска. Да, теперь у нас будут гости, и первым из них стал Рома Васильев — руководитель международного Поиска. 📺 Смотрите в выпуске: 🔵 Что учить, если есть всего один час в день 🔵 Как без опыта в А/В вкатиться в команду, которая проводит A/B-тесты 🔵 Чем хороший аналитик отличается от плохого ⏭️ Ответы на эти и другие вопросы уже на ютубе, в VK Видео и Яндекс Музыке. Подписывайтесь: 💬 @Yandex4Analytics

⏬ Когда метрики сходят с ума: автоматические детекты инцидентов в Monium В инфраструктуре Яндекса работают тысячи микросервис
Когда метрики сходят с ума: автоматические детекты инцидентов в Monium В инфраструктуре Яндекса работают тысячи микросервисов, которые каждую секунду генерируют миллионы метрик: от процента ошибок API и потребления памяти до времени ответа. Все они хранятся и обрабатываются в общеяндексовой системе Monium. Эти значения мы представляем как временные ряды, чтобы видеть происходящие изменения в динамике. Для детекта аномалий — резких отклонений от метрик — в системе Monium существует механизм алертов. Скачок времени ответа может предвещать перегрузку сервиса, необычное падение конверсии — намекать на поломку в UI и так далее. Пороговые алерты работают по принципу «если RPS выше 1000 — отправить уведомление дежурному». Но вот проблема: почему порог именно 1000? Как учесть праздники, сезонность, время суток? Что делать, если поведение метрики меняется? Поэтому нужна автоматическая детекция аномалий. Система должна анализировать исторические данные, запоминать нормальные паттерны поведения и определять статистически значимое отклонение. 🈂️ Но универсального решения не существует Чтобы выбрать оптимальный подход к автоматизации, мы ориентировались на результаты тестов алгоритмов на датасетах с размеченными аномалиями. Мы использовали шесть публичных датасетов — всего 834 ряда. Каждый из них подаётся в детектор. Модель анализирует ряд и возвращает степень аномальности для каждой точки — anomaly-score. Далее рассчитываются метрики качества детекции. За основу берём anomaly-score и эталонную разметку. При этом в качестве основной метрики качества мы рассматривали величину F1-best, которая вычисляется как наилучшая F1-мера по всем возможным порогам. 🈂️ Как выяснилось, тяжёлые и сложные модели часто проседают по качеству детекции Простые алгоритмы нередко превосходят тяжеловесные архитектуры. В итоге мы остановились на двух лёгких и предсказуемых детекторах: 🔵 Авторегрессия — легко учить в рантайме, немного гиперпараметров, отличный выбор для метрик без чёткой сезонности 🔵 MEDIFF — хорошо засекает негладкие паттерны и подходит для ярко выраженных сезонных рядов 🈂️ Переходим к практике В качестве испытательного полигона для умных алертов мы выбрали Яндекс Такси. Для пилота взяли 46 ключевых регионов по объёму GMV и количеству ежедневных поездок. На каждый из них настроили алерты по четырём критическим метрикам: 🔵 created — общее количество созданных заказов 🔵 assigned — те, в которых назначен водитель 🔵 found_share — доля заказов, в которых был найден исполнитель 🔵 seen_timeout — заказы, которые мы не успели предложить водителю Вот что мы поняли: 🔵 Одиночная аномальная точка редко означает инцидент. Для дежурного важнее не разовый выброс, а устойчивое отклонение 🔵 Для разных метрик важно учитывать направление аномалии. Резкий рост числа заказов не обязательно говорит о проблеме в сервисе — это может быть дождь, снегопад или локальное событие. А вот рост seen_timeout или падение found_share уже гораздо больше похожи на ситуацию, требующую реакции 🔵 Уровень естественного шума различается от города к городу. То, что для крупного региона выглядит как нормальная флуктуация, для небольшого города может быть заметным отклонением, и наоборот После калибровки и доработки механизм прекрасно справился с обнаружением аномалий в дикой природе. Сейчас мы переносим подход на доступность тарифов, количество водителей на линии и готовим интеграцию с системами анализа инцидентов на основе LLM. ⏭️ А больше о детекции аномалий читайте на Хабре. Там мы рассказываем, как стабилизировали авторегрессию, адаптировали дисперсию для MEDIFF и оценивали качество детекторов. Подписывайтесь: 💬 @Yandex4Analytics

🤩 3 главных фактора для роста Как подготовиться к повышению? Какие типичные ошибки совершают аналитики в процессе развития к
🤩 3 главных фактора для роста Как подготовиться к повышению? Какие типичные ошибки совершают аналитики в процессе развития карьеры? В чём реальная разница между лидами и сеньорами? 🎙 В новом выпуске подкаста «Доверительный интервал» ведущие Дима, Ксюша и Саша разобрали: 🔵 Как поговорить с руководителем о повышении 🔵 Сколько времени занимает рост до сеньора 🔵 Чем ответственность за свои задачи похожа на мытьё посуды ⏭️ Смотрите на ютубе и в VK Видео или слушайте в Яндекс Музыке. А на какой вы сейчас позиции и сколько занял ваш рост? Пишите нам в комментариях 👇 Подписывайтесь: 💬 @Yandex4Analytics

⏬ Из экономической теории в Антифрод Яндекса 👨‍💻 Всем привет, меня зовут Далер Джабборов, я старший аналитик-разработчик в
Из экономической теории в Антифрод Яндекса 👨‍💻 Всем привет, меня зовут Далер Джабборов, я старший аналитик-разработчик в команде Антифрода. Я рос в то время, когда экономическая парадигма менялась буквально на глазах. Спрятаться было негде — вот и получилось, что я заинтересовался всем этим ещё в детстве 😃 Я поступил в экономико-математическую школу при МГУ, а потом и в сам университет. В программе была сильная математическая база и большой спектр теоретических направлений. На третьем курсе я начал заниматься политической экономией, а продолжил уже в аспирантуре, где получил степень кандидата наук. Тема моей кандидатской — «Трансформация отношений товарного производства под влиянием креативного труда». Это достаточно специфичное направление со своими особенностями ценообразования и мотивации. Я продолжил изучать креативный труд в Институте экономики РАН, а параллельно преподавал дисциплины в РАНХиГСе и Финансовом университете. К слову, тогда мы с группой коллег изучали деглобализацию (ещё до того, как это стало мейнстримом) и опубликовали монографию. И вот тут-то мне и пришлось поизучать и Python, и R, и аналитику данных. Меня очень заинтересовала тема машинного обучения. Во время исследований мне нужно было строить модели в контексте планирования производства, оптимизации цепочек поставок, прогнозирования спроса. 🈂️ В конечном счёте ML перетянул меня в Data Science Мне хотелось видеть больше осязаемых результатов моей работы. В теоретической науке они становятся заметны очень нескоро, поэтому я перешёл в IT: окончил несколько курсов по Data Science, поучаствовал в соревнованиях и решил начать ходить на собеседования. В итоге через пару месяцев устроился в маркетинговую платформу Flocktory, где занимался ранжированием и прогнозированием отклика клиентов. У нас была небольшая команда, и мы напрямую влияли на бизнес: модели выкатывались в прод практически сразу, а уже через пару дней было видно, сколько денег приносили наши решения. После этого я занимался прогнозированием цен на недвижимость в компании «Домклик». Тут экономический бэкграунд помогал находить инсайты и строить дополнительные фичи. 🈂️ А теперь я работаю в Антифроде Яндекса Мне нравится, что в этом проекте есть прикладная ценность, социальная сторона и интересная интеллектуальная составляющая. Мы помогаем пользователям защищаться от мошенников, а командам — очищать сервисы от фрода, точнее считать метрики и улучшать рекомендательные системы. 🈂️ Экономика и аналитика Их объединяет особый склад мышления: нужно хотеть и уметь погружаться в данные, глубоко копать, видеть причинно-следственные связи, искать нужные подходы. И математическая база у них общая. Так что экономический бэкграунд всегда со мной и помогает мне постоянно (пускай часто и неосознанно). Ещё аналитику и экономику объединяет желание предсказывать. Но у них присутствует и общий предел: даже с учётом развития нейросетей и рекомендательных систем, предугадывать движение общества, его мотивы и поведение очень сложно. Так что аналитика, как и экономика, — это не просто математика. Когда я только пришёл в IT, мне хотелось параллельно оставаться и в науке. К сожалению, так у меня не получилось: на всё вместе не хватает времени. Но я не закрываю для себя эту дверь: идея вернуться в науку с накопленным практическим опытом всегда лежит в моём мысленном бэклоге. Подписывайтесь: 💬 @Yandex4Analytics

🧑‍💻 На Analytics Party было жарко! На прошлой неделе в нашем офисе в Санкт-Петербурге мы собрали больше 120 аналитиков, что
🧑‍💻 На Analytics Party было жарко! На прошлой неделе в нашем офисе в Санкт-Петербурге мы собрали больше 120 аналитиков, чтобы вместе послушать доклады о сложных продуктовых и исследовательских задачах. После этого на афтерпати обсудили работу AI-агентов, разметку событий мобильных приложений, тестирование без A/B и аналитику качества технологий. Было так огненно, что даже пожарная тревога не выдержала 🔥 🗳 Спасибо, что провели этот вечер четверга с нами! 📷 Ищите себя на фото по ссылке. 📺 Записи докладов уже доступны на YouTube и в VK Видео. Подписывайтесь: 💬 @Yandex4Analytics

🎲 Сыграем в игру с кубиком? Майские уже не за горами! В преддверии праздников мы принесли вам немного полезных квестов, кото
🎲 Сыграем в игру с кубиком? Майские уже не за горами! В преддверии праздников мы принесли вам немного полезных квестов, которые можно выполнить в свободное время. А какой из них достанется вам — решит удача: 🔵 Бросайте кубик 🎲 в комментах 🔵 Запоминайте результат 🔵 Открывайте спойлер для выпавшего числа 🔵 Держите квест на выходные 📝 ⬇️ Список заданий 1️⃣ Послушать подкаст «Доверительный интервал». Награда: 500 XP и клад лайфхаков, которые помогут справиться со срочными задачами 2️⃣ Почитать настольные книги аналитика. Награда: 1000 XP и сундук с классикой о системном анализе, математике и подходах к метрикам: тут подборка 2025-го, а здесь — 2026-го 3️⃣ Выяснить, как поставить эксперимент без A/B-теста. Награда: 500 XP и новое заклинание — Propensity Score Matching 4️⃣ Порешать задачки. Награда: 300 XP и +1 к теории вероятностей. А если войдёте во вкус — переходите по хештегу #задачи_для_аналитиков 5️⃣ Посмотреть доклады с Data Driven 2025. Награда: 500 XP и способность трансмутировать данные в артефакты и инсайты. Плейлисты по трекам: Data to Artifacts (ютуб и VK Видео), Data to Insights (ютуб и VK Видео) 6️⃣ Завести пет-проект. Награда: 1000 XP и верный компаньон, который поможет в приключениях (и в поиске работы квестов, за которые платят голдой 💰) Подписывайтесь: 💬 @Yandex4Analytics