ch
Feedback
Avito Data Tech

Avito Data Tech

前往频道在 Telegram

Эксперты Авито делятся опытом развития аналитической платформы. Будет полезно для инженеров, аналитиков и тимлидов в сфере Big Data.

显示更多
4 027
订阅者
+424 小时
+227
+8830
帖子存档
Открываем набор сразу на 2 магистратуры для DS-инженеров — во ВШЭ и МФТИ 🤩 Любая из программ подойдёт, если вы учитесь на по
Открываем набор сразу на 2 магистратуры для DS-инженеров — во ВШЭ и МФТИ 🤩 Любая из программ подойдёт, если вы учитесь на последнем курсе или уже получили диплом бакалавра. А ещё живёте в Москве или готовы к переезду! Что вас ждёт независимо от выбора: ✨ Работа над реальными кейсами Авито; ✨ Возможность попасть на стажировку; ✨ Погружение в проф. сообщество; ✨ Полный курс от базовых знаний до проектирования сложных систем. Кликайте на понравившееся направление — по ссылкам лежат подробные условия поступления и программа 📚 #ds

Единственный, кто смог нам помочь в расследовании загадочного бага... Леонид Каневский! Следствие вели о росте ошибок 404 на endpoint аватарок. История запутанная и местами даже с элементами тру-крайма! Короче, смотрим, а в комментариях делимся любимым мемом с Леонидом Каневским, который точно описывает ситуацию из видео: 📱 YouTube 📱 ВК 📱 RuTube #tl #frontend #backend #qa

Инициировать рост сотрудника — дело рук самого сотрудника 🧑‍💻 И это действительно так Если здесь есть мидлы-аналитики, кото
Инициировать рост сотрудника — дело рук самого сотрудника 🧑‍💻 И это действительно так Если здесь есть мидлы-аналитики, которые пытаются вырасти в синьора, но для этого чего-то вечно не хватает (знаний, понимания, опыта и тд) — принесли вам статью. В ней Ирина Хабенская, руководитель направления аналитики, поделилась прикладным гайдом по развитию софт-скиллов и разобрала ключевые блокеры, с которыми многие из нас встречались. Читаем по ссылке ➡️ #analytics

Всем привет! Я Ксения Беленя, аналитик перформанса в Авито. Ранее в статье я уже писала о том, как мы считаем метрики перформ
Всем привет! Я Ксения Беленя, аналитик перформанса в Авито. Ранее в статье я уже писала о том, как мы считаем метрики перформанса на разных платформах, что они из себя представляют и как мы используем их в A/B-тестах. Сегодня я расскажу о том, как мы отслеживаем деградации важных метрик перформанса на проде. Читать тут ➡️ #analytics

Классная возможность для тех, кто хотел вырасти в продуктового аналитика или BI-разработчика 👀 Коллеги открывают набор на An
Классная возможность для тех, кто хотел вырасти в продуктового аналитика или BI-разработчика 👀 Коллеги открывают набор на Analyst Bootcamp. Подать заявку и посмотреть все условия можно тут, а ниже собрали основные: 🔸 Зарплата, техника и корпоративные библиотеки; 🔸 Только реальные задачи; 🔸 Опытный наставник-сотрудник; 🔸 Регулярная обратная связь и прозрачные критерии роста; 🔸 Сильное и интересное комьюнити; 🔸 Возможность работать удалённо или из офиса. Также коллеги ждут, что вы: ✅ Учитесь на 2−4-м курсе бакалавриата, 1−2-м курсе магистратуры, 3−5-м курсе специалитета или уже получили диплом по технической, математической или IT‑специальности; ✅ Готовы работать от 30 часов в неделю; ✅ Обладаете базовыми знаниями SQL и Python; ✅ Понимаете, в чём отличия между продуктовой аналитикой и BI‑разработкой. #analytics

Мы едем на CodeFest'16 🏃‍♀️ Если собирались идти, очень будем ждать вас возле нашего стенда. На оба дня подготовили там для
+3
Мы едем на CodeFest'16 🏃‍♀️ Если собирались идти, очень будем ждать вас возле нашего стенда. На оба дня подготовили там для вас много интересного: от воркшопов до дискуссионных битв 🔥 А также: 🔸 Никита Кречетов поделится опытом построения DBaaS в Авито и разберёт основные проблемы, которые могут возникнуть в процессе; 🔸 Роман Ананьев расскажет про тернистый путь в поиске самомасштабируемой NoSQL БД с нуля и про приключения с лицензиями. #dba

Обещанное продолжение с разбором БД 🤓 В этот раз — плюсы и минусы Cassandra 5! Карточки очень советуем сохранить, наверняка
+5
Обещанное продолжение с разбором БД 🤓 В этот раз — плюсы и минусы Cassandra 5! Карточки очень советуем сохранить, наверняка однажды пригодятся перед очередным поиском лучшего решения. А если пропустили первый пост про FoundationDB — ищите выше! #dba

Начинаем серию постов про БД 👀 Послушали недавний доклад Романа Ананьева о том, как его команда искала автошардируемую NoSQL
+5
Начинаем серию постов про БД 👀 Послушали недавний доклад Романа Ананьева о том, как его команда искала автошардируемую NoSQL БД… И решили, что выводы о некоторых БД, что тестировали коллеги, должны появиться здесь. Они станут своего рода памяткой на всякий случай и, возможно, помогут кому-то на старте отсеять неподходящие варианты. Начнём с FoundationDB, а позже вернёмся с новыми карточками! #dba

У кого было? 👀 Ставьте реакции! #tl #dba #dwh

Тимлиды, техлиды и руководители IT-команд из Екатеринбурга — максимальное внимание! Мы приглашаем вас на дринкап 28 мая в Ель
Тимлиды, техлиды и руководители IT-команд из Екатеринбурга — максимальное внимание! Мы приглашаем вас на дринкап 28 мая в Ельцин Центре. Будут дискуссии с тим- и техлидами Авито, живое обсуждение рабочих кейсов в личных беседах. И, конечно, нетворкинг за фуршетом с напитками (на то он и дрикап 👀). Вот только некоторые из тем: — AI-инструменты в менеджменте; — практики управления командами и процессами: от продажи техдолга до проведения 1-1; — то, что «болит» в работе. 🔸Регистрироваться можно и нужно уже сейчас. И не забудьте переслать это сообщения коллегам-тимлидам. #tl #dba #dwh

Ловите полезное с нашего последнего Database meetup 😱 Собрали в карточках саммари по докладу Игоря Конева про то, как его ко
+8
Ловите полезное с нашего последнего Database meetup 😱 Собрали в карточках саммари по докладу Игоря Конева про то, как его команда прошла путь от разрозненных Ceph кластеров к единой платформе с 100 000+ бакетов ⬆️ #db

Худеем к лету вместе.... 🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️ 🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️ Павел Лобанов и Дмитрий Сидоренко придумали 🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️ свой метод похудения 🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️ для базы данных на PostgreSQL. 🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️ 🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️ 🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️🏃‍♀️ Читайте на Хабре #db

Тот самый случай, который доказывает: репликация и персистентность — это не панацея 🤔 Собрали саммари по одному из докладов
+7
Тот самый случай, который доказывает: репликация и персистентность — это не панацея 🤔 Собрали саммари по одному из докладов Антона Головенко о том, как его команда отказывалась от репликации, зачем прессовала Redis и что из этого вышло ⬆️ #ds #backend

К нам в Авито заполз таракан и основательно обжился ✋ Он создаёт сервисные и персональные учётки с определёнными правами, мас
К нам в Авито заполз таракан и основательно обжился Он создаёт сервисные и персональные учётки с определёнными правами, масштабирует БД с платформенной конфигурацией, регулярно запускает бэкапы и проверяет готовность нод. Конечно, речь о CockroachDB на платформе DBaaS. Рассказываем: ⚡️ Как выглядел мир баз данных Авито до внедрения; ⚡️ Как они вообще пришли к смузи-технологии; ⚡️ Почему был выбран именно CockroachDB; ⚡️ Какой функционал имеет этот агент; ⚡️ Как устроен CockroachDB на платформе DBaaS в Авито и какие есть планы по его развитию. В комментариях делитесь, слышали ли про этот инструмент и какой был опыт его использования ⬇️ #dba #dwh

«Когда у вас 100 витрин, вы знаете их поимённо, но когда их становится 6 700, наступает хаос» 🔥 Дмитрий Мележиков, отвечающи
«Когда у вас 100 витрин, вы знаете их поимённо, но когда их становится 6 700, наступает хаос» 🔥 Дмитрий Мележиков, отвечающий за BI в домене Маркетинг, поделился в статье: ➡️ Почему нельзя просто хранить данные, не неся за них ответственность; ➡️ Как в Авито появилась метрика здоровья данных и из чего она состоит; ➡️ Как мы построили пайплайн сбора метрик; ➡️ Как субботники и governance-культура помогают повышать HealthScore объектов; ➡️ Как мы переходим от мониторинга к автоматизации. Читайте по ссылке, а в комментариях делитесь, сталкивались ли вы с проблемой роста DWH и как её решали 🔍 #analytics

Снизить до нуля операционку по приёмке K8s-кластеров? Нет ничего невозможного для команды DBaaS 😎 Какие проблемы коллеги реш
+8
Снизить до нуля операционку по приёмке K8s-кластеров? Нет ничего невозможного для команды DBaaS 😎 Какие проблемы коллеги решили в ходе проекта и что из этого вышло — читайте в карточках ⬆️ #db

27 марта встречались на Avito Database meetup #3, чтобы послушать 3 доклада о том, как мы: 📌 Прошли путь от разрозненных Cep
+4
27 марта встречались на Avito Database meetup #3, чтобы послушать 3 доклада о том, как мы: 📌 Прошли путь от разрозненных Ceph кластеров к единой платформе с 100 000+ бакетов; 📌 Искали новую технологию БД; 📌 Защищаем чувствительные данные на DBaaS. Если тоже были там, ловите фото со встречи ⭐️ А если пропустили её, все 3 доклада уже лежат по ссылке в удобном плейлисте ⬇️ 📺 YouTube 🔵 ВК #db

Принято считать, что базы в Kubernetes — сложно, ненадёжно и их неудобно поддерживать… Или всё на деле обстоит не так? 🔍 Иго
Принято считать, что базы в Kubernetes — сложно, ненадёжно и их неудобно поддерживать… Или всё на деле обстоит не так? 🔍 Игорь Конев, Tech Lead команды STaaS, считает, что если немного «допилить» систему, то результат точно окупится. А бизнес будет расти и масштабироваться быстрее. В статье Игорь выделил 3 проблемы эксплуатации данных k8s и показал, как их решение помогает построить стабильную DBaaS-платформу и автоматизировать жизненный цикл баз. Читаем по ссылке. #db

Apache Kafka, Apache Pulsar или Pedpanda? Собрали саммари с доклада Романа Ананьева с Avito Database meetup #2, где он расска
+8
Apache Kafka, Apache Pulsar или Pedpanda? Собрали саммари с доклада Романа Ананьева с Avito Database meetup #2, где он рассказал, как и зачем их команда переводила сервисы с Apache Kafka и Pulsar на Redpanda и что из этого вышло. А новый Avito Database meetup пройдёт совсем скоро, регистрация и вся информация по ссылке. #db

🚀Собираемся 27 марта на Database meetup, чтобы максимально продуктивно нетворкать и послушать 3 доклада о том, как: 📌 Защитить чувствительные данные в DBaaS; 📌Выбрать лучшую Distributed NoSQL; 📌От разрозненных Ceph кластеров и зоопарка S3 клиентов прийти к единой платформе. Регистрироваться по ссылке P.S. Онлайн-трансляция тоже будет ☕️ #db