Avito Data Tech
الذهاب إلى القناة على Telegram
Эксперты Авито делятся опытом развития аналитической платформы. Будет полезно для инженеров, аналитиков и тимлидов в сфере Big Data.
إظهار المزيد4 027
المشتركون
+424 ساعات
+227 أيام
+8830 أيام
أرشيف المشاركات
4 027
Открываем набор сразу на 2 магистратуры для DS-инженеров — во ВШЭ и МФТИ 🤩
Любая из программ подойдёт, если вы учитесь на последнем курсе или уже получили диплом бакалавра. А ещё живёте в Москве или готовы к переезду!
Что вас ждёт независимо от выбора:
✨ Работа над реальными кейсами Авито;
✨ Возможность попасть на стажировку;
✨ Погружение в проф. сообщество;
✨ Полный курс от базовых знаний до проектирования сложных систем.
Кликайте на понравившееся направление — по ссылкам лежат подробные условия поступления и программа 📚
#ds
4 027
Единственный, кто смог нам помочь в расследовании загадочного бага... Леонид Каневский!
Следствие вели о росте ошибок 404 на endpoint аватарок. История запутанная и местами даже с элементами тру-крайма! Короче, смотрим, а в комментариях делимся любимым мемом с Леонидом Каневским, который точно описывает ситуацию из видео:
📱 YouTube
📱 ВК
📱 RuTube
#tl #frontend #backend #qa
4 027
Инициировать рост сотрудника — дело рук самого сотрудника 🧑💻
И это действительно так
Если здесь есть мидлы-аналитики, которые пытаются вырасти в синьора, но для этого чего-то вечно не хватает (знаний, понимания, опыта и тд) — принесли вам статью.
В ней Ирина Хабенская, руководитель направления аналитики, поделилась прикладным гайдом по развитию софт-скиллов и разобрала ключевые блокеры, с которыми многие из нас встречались.
Читаем по ссылке ➡️
#analytics
4 027
Всем привет! Я Ксения Беленя, аналитик перформанса в Авито.
Ранее в статье я уже писала о том, как мы считаем метрики перформанса на разных платформах, что они из себя представляют и как мы используем их в A/B-тестах.
Сегодня я расскажу о том, как мы отслеживаем деградации важных метрик перформанса на проде. Читать тут ➡️
#analytics
4 027
Классная возможность для тех, кто хотел вырасти в продуктового аналитика или BI-разработчика 👀
Коллеги открывают набор на Analyst Bootcamp. Подать заявку и посмотреть все условия можно тут, а ниже собрали основные:
🔸 Зарплата, техника и корпоративные библиотеки;
🔸 Только реальные задачи;
🔸 Опытный наставник-сотрудник;
🔸 Регулярная обратная связь и прозрачные критерии роста;
🔸 Сильное и интересное комьюнити;
🔸 Возможность работать удалённо или из офиса.
Также коллеги ждут, что вы:
✅ Учитесь на 2−4-м курсе бакалавриата, 1−2-м курсе магистратуры, 3−5-м курсе специалитета или уже получили диплом по технической, математической или IT‑специальности;
✅ Готовы работать от 30 часов в неделю;
✅ Обладаете базовыми знаниями SQL и Python;
✅ Понимаете, в чём отличия между продуктовой аналитикой и BI‑разработкой.
#analytics
4 027
+3
Мы едем на CodeFest'16 🏃♀️
Если собирались идти, очень будем ждать вас возле нашего стенда. На оба дня подготовили там для вас много интересного: от воркшопов до дискуссионных битв 🔥
А также:
🔸 Никита Кречетов поделится опытом построения DBaaS в Авито и разберёт основные проблемы, которые могут возникнуть в процессе;
🔸 Роман Ананьев расскажет про тернистый путь в поиске самомасштабируемой NoSQL БД с нуля и про приключения с лицензиями.
#dba
4 027
+5
Обещанное продолжение с разбором БД 🤓
В этот раз — плюсы и минусы Cassandra 5! Карточки очень советуем сохранить, наверняка однажды пригодятся перед очередным поиском лучшего решения.
А если пропустили первый пост про FoundationDB — ищите выше!
#dba
4 027
+5
Начинаем серию постов про БД 👀
Послушали недавний доклад Романа Ананьева о том, как его команда искала автошардируемую NoSQL БД… И решили, что выводы о некоторых БД, что тестировали коллеги, должны появиться здесь.
Они станут своего рода памяткой на всякий случай и, возможно, помогут кому-то на старте отсеять неподходящие варианты. Начнём с FoundationDB, а позже вернёмся с новыми карточками!
#dba
4 027
Тимлиды, техлиды и руководители IT-команд из Екатеринбурга
— максимальное внимание!
Мы приглашаем вас на дринкап 28 мая в Ельцин Центре.
Будут дискуссии с тим- и техлидами Авито, живое обсуждение рабочих кейсов в личных беседах. И, конечно, нетворкинг за фуршетом с напитками (на то он и дрикап 👀).
Вот только некоторые из тем:
— AI-инструменты в менеджменте;
— практики управления командами и процессами: от продажи техдолга до проведения 1-1;
— то, что «болит» в работе.
🔸Регистрироваться можно и нужно уже сейчас. И не забудьте переслать это сообщения коллегам-тимлидам.
#tl #dba #dwh
4 027
+8
Ловите полезное с нашего последнего Database meetup 😱
Собрали в карточках саммари по докладу Игоря Конева про то, как его команда прошла путь от разрозненных Ceph кластеров к единой платформе с 100 000+ бакетов ⬆️
#db
4 027
Худеем к лету вместе....
🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️
🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️
Павел Лобанов и Дмитрий Сидоренко придумали 🏃♀️🏃♀️🏃♀️🏃♀️
свой метод похудения 🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️
для базы данных на PostgreSQL. 🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️
🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️
🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️🏃♀️ Читайте на Хабре
#db
4 027
+7
Тот самый случай, который доказывает: репликация и персистентность — это не панацея 🤔
Собрали саммари по одному из докладов Антона Головенко о том, как его команда отказывалась от репликации, зачем прессовала Redis и что из этого вышло ⬆️
#ds #backend
4 027
К нам в Авито заполз таракан и основательно обжился ✋
Он создаёт сервисные и персональные учётки с определёнными правами, масштабирует БД с платформенной конфигурацией, регулярно запускает бэкапы и проверяет готовность нод. Конечно, речь о CockroachDB на платформе DBaaS.
Рассказываем:
⚡️ Как выглядел мир баз данных Авито до внедрения;
⚡️ Как они вообще пришли к смузи-технологии;
⚡️ Почему был выбран именно CockroachDB;
⚡️ Какой функционал имеет этот агент;
⚡️ Как устроен CockroachDB на платформе DBaaS в Авито и какие есть планы по его развитию.
В комментариях делитесь, слышали ли про этот инструмент и какой был опыт его использования ⬇️
#dba #dwh
4 027
«Когда у вас 100 витрин, вы знаете их поимённо, но когда их становится 6 700, наступает хаос» 🔥
Дмитрий Мележиков, отвечающий за BI в домене Маркетинг, поделился в статье:
➡️ Почему нельзя просто хранить данные, не неся за них ответственность;
➡️ Как в Авито появилась метрика здоровья данных и из чего она состоит;
➡️ Как мы построили пайплайн сбора метрик;
➡️ Как субботники и governance-культура помогают повышать HealthScore объектов;
➡️ Как мы переходим от мониторинга к автоматизации.
Читайте по ссылке, а в комментариях делитесь, сталкивались ли вы с проблемой роста DWH и как её решали 🔍
#analytics
4 027
+8
Снизить до нуля операционку по приёмке K8s-кластеров? Нет ничего невозможного для команды DBaaS 😎
Какие проблемы коллеги решили в ходе проекта и что из этого вышло — читайте в карточках ⬆️
#db
4 027
+4
27 марта встречались на Avito Database meetup #3, чтобы послушать 3 доклада о том, как мы:
📌 Прошли путь от разрозненных Ceph кластеров к единой платформе с 100 000+ бакетов;
📌 Искали новую технологию БД;
📌 Защищаем чувствительные данные на DBaaS.
Если тоже были там, ловите фото со встречи ⭐️
А если пропустили её, все 3 доклада уже лежат по ссылке в удобном плейлисте ⬇️
📺 YouTube
🔵 ВК
#db
4 027
Принято считать, что базы в Kubernetes — сложно, ненадёжно и их неудобно поддерживать… Или всё на деле обстоит не так? 🔍
Игорь Конев, Tech Lead команды STaaS, считает, что если немного «допилить» систему, то результат точно окупится. А бизнес будет расти и масштабироваться быстрее.
В статье Игорь выделил 3 проблемы эксплуатации данных k8s и показал, как их решение помогает построить стабильную DBaaS-платформу и автоматизировать жизненный цикл баз. Читаем по ссылке.
#db
4 027
+8
Apache Kafka, Apache Pulsar или Pedpanda?
Собрали саммари с доклада Романа Ананьева с Avito Database meetup #2, где он рассказал, как и зачем их команда переводила сервисы с Apache Kafka и Pulsar на Redpanda и что из этого вышло.
А новый Avito Database meetup пройдёт совсем скоро, регистрация и вся информация по ссылке.
#db
4 027
🚀Собираемся 27 марта на Database meetup, чтобы максимально продуктивно нетворкать и послушать 3 доклада о том, как:
📌 Защитить чувствительные данные в DBaaS;
📌Выбрать лучшую Distributed NoSQL;
📌От разрозненных Ceph кластеров и зоопарка S3 клиентов прийти к единой платформе.
Регистрироваться по ссылке
P.S. Онлайн-трансляция тоже будет ☕️
#db
متاح الآن! بحث تيليغرام 2025 — أهم رؤى العام 
