Аналитика данных / Data Study
Сайт: https://datastudy.ru/ По всем вопросам: @daniildzheparov Канал для всех кто увлекается аналитикой данных, data science, бизнес-анализом. Делюсь hard и soft навыками аналитиков, развиваю свои курсы и обучаю желающих получить ценные знания
Больше6 865
Подписчики
+924 часа
+427 дней
+15330 дней
- Подписчики
- Просмотры постов
- ER - коэффициент вовлеченности
Загрузка данных...
Прирост подписчиков
Загрузка данных...
Кому интересно почитать про внутрянку устройства PostgreSQL, а не только аналитические запросы на SQL писать, предлагаю почитать эту статью
На очень понятно языке со схема объяснено как что работает.
Есть еще вторая часть, которую сам пока не читал, но в ближайшее время ознакомлюсь
PostgreSQL 16. Организация данных. Часть 1
PostgreSQL 16. Изоляция транзакций. Часть 2 Введение Идея написания статьи возникла во время чтения книги « PostgreSQL 16 изнутри ». В ней рассматривается внутреннее устройство СУБД...
❤ 4🔥 3
Фото недоступноПоказать в Telegram
Вебинар: Разбираемся с продуктовыми метриками с нуля 🔥
Хотите узнать какие метрики необходимы бизнесу? Как их выбирать и правильно оценивать? Присоединяйтесь на новый вебинар по продуктовым метрикам 🚀
В прошлом месяце мы проводили первую часть вебинара по продуктовым метрикам, он очень понравился зрителям, но мы не всё успели разобрать. Поэтому мы решили провести новый вебинар.
На этом вебинаре мы продолжим разбираться с продуктовыми метриками, подробно поговорим о метриках вовлеченности и обсудим, почему бизнес нужно строить вокруг retention.
📅 Дата: 9 июля (вт)
🕘 Время: 19:00 по Мск
🔗 Доступ к трансляции придет в бота, записывайтесь → ссылка.
Вебинар подойдет даже если вы только-только начинаете свой путь в аналитике - будем разбирать все по шагам понятным языком 🧡
Реклама. ООО «АЙТИ РЕЗЮМЕ». ИНН 4025460134.
Erid:LjN8KZgcg
🔍 ETL с помощью SQL: Инкрементальная загрузка с обновлением данных🔍
✨ В предыдущем посте мы разобрали инкрементальную загрузку с сохранением всей историчности данных. Давайте разберем загрузку инкремента, чтобы в target таблицы оставались только актуальные значения данных, т.е. исторические значение перезаписывались актуальными.
Ключевые этапах этого процесса будут следующие:
1️⃣ Определение инкремента данных
Пример выделения инкремента из таблицы source по условию, что поле
update_date
имеет сегодняшнюю дату
SELECT *
FROM source s
WHERE update_date = CURRENT_DATE()
Лучше нам результат запроса сохранить в промежуточную временную таблицу.
CREATE TEMPORARY TABLE tmp_increment AS
SELECT *
FROM source s
WHERE update_date = CURRENT_DATE()
2️⃣ Вставка инкремента в target таблицу с актуализацией значений данных (перезапись)
Выполняем в 2 шага:
1) Удаляем данные из target, которые есть во временной таблице по уникальному идентификатору записи (например, id). Это удалит нам записи, которые нужно обновить
DELETE FROM target
WHERE id IN (SELECT id
FROM tmp_increment);
2) Вставляем инкремент с актуальными записями из временной таблицы tmp_increment
в target
INSERT INTO target
SELECT *
FROM tmp_increment;
Таким образом в target таблицы будут добавлять новые записи и перезаписываться обновленные актуальные записи из source в target
Оставляйте реакции, если пост был полезен 😉👍 17🔥 4
Фото недоступноПоказать в Telegram
Вакансия Продуктовый аналитик
Это одна из важных ролей в команде. Твои результаты исследований и анализа данных экспериментов напрямую влияют на продукт.
О задачах: выстраивать дерево метрик; определять, рассчитывать и валидировать продуктовые метрики для оценки успеха внедрения новых фичей; проводить исследования поведения пользователей на основе данных для определения точек роста в продукте; работать в тесном сотрудничестве с продуктовыми менеджерами, UX исследователями, дизайнерами и разработчиками, сопровождая A/B тесты от дизайна эксперимента до интерпретации результатов.
Стек технологий: Python, SQL, Hadoop stack, Hive, Spark
Что еще интересного: гибрид; офис в Москве и коворкинг в СПб; организуем внутренние и внешние митапы; помогаем развивать личный бренд шопинг на Lamoda со скидками до 40%
Подробнее о вакансии.
Реклама. ООО «Ламода Тех». ИНН 7734461512. erid:LjN8KDq9Z
👍 1
Фото недоступноПоказать в Telegram
Сегодня стажеры в свой первый день получали доступы и впитывали новые термины. Сразу вспомнился такой мем в тему 😃
😁 25❤ 2🔥 1
Фото недоступноПоказать в Telegram
Большую статью про аналитику с Varioqub написали ребята из Х5 Tech.
Расписано все от и до не только по самому модулю, но и по отдельным его критериям 😉
Их кейс с A/B-тестированием поможет лучше понять, как устроен критерий Mann-Whitney, как устроен Varioqub, и оценить, насколько качественно взвешиваются результаты ваших тестов. Если вы задаетесь вопросом, достаточно ли вашего действующего решения — обязательно к прочтению.
Читать статью
❤ 3👍 1🔥 1
Фото недоступноПоказать в Telegram
Методология DataOps
Слышали ли вы про понятие DataOps?
Если нет, то сейчас разберем вместе, что оно обозначает.
🔎 DataOps - это методология и набор практик непрерывной интеграции данных, автоматизации и мониторинга управления данными в течение всего их жизненного цикла.
Какие задачи входят в DataOps?
📍автоматизация процессов загрузки данных в хранилища
📍мониторинг операционных потоков данных
📍оптимизация аналитики данных
📍создание инфраструктуры для корректного хранения, движения и использования данных
Полезные ссылки для погружения в тему:
🔗 DataOps Wikipedia
🔗 Концепция DataOps
🔗 DataOps в Big Data
🔗 What is DataOps
🔥 9👍 3
Как получить реальный кейс в портфолио, если джуны никому не нужны?🙄
Решил рассказать про способы развития в BI, о том, где найти тот самый опыт, который так всем требуется.
1️⃣Проекты с открытым исходным кодом.
2️⃣Стажировки.
3️⃣Образовательные проекты.
4️⃣Волонтерство: предложите свои услуги некоммерческим организациям или стартапам.
Мне нужно быстро и кейсы от реальных компаний.5️⃣Хакатоны/конкурсы — способ для тех, кто уже не совсем новичок в BI, но кому быстро нужен хороший кейс. К слову, после недавнего ресерча узнал, что сейчас проводит конкурс Analytic Workspace — Self-service BI-платформа, которая оснащена: ETL, собственным хранилищем в ClikHouse и ML. Почему стоит принять участие: 📎Экспертное жюри — многих ребят знаю; 📎Наличие HR-партнеров — возможность получить приглашение на собеседование; 📎Спонсор датасета — VK Cloud; Возможность выиграть деньги. Если из-за отсутствия опыта работы внутри системы AW BI сомневаетесь стоит ли участвовать, у ребят есть бесплатный мини-курс на Stepik «BI-аналитик Express: с нуля до готового дашборда за 2 часа». Пройдите это короткое обучение и сомнение не будет. Регистрируйтесь! Заполняйте портфолио кейсам, а если вы уже опытный специалист, то воспользуйтесь возможностью выиграть 💵 🔗Ссылка на все подробности
Конкурс Дашбордов «Покажи смысл!» | 21 июня - 10 июля 2024
Личное участие, денежные премии и классные призы от организаторов и партнеров
👍 8❤ 2🔥 2
Открепляю сообщени о стажировке в Сравни
Мы набрали стажеров, по впечатлениям от собесов все ребята мотивированы погружаться с головой в аналитические задачи. В понедельник поедем знакомиться в офис, делать онбординг и есть пиццу 😉🍕
🔥 24❤ 6
Фото недоступноПоказать в Telegram
Нашёл вот такую визуальную карту Chart Suggestions для выбора более оптимального и эффективного визуального элемента в зависимости от данных и решаемой потребности визуализации
Забирайте себе, может кому-то пригодится на практике 😉
👍 28❤ 4🔥 3
Выберите другой тариф
Ваш текущий тарифный план позволяет посмотреть аналитику только 5 каналов. Чтобы получить больше, выберите другой план.