Start Career in DS

Тут публикуются материалы для прокачки скиллов в DS и подготовки к собеседованиям. Пишем про технические тулзы, визуализацию данных, бизнесовые задачи, разбираем ML-алгоритмы и обсуждаем смежные темы :) Автор: @RAVasiliev

Більше

Росія51 274Російська54 563Технології та додатки8 000

Рекламні дописи

10 272

Підписники

+424 години

+577 днів

+6630 днів

3 919

Перегляди допису

~ 2 30524 години

~ 2 55848 годин

38.15%

Коефіцієнт залучення

22.4%24 години

24.9%48 годин

Згадування

27 днів

230 днів

Немає даних

Дописів на день

~ 31

Реакції

~ 3

Коментарі

~ 39

Поширення

Підписники
Перегляди допису
ER - коефіцієнт залучення

Триває завантаження даних...

Фото недоступнеДивитись в Telegram

🔥 Центральный университет продолжает набор в магистратуру по Data Science и машинному обучению Центральный университет — современный вуз, созданный при поддержке ведущих компаний России: Т-Банка, Авито и других. У вас есть возможность получить диплом магистра в области математики и компьютерных наук и обучайтесь на основе реальных кейсов ведущих ИТ-компаний у профессоров из МГУ, МФТИ, РЭШ и практиков из индустрии. Если вы уже имеете опыт в Data Science и машинном обучении — вы мчожете пропустить базовое обучение и закончить магистратуру за 3 семестра. У каждого студента будет: - личный ментор по траектории обучения; - доступ к карьерному центру с коучами и консультантами; - опыт работы в проектах партнеров уже во время обучения. А в онлайн-отборе можно выиграть грант на обучение до 1,2 млн рублей. Больше подробностей про университет и конкурс грантов по ссылке! erid:2VtzqvGx7vp Реклама, АНО ВО «Центральный университет», ИНН 7743418023

Показати все...

❤‍🔥 4👍 2🔥 1

🎯 Про Unit-экономику От аналитиков и смежных профессий очень часто просят не только понимание своего домена, но и понимание того, как работает "цифровая экономика" в целом. Это про то, сколько стоит привлечение пользователя, как он живёт в нашем продукте, сколько оставляет денег и тд. Основные метрики, которые точно нужно знать: - LTV - сколько дохода нам приносит пользователь за всё время жизни в продукте - CAC - сколько нам стоит привлечение пользователя в продукт - Retention - "переток" пользователей из одного периода в другой - ARPU - средние траты юзера за период - DAU, MAU - число юзеров за день/месяц Нашёл на просторах интернета два крутых видео, которые рассказывают про юнитку от и до: 1. Выступление Ильи Красинского в рамках ШМЯ Илья рассказывают про юнин-экономику с точки зрения корпорации: на какие метрики стоит смотреть, в каких разрезах и тд. Кроме того, тут много примеров, на которых можно понять логику расчёта метрик 2. Вебинар Богдана Печенкина Здесь тоже рассматриваются ключевые метрики юнит-экономики, но уже больше со стороны стартапа. У Богдана есть свой цифровой продукт и он на примере этого продукта рассказывает про особенности сведения метрик 🙂

Показати все...

014. Школа менеджмента — Юнит-экономика или поиск точек кратного роста. Илья Красинский

Расскажу о самых основах: как выстроить модель монетизации для бизнеса, найти точки кратного роста и как работать с когортами при расчёте экономики.

🔥 37❤ 7❤‍🔥 5

Фото недоступнеДивитись в Telegram

Начните карьеру в ИТ и бизнесе с помощью программы бакалавриата в Центральном университете! Поступайте на одно из направлений по искусственному интеллекту, разработке и бизнес-аналитике. Пока ждете результаты экзаменов, не теряйте время и попробуйте себя в конкурсе грантов. Преимущества грантов от Центрального университета: - Может покрыть до 100% стоимости обучения; - Выдается на весь период учебы; Не уменьшится, но может увеличиться за достижения и успехи в учебе Попробуйте свои силы в конкурсе сейчас, а с 20 июня направляйте документы для поступления по результатам ЕГЭ. Подробная информация про университет, конкурс грантов и обучение здесь erid:2Vtzquo9L2i Реклама, АНО ВО «Центральный университет», ИНН 7743418023

Показати все...

🔥 8👍 3❤ 3😁 1

🦸 Рома Васильев про данные, аналитику и жизнь Готовы ли вы погрузиться в мысли про аналитику, образование и повседневную жизнь гулбже?) Если да - рекомендуем подписаться на канал Ромы, автора Start Career in DS В нём вы найдёте кучу интеренсых материалов, например: - Про ключевые навыки в современном мире - Цикл Колба или как мы учимся - Роль аналитики в компании - Про использование ChatGPT в повседневной жизни Подписывайтесь: @ravasiliev_ch!

Показати все...

Рома Васильев про данные, аналитику и жизнь

Мысли про жизнь, карьеру, развитие в аналитике данных и не только :)

❤ 10👍 7🔥 4

Фото недоступнеДивитись в Telegram

🤖 Яндекс запустил Lite-версию генеративной текстовой модели YandexGPT 3 YandexGPT 3 Lite — это облегчённая версия генеративной модели Яндекса нового поколения. Особенность таких Lite-моделей заключается в более высокой скорости ответов, что позволяет решать простые задачи бизнеса буквально в режиме реального времени. Поэтому нейросеть хорошо показывает себя в сценариях, где важны время реакции и оптимизация затрат: например, бот-консультант на сайте, система подсказок для операторов колл-центров или суммаризатор результатов деловых встреч. ✈️ По данным замеров, YandexGPT 3 Lite стала ещё быстрее и точнее — и она уже доступна в режиме release candidate на облачной платформе Yandex Cloud. То есть клиенты могут протестировать её и плавно внедрить в свои продукты через API уже в ближайшее время. Одним из ключевых этапов обучения модели стало выравнивание (Alignment), включающее в том числе стадию обучения с подкреплением (RL). Если вы давно хотели разобраться в том, как работают GPT-подобные модели - читайте статью на Хабре, в ней авторы попытались разложить всё на пальцах 🙂

Показати все...

👍 12❤ 4🔥 2

🎯 Множественное тестирование в A/B экспериментах На различных курсах часто рассказывают про то, как проводить A/B-тесты. Чаще всего групп в академических задачах собственно две: А и В. Что тут может пойти не так? То, что на практике очень часто хочется проводить кучу экспериментов одновременно. В этом случае вы, скорее всего, столкнетесь с ситуацией, когда будете непроизвольно завышать вероятность ошибки I рода. 🧠 Почему так: Когда вы проводите несколько тестов одновременно, суммарная вероятность получить ложноположительный результат увеличивается. Если в каждой отдельной проверке вероятность ошибки I рода составляет 5%, то с ростом числа проверок вероятность ложноположительных результатов значительно возрастает, что может привести к ошибочным выводам. ❗ Как можно бороться: - Метод Бонферрони: Деление уровня значимости альфа на количество проведенных тестов (α / n). Это простой и консервативный метод, который уменьшает вероятность ошибки I рода, но делает критерии для обнаружения значимых эффектов более строгими. - Метод Холма: Менее консервативный метод, чем Бонферрони. Он поэтапно корректирует уровень значимости для каждого теста, ранжируя p-значения от наименьшего к наибольшему и применяя корректировку на каждом этапе. - И другие методы, контролирующие FWER (Family-wise error rate): Например, процедура Бенджамини-Хохберга для контроля ложных открытий (FDR), которая позволяет более гибко подходить к множественным проверкам и лучше сохраняет мощность тестов. Эти методы помогут вам уменьшить вероятность ложноположительных результатов при множественных тестированиях и обеспечить более достоверные выводы. 📚 Подробности и примеры кода для реализации различных методов можно найти в этой статье Если хотите больше постов про A/B-тесты - накидывайте 🔥 этому посту!

Показати все...

Проблема множественного тестирования на практике

Нередко случаются ситуации, когда в A/B экспериментах ну очень хочется нужно проверять сразу несколько гипотез на одном и том же наборе данных, то есть в качестве тестового варианта использовать не...

🔥 61👍 9❤ 4

💻 Пост легендарных вакансий! Интересуетесь Data Science? Хотите сделать вклад в развитие канала, лучше познать область и подзаработать? Всем привет, на связи Рома Васильев, создатель этого канала 🙂 Я сейчас активно думаю над развитием концепции канала - какой контент делать и какую ценность давать. Однако, очень хочется не останавливаться в производстве контента. А на это нужно время, много времени. В связи с этим, ищу помощника! В первую очередь - искать полезный контент и писать статьи Что хочется от кандидата: - Высшее (возможно, неоконченное) техническое образование - Опыт с написанием каких угодно текстов (от постов в личный канал до технических текстов) - Активность и наличие свободного времени (от 5 часов в неделю) Что предлагаю кандидату: - Большие объёмы новой информации, которую - Инсайты из своего личного опыта - Сдельную оплату (суммы обсуждаемы) Что стало с предыдущем помощником: он пошёл работать аналитиком данных в Яндекс и теперь ему не до этого 🙂 Если предложение заинтересовало - заполните короткую форму

Показати все...

❤ 24🔥 12❤‍🔥 5

📊 Задачи на байесовскую статистику от ведущих компаний Байесовская статистика – это мощный инструмент для анализа данных и принятия решений в условиях неопределенности. Ее активно используют в различных областях, от медицинской диагностики до машинного обучения. А еще байесовские задачи часто задают на собеседованиях в топовые компании! Мы подготовили для вас три интересные задачи на байесовскую статистику. Попробуйте решить их самостоятельно: 1. В компании работают 80% программистов и 20% аналитиков данных. Программисты в среднем реже допускают ошибки в коде. Какова вероятность, что случайно выбранное исправление бага сделано аналитиком данных, если известно, что эта ошибка повторялась 3 раза до полного устранения? 2. В медицинском тесте на редкое заболевание вероятность ложноположительного результата составляет 5%, а истинного положительного – 99%. Если у человека положительный тест, какова вероятность, что у него действительно есть заболевание? 3. В конвейере по производству деталей 95% продукции соответствует стандартам качества. На линии контроля отобрали партию из 10 деталей, в которой обнаружили 3 бракованных. Какова вероятность, что конвейер работает неправильно? Вот здесь можно поразбираться с теорией и нарешать задачки 🙂 Ставьте лайки 👍, если хотите больше таких задач и поделитесь своими решениями в комментариях!

Показати все...

Расскажем подробнее о том, что такое Теорема Байеса. Применение Теоремы Байеса в Data Science, формула, задачи, примеры.

👍 42🔥 6❤ 2😁 1

Фото недоступнеДивитись в Telegram

Yandex приглашает поучаствовать в Practical ML Conf 14 сентября! На конференции поговорим о том, как применять ML-технологии в бизнесе и реальных продуктах. Регистрируйтесь уже сейчас — те, кто сделает это раньше всех, попадут на закрытый мини-ивент в июле. А если хотите поделиться своим опытом в ML, станьте спикером, оставив заявку. Ключевые темы конференции — CV, RecSys, MLOps, NLP, Speech и Analytics. После подачи программный комитет рассмотрит заявки и примет решение об участии каждого претендента. 🔹 Сбор заявок завершится 13 июля. Реклама. ООО "Яндекс", ИНН 7736207543.

Показати все...

👍 13❤ 3🔥 3😁 1

🧑‍🏫 Открытый курс по прикладной статистике от Академии Аналитиков Авито (часть первая) Ребята из Авито сделали крутой курс по прикладной статистике. А мы специально для вас разбили его на блоки! Можете выбрать то, что интересно именно вам и пойти освежить знания по теме 🙂 1. Статистический критерий 1.1 Статистический критерий 1.2 Создание статистических критериев в Python 1.3 Cтатистический критерий уровня статзначимости α 1.4. Двусторонние критерии 2. Статистическая мощность 2.1. Статистическая мощность 2.2. Мощность для задачи про доставку 2.3. Minimum Detectable Effect - MDE 2.4. Доверительный интервал 2.4/1. Доверительный интервал. Продолжение 2.4/2. Доверительный интервал Уилсона 2.5. Алгоритм проверки гипотез 3. Z-test 3.1. Критерии сравнения средних 3.2. Z-test 3.3. Занятие со звездочкой, Z-test 4. T-test 4.1. Критерии сравнения средних. T-критерий Стьюдента 4.2. T-test 4.3. Доверительный интервал 4.4. АБ-тесты. Двувыборочный Т-test 4.5. MDE для T-test 5. Метод Монте-Карло 5.1. Метод Монте-Карло 5.2. Метод Монте-Карло (на исторических данных) 5.3. Метод Монте-Карло (определение мощности на исторических данных) Вот здесь можно найти ноутбуки по курсу Накидайте 🔥 это посту если хотите больше материалов по прикладной статистике 🙂

Показати все...

1.2. Создаем статистические критерии в Python

00:00 Биномиальное распределение и функция вероятности в Python04:08 Построение графика распределения07:44 Кумулятивная функция распределения и квантиль11:49...

🔥 190👍 10❤ 9

Оберіть інший тариф

На вашому тарифі доступна аналітика тільки для 5 каналів. Щоб отримати більше — оберіть інший тариф.