Start Career in DS

Тут публикуются материалы для прокачки скиллов в DS и подготовки к собеседованиям. Пишем про технические тулзы, визуализацию данных, бизнесовые задачи, разбираем ML-алгоритмы и обсуждаем смежные темы :) Автор: @RAVasiliev

مشاركات الإعلانات

10 200

المشتركون

-424 ساعات

-87 أيام

+2130 أيام

4 660

عرض المشاهدات

~ 1 88424 ساعات

~ 2 27048 ساعات

45.70%

معدل المشاركة

18.5%24 ساعات

22.3%48 ساعات

الإشارات

لا توجد بيانات7 أيام

لا توجد بيانات30 أيام

لا توجد بيانات

المشاركات في اليوم

~ 49

ردود

~ 7

تعليقات

~ 114

إعادة

المشتركون
التغطية البريدية
ER - نسبة المشاركة

جاري تحميل البيانات...

Photo unavailableShow in Telegram

Начните карьеру в ИТ и бизнесе с помощью программы бакалавриата в Центральном университете! Поступайте на одно из направлений по искусственному интеллекту, разработке и бизнес-аналитике. Пока ждете результаты экзаменов, не теряйте время и попробуйте себя в конкурсе грантов. Преимущества грантов от Центрального университета: - Может покрыть до 100% стоимости обучения; - Выдается на весь период учебы; Не уменьшится, но может увеличиться за достижения и успехи в учебе Попробуйте свои силы в конкурсе сейчас, а с 20 июня направляйте документы для поступления по результатам ЕГЭ. Подробная информация про университет, конкурс грантов и обучение здесь erid:2Vtzquo9L2i Реклама, АНО ВО «Центральный университет», ИНН 7743418023

إظهار الكل...

🔥 8👍 3❤ 3😁 1

🦸 Рома Васильев про данные, аналитику и жизнь Готовы ли вы погрузиться в мысли про аналитику, образование и повседневную жизнь гулбже?) Если да - рекомендуем подписаться на канал Ромы, автора Start Career in DS В нём вы найдёте кучу интеренсых материалов, например: - Про ключевые навыки в современном мире - Цикл Колба или как мы учимся - Роль аналитики в компании - Про использование ChatGPT в повседневной жизни Подписывайтесь: @ravasiliev_ch!

إظهار الكل...

Рома Васильев про данные, аналитику и жизнь

Мысли про жизнь, карьеру, развитие в аналитике данных и не только :)

❤ 7👍 6🔥 3

Photo unavailableShow in Telegram

🤖 Яндекс запустил Lite-версию генеративной текстовой модели YandexGPT 3 YandexGPT 3 Lite — это облегчённая версия генеративной модели Яндекса нового поколения. Особенность таких Lite-моделей заключается в более высокой скорости ответов, что позволяет решать простые задачи бизнеса буквально в режиме реального времени. Поэтому нейросеть хорошо показывает себя в сценариях, где важны время реакции и оптимизация затрат: например, бот-консультант на сайте, система подсказок для операторов колл-центров или суммаризатор результатов деловых встреч. ✈️ По данным замеров, YandexGPT 3 Lite стала ещё быстрее и точнее — и она уже доступна в режиме release candidate на облачной платформе Yandex Cloud. То есть клиенты могут протестировать её и плавно внедрить в свои продукты через API уже в ближайшее время. Одним из ключевых этапов обучения модели стало выравнивание (Alignment), включающее в том числе стадию обучения с подкреплением (RL). Если вы давно хотели разобраться в том, как работают GPT-подобные модели - читайте статью на Хабре, в ней авторы попытались разложить всё на пальцах 🙂

إظهار الكل...

👍 12❤ 4🔥 2

🎯 Множественное тестирование в A/B экспериментах На различных курсах часто рассказывают про то, как проводить A/B-тесты. Чаще всего групп в академических задачах собственно две: А и В. Что тут может пойти не так? То, что на практике очень часто хочется проводить кучу экспериментов одновременно. В этом случае вы, скорее всего, столкнетесь с ситуацией, когда будете непроизвольно завышать вероятность ошибки I рода. 🧠 Почему так: Когда вы проводите несколько тестов одновременно, суммарная вероятность получить ложноположительный результат увеличивается. Если в каждой отдельной проверке вероятность ошибки I рода составляет 5%, то с ростом числа проверок вероятность ложноположительных результатов значительно возрастает, что может привести к ошибочным выводам. ❗ Как можно бороться: - Метод Бонферрони: Деление уровня значимости альфа на количество проведенных тестов (α / n). Это простой и консервативный метод, который уменьшает вероятность ошибки I рода, но делает критерии для обнаружения значимых эффектов более строгими. - Метод Холма: Менее консервативный метод, чем Бонферрони. Он поэтапно корректирует уровень значимости для каждого теста, ранжируя p-значения от наименьшего к наибольшему и применяя корректировку на каждом этапе. - И другие методы, контролирующие FWER (Family-wise error rate): Например, процедура Бенджамини-Хохберга для контроля ложных открытий (FDR), которая позволяет более гибко подходить к множественным проверкам и лучше сохраняет мощность тестов. Эти методы помогут вам уменьшить вероятность ложноположительных результатов при множественных тестированиях и обеспечить более достоверные выводы. 📚 Подробности и примеры кода для реализации различных методов можно найти в этой статье Если хотите больше постов про A/B-тесты - накидывайте 🔥 этому посту!

إظهار الكل...

Проблема множественного тестирования на практике

Нередко случаются ситуации, когда в A/B экспериментах ну очень хочется нужно проверять сразу несколько гипотез на одном и том же наборе данных, то есть в качестве тестового варианта использовать не...

🔥 57👍 7❤ 3

💻 Пост легендарных вакансий! Интересуетесь Data Science? Хотите сделать вклад в развитие канала, лучше познать область и подзаработать? Всем привет, на связи Рома Васильев, создатель этого канала 🙂 Я сейчас активно думаю над развитием концепции канала - какой контент делать и какую ценность давать. Однако, очень хочется не останавливаться в производстве контента. А на это нужно время, много времени. В связи с этим, ищу помощника! В первую очередь - искать полезный контент и писать статьи Что хочется от кандидата: - Высшее (возможно, неоконченное) техническое образование - Опыт с написанием каких угодно текстов (от постов в личный канал до технических текстов) - Активность и наличие свободного времени (от 5 часов в неделю) Что предлагаю кандидату: - Большие объёмы новой информации, которую - Инсайты из своего личного опыта - Сдельную оплату (суммы обсуждаемы) Что стало с предыдущем помощником: он пошёл работать аналитиком данных в Яндекс и теперь ему не до этого 🙂 Если предложение заинтересовало - заполните короткую форму

إظهار الكل...

❤ 23🔥 9❤‍🔥 4

📊 Задачи на байесовскую статистику от ведущих компаний Байесовская статистика – это мощный инструмент для анализа данных и принятия решений в условиях неопределенности. Ее активно используют в различных областях, от медицинской диагностики до машинного обучения. А еще байесовские задачи часто задают на собеседованиях в топовые компании! Мы подготовили для вас три интересные задачи на байесовскую статистику. Попробуйте решить их самостоятельно: 1. В компании работают 80% программистов и 20% аналитиков данных. Программисты в среднем реже допускают ошибки в коде. Какова вероятность, что случайно выбранное исправление бага сделано аналитиком данных, если известно, что эта ошибка повторялась 3 раза до полного устранения? 2. В медицинском тесте на редкое заболевание вероятность ложноположительного результата составляет 5%, а истинного положительного – 99%. Если у человека положительный тест, какова вероятность, что у него действительно есть заболевание? 3. В конвейере по производству деталей 95% продукции соответствует стандартам качества. На линии контроля отобрали партию из 10 деталей, в которой обнаружили 3 бракованных. Какова вероятность, что конвейер работает неправильно? Вот здесь можно поразбираться с теорией и нарешать задачки 🙂 Ставьте лайки 👍, если хотите больше таких задач и поделитесь своими решениями в комментариях!

إظهار الكل...

Расскажем подробнее о том, что такое Теорема Байеса. Применение Теоремы Байеса в Data Science, формула, задачи, примеры.

👍 41🔥 5❤ 1

Photo unavailableShow in Telegram

Yandex приглашает поучаствовать в Practical ML Conf 14 сентября! На конференции поговорим о том, как применять ML-технологии в бизнесе и реальных продуктах. Регистрируйтесь уже сейчас — те, кто сделает это раньше всех, попадут на закрытый мини-ивент в июле. А если хотите поделиться своим опытом в ML, станьте спикером, оставив заявку. Ключевые темы конференции — CV, RecSys, MLOps, NLP, Speech и Analytics. После подачи программный комитет рассмотрит заявки и примет решение об участии каждого претендента. 🔹 Сбор заявок завершится 13 июля. Реклама. ООО "Яндекс", ИНН 7736207543.

إظهار الكل...

👍 13❤ 3🔥 3😁 1

🧑‍🏫 Открытый курс по прикладной статистике от Академии Аналитиков Авито (часть первая) Ребята из Авито сделали крутой курс по прикладной статистике. А мы специально для вас разбили его на блоки! Можете выбрать то, что интересно именно вам и пойти освежить знания по теме 🙂 1. Статистический критерий 1.1 Статистический критерий 1.2 Создание статистических критериев в Python 1.3 Cтатистический критерий уровня статзначимости α 1.4. Двусторонние критерии 2. Статистическая мощность 2.1. Статистическая мощность 2.2. Мощность для задачи про доставку 2.3. Minimum Detectable Effect - MDE 2.4. Доверительный интервал 2.4/1. Доверительный интервал. Продолжение 2.4/2. Доверительный интервал Уилсона 2.5. Алгоритм проверки гипотез 3. Z-test 3.1. Критерии сравнения средних 3.2. Z-test 3.3. Занятие со звездочкой, Z-test 4. T-test 4.1. Критерии сравнения средних. T-критерий Стьюдента 4.2. T-test 4.3. Доверительный интервал 4.4. АБ-тесты. Двувыборочный Т-test 4.5. MDE для T-test 5. Метод Монте-Карло 5.1. Метод Монте-Карло 5.2. Метод Монте-Карло (на исторических данных) 5.3. Метод Монте-Карло (определение мощности на исторических данных) Вот здесь можно найти ноутбуки по курсу Накидайте 🔥 это посту если хотите больше материалов по прикладной статистике 🙂

إظهار الكل...

1.2. Создаем статистические критерии в Python

00:00 Биномиальное распределение и функция вероятности в Python04:08 Построение графика распределения07:44 Кумулятивная функция распределения и квантиль11:49...

🔥 190👍 10❤ 9

🪙 Как понять честная ли монетка/случайно ли работает алгоритм? Классическая задачка, которую в разных вариациях часто спрашивают на собеседованиях. Вот в этом видео можно подробно на экспериментах понять как оно работает: видео Вот здесь можно проверить свою интуицию и самостоятельно попробовать половить обманщиков на монетках: тык Если коротко, алгоритм такой (и он очень похож на процесс проведения АВ тестов!): 1. Фиксируем ошибку 1 и 2 рода. Ошибка 1 рода = как часто мы будем ошибочно говорить что монетка нечестная, когда она честная. Обычно берут за 0.05 Ошибка 2 рода = как часто мы будем ошибочно говорить что монетка честная, когда она нечестная. Обычно берут за 0.2 2. Считаем требуемый объём выборки. Это хорошо бы уметь делать руками, но для тренировки есть калькуляторы, например этот В нашем случае он зависит от трех факторов: ошибки 1 и 2 рода (которую мы выбрали на шаге 1) и MDE (минимального эффекта, который мы хотим наблюдать). К примеру, если мы видеть отклонение монетки на 20% (если вероятность орла 0.6 место 0.5), то нам нужно 93 подбарсывания, а если хотим видеть отклонение монетки на 10% (вероятность орла 0.55 место 0.5), то нужно уже 388 подбрасываний 3. Проводим эксперимент - ряд подбрасываний монетки согласно рассчитанному в пункте 2 числу 4. Считаем с какой вероятностью мы могли получить такое или более критическое значение (долю орлов/решки) при условии, что монетка честная. Если это значение получается больше 0.05, то говорим, что монетка нечестная, а если меньше 0.05 - говорим, что в условиях нашго теста мы не можем сказать, что монетка нечестная Это значение называется p-value. А как его считать - вы можете как раз подробно посмотреть в видео

إظهار الكل...

How To Catch A Cheater With Math

Try catching cheaters yourself:

https://primerlearning.org/Support

these videos on Patreon:

https://www.patreon.com/primerlearningPlush

blobs and other stuff...

👍 22❤ 8❤‍🔥 2

Ребята из Changellenge » Education проводят бесплатный интенсив «Аналитика за шесть уроков». Если вы давно хотели попробовать аналитику данных, но по какой-то причине сомневались - мероприятие вам точно подойдет. Вне зависимости от возраста и начального образования Что будет на курсе: ✔️ Вы получите базу по основным аналитическим инструментам: SQL, Python, Excel; ✔️ Порешаете прикладные задачи вместе с экспертами; ✔️ Сможете прочувствовать индустрию на себе; ✔️ Разберетесь с направлениями внутри анализа данных и поймете что более интересно именно вам. В конце курса вам дадут сертификат и план дальнейшей прокачки навыков. Важно: прохождение курса вас ни к чему не обязывает, но ребята из Changellenge >> Education дают скидку в 15к для всех участников интенсива (при регистрации до 30 апреля). Зарегистрироваться можно по ссылке Реклама. ООО "Высшая Школа Аналитики и Стратегии". ИНН 7716917009. erid: 2VtzqwcNk7A

إظهار الكل...

👍 8❤‍🔥 3❤ 2