Библиотека собеса по Data Science | вопросы с собеседований

Kanalga Telegram’da o‘tish

Вопросы с собеседований по Data Science и ответы на них. Курс по Ai-агентам: https://clc.to/9L0Tqg По рекламе: @proglib_adv Учиться у нас: https://proglib.io/w/7dfb7235 Для обратной связи: @proglibrary_feeedback_bot

Ko'proq ko'rsatish

Tarmoq:Книги для программистов Rossiya124 420 Karyera6 894

4 487

Obunachilar

-224 soatlar

+17 kunlar

+3430 kunlar

559

Post ko'rishlar

~ 26824 soatlar

~ 33748 soatlar

12.46%

Muloqot nisbati

~ 1

Kuniga postlar

Ads index

beta

Postlar arxiv

4 487

Что такое ансамбль методов? Ансамбль методов — это использование нескольких алгоритмов с целью получения более высокой эффективности прогнозирования, чем можно было бы получить, используя эти алгоритмы отдельно.

4 487

Когда вы выберете K-средние, а когда DBScan? DBScan более устойчив к шуму. DBScan лучше подходит, когда количество кластеров трудно угадать. K-means имеет меньшую сложность, т. е. будет намного быстрее, особенно при большем количестве точек.

4 487

Что такое временной ряд? Временной ряд — это набор наблюдений, упорядоченных во времени, обычно собираемых через равные промежутки времени.

4 487

Что происходит, когда в наших данных есть коррелированные фичи? В случайном лесу, поскольку случайный лес выбирает некоторые объекты для построения каждого дерева, вероятность выбора информации, содержащейся в коррелированных объектах, в два раза выше, чем любая другая информация, содержащаяся в других объектах. В общем, когда вы добавляете коррелированные функции, это означает, что они линейно содержат одну и ту же информацию, и, следовательно, это снижает надежность вашей модели. Каждый раз, когда вы тренируете свою модель, она может выбирать ту или иную функцию, чтобы «выполнить одну и ту же работу», т. е. объяснить некоторую дисперсию, уменьшить энтропию и т. д.

4 487

🤖 Напоминаем, что у нас есть еженедельная email-рассылка, посвященная последним новостям и тенденциям в мире искусственного интеллекта. В ней: ● Новости о прорывных исследованиях в области машинного обучения и нейросетей ● Материалы о применении ИИ в разных сферах ● Статьи об этических аспектах развития технологий ● Подборки лучших онлайн-курсов и лекций по машинному обучению ● Обзоры инструментов и библиотек для разработки нейронных сетей ● Ссылки на репозитории с открытым исходным кодом ИИ-проектов ● Фильмы, сериалы и книги 👉Подписаться👈

4 487

Что такое объединение в CNN? Зачем нам это нужно? Объединение — это метод понижения разрешения карты объектов. Это позволяет слоям, которые получают относительно неискаженные версии входных данных, изучать низкоуровневые функции, такие как линии, в то время как более глубокие слои модели могут изучать более абстрактные функции, такие как текстура.

4 487

Знаете ли вы какие-либо способы получения вложений слов? TF-IDF GloVe BERT

4 487

Как мы можем узнать, какие функции более важны для модели дерева решений? Часто мы хотим найти такое разделение, которое минимизирует сумму примесей узлов. Критерий примеси является параметром деревьев решений. Популярными методами измерения примеси являются примесь Джини и энтропия, описывающая прирост информации.

4 487

Что такое обмен значениями при помощи кортежей? Один из популярных трюков в Python – обмен значениями без создания временной переменной. Способ применим для любого числа переменных. В правой части инструкции присваивания последовательностей допускается указывать любые итерируемые объекты. Главное, чтобы число элементов слева равнялось числу элементов справа. Такое присваивание применяется и для сложных вложенных конструкций.

4 487

Самые полезные каналы для программистов в одной подборке! Сохраняйте себе, чтобы не потерять 💾 🔥Для всех Библиотека программиста — новости, статьи, досуг, фундаментальные темы Книги для программистов IT-мемы Proglib Academy — тут мы рассказываем про обучение и курсы 🐘PHP Библиотека пхпшника Вакансии по PHP, Symfony, Laravel Библиотека PHP для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования Библиотека задач по PHP — код, квизы и тесты 🐍Python Библиотека питониста Вакансии по питону, Django, Flask Библиотека Python для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования Библиотека задач по Python — код, квизы и тесты ☕Java Библиотека джависта — полезные статьи по Java, новости и обучающие материалы Библиотека Java для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования Библиотека задач по Java — код, квизы и тесты Вакансии для java-разработчиков 👾Data Science Библиотека Data Science — полезные статьи, новости и обучающие материалы Библиотека Data Science для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования Библиотека задач по Data Science — код, квизы и тесты Вакансии по Data Science, анализу данных, аналитике, искусственному интеллекту 🦫Go Библиотека Go разработчика — полезные статьи, новости и обучающие материалы по Go Библиотека Go для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования Библиотека задач по Go — код, квизы и тесты Вакансии по Go 🧠C++ Библиотека C/C++ разработчика — полезные статьи, новости и обучающие материалы по C++ Библиотека C++ для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования Библиотека задач по C++ — код, квизы и тесты Вакансии по C++ 💻Другие профильные каналы Библиотека фронтендера Библиотека шарписта Библиотека мобильного разработчика Библиотека хакера Библиотека devops’a Библиотека тестировщика 💼Каналы с вакансиями Вакансии по фронтенду, джаваскрипт, React, Angular, Vue Вакансии по C#, .NET, Unity Вакансии по PHP, Symfony, Laravel Вакансии по DevOps & SRE Вакансии для мобильных разработчиков Вакансии по QA тестированию InfoSec Jobs — вакансии по информационной безопасности 📁Чтобы добавить папку с нашими каналами, нажмите 👉сюда👈 🤖Также у нас есть боты: Бот с IT-вакансиями Бот с мероприятиями в сфере IT Мы в других соцсетях: 🔸VK 🔸YouTube 🔸Дзен 🔸Facebook 🔸Instagram

4 487

Что такое dropout? Почему это полезно? Как это работает? Dropout — это метод, который на каждом этапе обучения отключает каждый нейрон с определенной вероятностью p. Таким образом, на каждой итерации мы обучаем только 1-p нейронов, что заставляет сеть не полагаться только на подмножество нейронов для представления признаков. Это приводит к регуляризирующим эффектам, которые контролируются гиперпараметром p.

4 487

В чем разница между случайным лесом и повышением градиента? Функция «Случайные леса» строит каждое дерево независимо, а функция «Усиление градиента» строит по одному дереву за раз. Случайные леса объединяют результаты в конце процесса (путем усреднения или «правил большинства»), тогда как повышение градиента объединяет результаты по ходу процесса.

4 487

🧑‍💻 Статьи для IT: как объяснять и распространять значимые идеи Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом. Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций. Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах. 👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.

4 487

Как выглядит регуляризация L2 в линейной модели? Регуляризация L2 добавляет к нашей функции стоимости штраф, который равен сумме квадратов коэффициентов модели, умноженных на лямбда-гиперпараметр. Этот метод гарантирует, что коэффициенты близки к нулю, и широко используется в случаях, когда у нас есть много функций, которые могут коррелировать друг с другом.

4 487

Что такое bag of words? Как мы можем использовать его для классификации текста? ‍ Это представление текста, описывающее появление слов в документе. Порядок или структура слов не учитываются. Для классификации текста мы смотрим на гистограмму слов в тексте и рассматриваем каждое количество слов как признак.

4 487

Что такое ROC-кривая? Когда её использовать? ROC означает «Receiver Operating Characteristics». Схематическое изображение, показывающее контраст между истинно положительными показателями и ложноположительными. Она используется, когда нам нужно предсказать вероятность двоичного результата.

4 487

Когда бы вы использовали Adam, а когда SGD? Adam имеет тенденцию сходиться быстрее, тогда как SGD часто сходится к более оптимальным решениям.

4 487

Как узнать, сколько деревьев нам нужно в случайном лесу? Количество деревьев в случайном лесу обрабатывается n_estimators, а случайный лес уменьшает переобучение за счет увеличения количества деревьев. Не существует фиксированного эмпирического правила для определения количества деревьев в случайном лесу, оно довольно точно настраивается с учетом данных, обычно начиная с возведения в квадрат количества признаков (n), присутствующих в данных, с последующей настройкой, пока мы не получим получить оптимальные результаты.

4 487

Что такое регуляризация? Зачем нам это нужно? Регуляризация используется для уменьшения переобучения в моделях машинного обучения. Это помогает моделям хорошо обобщать и делать их устойчивыми к выбросам и шуму в данных.

4 487

Каковы основные параметры модели дерева решений? ✍️ максимальная глубина дерева ✍️ минимальные выборки на листовой узел ✍️ критерий примеси