uz
Feedback
Библиотека задач по Data Science | тесты, код, задания

Библиотека задач по Data Science | тесты, код, задания

Kanalga Telegram’da o‘tish

Задачи и тесты по Data Science для тренировки и обучения. Курс по Ai-агентам: https://clc.to/9L0Tqg По рекламе: @proglib_adv Учиться у нас: https://proglib.io/w/fa77bf4e Для обратной связи: @proglibrary_feeedback_bot

Ko'proq ko'rsatish
4 012
Obunachilar
-224 soatlar
-57 kunlar
-630 kunlar
Postlar arxiv
Какая из следующих архитектур нейронных сетей часто используется для решения задачи сегментации изображений, где каждый пиксель изображения относится к определенному классу или объекту?
Anonymous voting

Разбор вчерашней задачи Фильтрация, включающая только 2019 год, join с Users, groupby, count, переименовывание.
Разбор вчерашней задачи Фильтрация, включающая только 2019 год, join с Users, groupby, count, переименовывание.

Table: Users +----------------+---------+ | Column Name | Type | +----------------+---------+ | user_id | int | | join_date | date | | favorite_brand | varchar | +----------------+---------+ user_id — это первичный ключ (столбец с уникальными значениями) таблицы. В этой таблице содержится информация о пользователях веб-сайта интернет-магазинов, где пользователи могут продавать и покупать товары. Table: Orders +---------------+---------+ | Column Name | Type | +---------------+---------+ | order_id | int | | order_date | date | | item_id | int | | buyer_id | int | | seller_id | int | +---------------+---------+ order_id — это первичный ключ (столбец с уникальными значениями) таблицы. item_id — это внешний ключ (ссылочный столбец) таблицы Items. buyer_id и seller_id — внешние ключи таблицы Users. Table: Items +---------------+---------+ | Column Name | Type | +---------------+---------+ | item_id | int | | item_brand | varchar | +---------------+---------+ item_id — это первичный ключ (столбец с уникальными значениями) этой таблицы. Напишите решение в котором нужно найти для каждого пользователя: дату присоединения и количество заказов, которые он сделал в качестве покупателя в 2019 году. Решение разбираем завтра

Решение вчерашней задачи Самый простой способ — создать 2 критерия, которые позже будут использоваться в .isin(): Это делаетс
Решение вчерашней задачи Самый простой способ — создать 2 критерия, которые позже будут использоваться в .isin(): Это делается для того, чтобы мы удалили все строки, в которых lat и lon не уникальны (keep = False гарантирует, что мы не оставим ни одного дублированного экземпляра, как это обычно происходит) - оставьте только столбец pid: Insurance.drop_duulates(subset = ['lat','lon'], Keep = False).pid Та же логика, но на этот раз нам нужно дублировать: not_uniq_tiv_2015 = Insurance.loc[insurance.duulated(subset = 'tiv_2015', Keep=False)].pid После этого просто возвращаем сумму тех tiv_2016, которые остались после фильтрации по двум созданным ранее критериям.

+-------------+-------+ | Column Name | Type | +-------------+-------+ | pid | int | | tiv_2015 | float | | tiv_2016 | float | | lat | float | | lon | float | +-------------+-------+ pid — это первичный ключ (столбец с уникальными значениями) для этой таблицы. Каждая строка этой таблицы содержит информацию об одном полисе, где: pid — идентификатор полиса страхователя. tiv_2015 — общая стоимость инвестиций в 2015 году, а tiv_2016 — общая стоимость инвестиций в 2016 году. lat — широта города страхователя. Гарантируется, что lat не равен NULL. lon — долгота города страхователя. Гарантируется, что lon не равен NULL. Напишите решение для отчета о сумме общей стоимости инвестиций в 2016 году tiv_2016 для всех страхователей, которые: - имеют то же значение tiv_2015, что и один или несколько других держателей полисов - не находятся в том же городе, что и любой другой страхователь (т. е. пары атрибутов (широта, долгота) должны быть уникальными). Округлите tiv_2016 до двух десятичных знаков. Решение разберем завтра

Ранжирование - это операция, заключающаяся в том, что наблюдаемые значения случайной величины располагаются в порядке
Anonymous voting

Дан вариационный ряд. Если все варианты увеличить в одно и то же количество раз, то средняя арифметическая
Anonymous voting

Как называется метод, который использует стохастическую случайную выборку из тренировочных данных для создания разных версий модели и усредняет их предсказания для улучшения обобщающей способности?
Anonymous voting

Допустим, у нас есть набор данных о продажах различных продуктов в разных магазинах. Мы хотим вычислить общую выручку и среднюю цену продукта для каждого магазина, какой код эффективнее:
Anonymous voting

Два простых решения, какое работает быстрее?
Anonymous voting

Задача из раздела простых, показываем два простых решения +-------------+---------+ | Column Name | Type | +-------------+---
+1
Задача из раздела простых, показываем два простых решения +-------------+---------+ | Column Name | Type | +-------------+---------+ | id | int | | name | varchar | | salary | int | | managerId | int | +-------------+---------+ Нужно по заданной таблице вывести имена работников, которые зарабатывают больше своих менеджеров.

Пробовали ли вы обучить LLM или любой другой генератор текста на своих данных и что у вас выходило?
Пробовали ли вы обучить LLM или любой другой генератор текста на своих данных и что у вас выходило?

Вы анализируете данные о доходах клиентов компании. Вам необходимо обнаружить аномалии в распределении доходов. Какой метод наиболее подходит для обнаружения выбросов?
Anonymous voting

Каким будет результат выполнения кода?
Anonymous voting

Что выведет код?
Anonymous voting

Что выведет данный код?
Anonymous voting