es
Feedback
Библиотека задач по Data Science | тесты, код, задания

Библиотека задач по Data Science | тесты, код, задания

Ir al canal en Telegram

Задачи и тесты по Data Science для тренировки и обучения. Курс по Ai-агентам: https://clc.to/9L0Tqg По рекламе: @proglib_adv Учиться у нас: https://proglib.io/w/fa77bf4e Для обратной связи: @proglibrary_feeedback_bot

Mostrar más
4 012
Suscriptores
-224 horas
-57 días
-630 días
Archivo de publicaciones
Какая из следующих архитектур нейронных сетей часто используется для решения задачи сегментации изображений, где каждый пиксель изображения относится к определенному классу или объекту?
Anonymous voting

Разбор вчерашней задачи Фильтрация, включающая только 2019 год, join с Users, groupby, count, переименовывание.
Разбор вчерашней задачи Фильтрация, включающая только 2019 год, join с Users, groupby, count, переименовывание.

Table: Users +----------------+---------+ | Column Name | Type | +----------------+---------+ | user_id | int | | join_date | date | | favorite_brand | varchar | +----------------+---------+ user_id — это первичный ключ (столбец с уникальными значениями) таблицы. В этой таблице содержится информация о пользователях веб-сайта интернет-магазинов, где пользователи могут продавать и покупать товары. Table: Orders +---------------+---------+ | Column Name | Type | +---------------+---------+ | order_id | int | | order_date | date | | item_id | int | | buyer_id | int | | seller_id | int | +---------------+---------+ order_id — это первичный ключ (столбец с уникальными значениями) таблицы. item_id — это внешний ключ (ссылочный столбец) таблицы Items. buyer_id и seller_id — внешние ключи таблицы Users. Table: Items +---------------+---------+ | Column Name | Type | +---------------+---------+ | item_id | int | | item_brand | varchar | +---------------+---------+ item_id — это первичный ключ (столбец с уникальными значениями) этой таблицы. Напишите решение в котором нужно найти для каждого пользователя: дату присоединения и количество заказов, которые он сделал в качестве покупателя в 2019 году. Решение разбираем завтра

Решение вчерашней задачи Самый простой способ — создать 2 критерия, которые позже будут использоваться в .isin(): Это делаетс
Решение вчерашней задачи Самый простой способ — создать 2 критерия, которые позже будут использоваться в .isin(): Это делается для того, чтобы мы удалили все строки, в которых lat и lon не уникальны (keep = False гарантирует, что мы не оставим ни одного дублированного экземпляра, как это обычно происходит) - оставьте только столбец pid: Insurance.drop_duulates(subset = ['lat','lon'], Keep = False).pid Та же логика, но на этот раз нам нужно дублировать: not_uniq_tiv_2015 = Insurance.loc[insurance.duulated(subset = 'tiv_2015', Keep=False)].pid После этого просто возвращаем сумму тех tiv_2016, которые остались после фильтрации по двум созданным ранее критериям.

+-------------+-------+ | Column Name | Type | +-------------+-------+ | pid | int | | tiv_2015 | float | | tiv_2016 | float | | lat | float | | lon | float | +-------------+-------+ pid — это первичный ключ (столбец с уникальными значениями) для этой таблицы. Каждая строка этой таблицы содержит информацию об одном полисе, где: pid — идентификатор полиса страхователя. tiv_2015 — общая стоимость инвестиций в 2015 году, а tiv_2016 — общая стоимость инвестиций в 2016 году. lat — широта города страхователя. Гарантируется, что lat не равен NULL. lon — долгота города страхователя. Гарантируется, что lon не равен NULL. Напишите решение для отчета о сумме общей стоимости инвестиций в 2016 году tiv_2016 для всех страхователей, которые: - имеют то же значение tiv_2015, что и один или несколько других держателей полисов - не находятся в том же городе, что и любой другой страхователь (т. е. пары атрибутов (широта, долгота) должны быть уникальными). Округлите tiv_2016 до двух десятичных знаков. Решение разберем завтра

Ранжирование - это операция, заключающаяся в том, что наблюдаемые значения случайной величины располагаются в порядке
Anonymous voting

Дан вариационный ряд. Если все варианты увеличить в одно и то же количество раз, то средняя арифметическая
Anonymous voting

Как называется метод, который использует стохастическую случайную выборку из тренировочных данных для создания разных версий модели и усредняет их предсказания для улучшения обобщающей способности?
Anonymous voting

Допустим, у нас есть набор данных о продажах различных продуктов в разных магазинах. Мы хотим вычислить общую выручку и среднюю цену продукта для каждого магазина, какой код эффективнее:
Anonymous voting

Два простых решения, какое работает быстрее?
Anonymous voting

Задача из раздела простых, показываем два простых решения +-------------+---------+ | Column Name | Type | +-------------+---
+1
Задача из раздела простых, показываем два простых решения +-------------+---------+ | Column Name | Type | +-------------+---------+ | id | int | | name | varchar | | salary | int | | managerId | int | +-------------+---------+ Нужно по заданной таблице вывести имена работников, которые зарабатывают больше своих менеджеров.

Пробовали ли вы обучить LLM или любой другой генератор текста на своих данных и что у вас выходило?
Пробовали ли вы обучить LLM или любой другой генератор текста на своих данных и что у вас выходило?

Вы анализируете данные о доходах клиентов компании. Вам необходимо обнаружить аномалии в распределении доходов. Какой метод наиболее подходит для обнаружения выбросов?
Anonymous voting

Каким будет результат выполнения кода?
Anonymous voting

Что выведет код?
Anonymous voting

Что выведет данный код?
Anonymous voting

Библиотека задач по Data Science | тесты, код, задания - Estadísticas y analítica del canal de Telegram @ds_problems_lib