⚡️
Анализ и прогнозирование временных рядов: подборка датасетов для практики
Умение работать с временными рядами — один и важных навыков, которым необходимо обладать специалисту по Data Science. Собрали для вас
9 датасетов, с помощью которых можно потренироваться решать задачи, связанные с временными рядами, из различных областей:
▫️
Inventory Optimization: Датасет, который служит основой для анализа методов прогнозирования спроса и оптимизации запасов. Содержит исторические данные, относящиеся к конкретному продукту за определенный период времени: информацию о дате, спросе на продукт и текущем уровне запасов.
▫️
Website Performance: Набор данных о посещаемости веб-сайта, включающий множество переменных различных типов: дата и время сеанса, количество пользователей, среднее время пребывания на сайте, события за сессию, коэффициент вовлеченности, маркетинговые каналы и другие.
▫️
Monthly producer price index for butter: В этом датасете отслеживается один из ключевых экономических показателей — индекс цен производителей на сливочное масло. Данные охватывают период с января 1975 года по декабрь 2016 года. Каждая запись включает дату и соответствующее значение ИЦП для сливочного масла.
▫️
Daily marine data: Набор данных содержит различные метеорологические наблюдения, зарегистрированные в разное время и в разных местах. Данные включают координаты широты и долготы, время наблюдения и ряд таких параметров, как температура воздуха, температура поверхности моря, давление, направление и скорость ветра, облачность и характеристики волн.
▫️
Accelerometer Data: Набор данных содержит показания акселерометра и включает в себя такие переменные, как дата, время и значения ускорения по осям x, y и z. Анализ этих данных представляет собой сложную задачу из-за их высокочастотного характера и необходимости точной фиксации сложных моделей и движений.
▫️
EEG Eye State Dataset: Этот датасет содержит информацию о том, были ли открыты глаза человека в конкретный момент. Всего имеется 14 980 наблюдений и 15 переменных. Значение класса «1» означает закрытые глаза, а «0» — открытые. Данные упорядочены по времени, а наблюдения регистрировались в течение 117 секунд. Цель задачи — предсказать состояние глаз, основываясь только на предоставленных данных.
▫️
Occupancy Detection Dataset: В этом наборе данных содержатся различные сведения о помещении в определенный временной период. Датасет предоставляет 20 560 одноминутных наблюдений, сделанных в течение нескольких недель. Помимо бинарной переменной, определяющей занятость помещения, предоставляется информация о различных световых и климатических характеристиках.
▫️
Numenta Anomaly Benchmark: Датасет представляет собой коллекцию реальных и искусственных данных временных рядов и используется для оценки алгоритмов обнаружения аномалий. Он включает в себя разнообразные данные временных рядов, которые охватывают различные области.
▫️
Stock Market Data of Multiple Companies: Набор данных включает в себя ежедневные цены акций нескольких компаний и содержит сведения о датах, ценах открытия, самых высоких и низких ценах, ценах закрытия и объемах торгов. С помощью датасета можно потренироваться решать сложные задачи анализа временных рядов и многомерного прогнозирования, в которой необходимо учитывать множество факторов, оказывающих влияние на цену акций в разных компаниях.