长时序数据集
长时序数据集的下载和整理工具。
来源
ETTm2
*ETTm2 数据集监控中国某个省份区域的电力变压器,包括油温和负载变体(例如高有用负载和高无用负载),数据频率为十五分钟,时间范围从 2016 年 7 月到 2018 年 7 月。
参考文献:Zhou 等人,《Informer: Beyond Efficient Transformer for Long Sequence Time-Series Forecasting》。AAAI 2021。 https://arxiv.org/abs/2012.07436\*
来源
ETTm1
ETTm1 数据集监控中国某个省份区域的电力变压器,包括油温和负载变体(例如高有用负载和高无用负载),数据频率为十五分钟,时间范围从 2016 年 7 月到 2018 年 7 月。
来源
ETTh2
ETTh2 数据集监控中国某个省份区域的电力变压器,包括油温和负载变体(例如高有用负载和高无用负载),数据频率为每小时一次,时间范围从 2016 年 7 月到 2018 年 7 月。
来源
ETTh1
ETTh1 数据集监控中国某个省份区域的电力变压器,包括油温和负载变体(例如高有用负载和高无用负载),数据频率为每小时一次,时间范围从 2016 年 7 月到 2018 年 7 月。
来源
ECL
*Electricity 数据集报告了 321 位客户在 2012 年至 2014 年间的十五分钟电力消耗 (KWh)。为了可比性,我们将其按小时聚合。
参考文献:Li, S 等人,《Enhancing the locality and breaking the memory bottleneck of Transformer on time series forecasting》。NeurIPS 2019。 http://arxiv.org/abs/1907.00235.\*
来源
Exchange
*Exchange 数据集收集了八个国家相对于美元的每日汇率。这些国家包括澳大利亚、英国、加拿大、瑞士、中国、日本、新西兰和新加坡,时间范围从 1990 年到 2016 年。
参考文献:Lai, G., Chang, W., Yang, Y., and Liu, H。《Modeling Long and Short-Term Temporal Patterns with Deep Neural Networks》。SIGIR 2018。 http://arxiv.org/abs/1703.07015.\*
来源
TrafficL
*这个大型 Traffic 数据集由加州交通部收集,报告了 862 个传感器的道路每小时占用率,时间范围从 2015 年 1 月到 2016 年 12 月。
参考文献:Lai, G., Chang, W., Yang, Y., and Liu, H。《Modeling Long and Short-Term Temporal Patterns with Deep Neural Networks》。SIGIR 2018。 http://arxiv.org/abs/1703.07015。
Wu, H., Xu, J., Wang, J., and Long, M。《Autoformer: Decomposition Transformers with auto-correlation for long-term series forecasting》。NeurIPS 2021。 https://arxiv.org/abs/2106.13008.\*
来源
ILI
*该数据集报告了美国疾病控制与预防中心记录的每周流感样疾病 (ILI) 患者数据,时间范围从 2002 年到 2021 年。数据以每周 ILI 患者占总患者的比例衡量。
参考文献:Wu, H., Xu, J., Wang, J., and Long, M。《Autoformer: Decomposition Transformers with auto-correlation for long-term series forecasting》。NeurIPS 2021。 https://arxiv.org/abs/2106.13008.\*
来源
Weather
*该 Weather 数据集包含德国耶拿 Max Planck 生物地球化学研究所气象站 2020 年记录的 21 项气象测量数据,每 10 分钟记录一次。
参考文献:Wu, H., Xu, J., Wang, J., and Long, M。《Autoformer: Decomposition Transformers with auto-correlation for long-term series forecasting》。NeurIPS 2021。 https://arxiv.org/abs/2106.13008.\*
来源
LongHorizon
*这个 Long-Horizon 数据集封装类提供了下载和整理以下数据集的工具:
ETT, ECL, Exchange, Traffic, ILI 和 Weather。
- 每个数据集都使用训练数据的均值和标准差进行归一化。
- 数据集被划分为训练集、验证集和测试集。
- 对于所有数据集:70%、10% 和 20% 的观测数据分别用于训练、验证和测试,但 ETT 数据集使用 20% 进行验证。*