来源

ETTm2

 ETTm2 (freq:str='15T', name:str='ETTm2', n_ts:int=7, test_size:int=11520,
        val_size:int=11520, horizons:Tuple[int]=(96, 192, 336, 720))

*ETTm2 数据集监控中国某个省份区域的电力变压器,包括油温和负载变体(例如高有用负载和高无用负载),数据频率为十五分钟,时间范围从 2016 年 7 月到 2018 年 7 月。

参考文献:Zhou 等人,《Informer: Beyond Efficient Transformer for Long Sequence Time-Series Forecasting》。AAAI 2021。 https://arxiv.org/abs/2012.07436\*


来源

ETTm1

 ETTm1 (freq:str='15T', name:str='ETTm1', n_ts:int=7, test_size:int=11520,
        val_size:int=11520, horizons:Tuple[int]=(96, 192, 336, 720))

ETTm1 数据集监控中国某个省份区域的电力变压器,包括油温和负载变体(例如高有用负载和高无用负载),数据频率为十五分钟,时间范围从 2016 年 7 月到 2018 年 7 月。


来源

ETTh2

 ETTh2 (freq:str='H', name:str='ETTh2', n_ts:int=1, test_size:int=11520,
        val_size:int=11520, horizons:Tuple[int]=(96, 192, 336, 720))

ETTh2 数据集监控中国某个省份区域的电力变压器,包括油温和负载变体(例如高有用负载和高无用负载),数据频率为每小时一次,时间范围从 2016 年 7 月到 2018 年 7 月。


来源

ETTh1

 ETTh1 (freq:str='H', name:str='ETTh1', n_ts:int=1, test_size:int=11520,
        val_size:int=11520, horizons:Tuple[int]=(96, 192, 336, 720))

ETTh1 数据集监控中国某个省份区域的电力变压器,包括油温和负载变体(例如高有用负载和高无用负载),数据频率为每小时一次,时间范围从 2016 年 7 月到 2018 年 7 月。


来源

ECL

 ECL (freq:str='15T', name:str='ECL', n_ts:int=321, test_size:int=5260,
      val_size:int=2632, horizons:Tuple[int]=(96, 192, 336, 720))

*Electricity 数据集报告了 321 位客户在 2012 年至 2014 年间的十五分钟电力消耗 (KWh)。为了可比性,我们将其按小时聚合。

参考文献:Li, S 等人,《Enhancing the locality and breaking the memory bottleneck of Transformer on time series forecasting》。NeurIPS 2019。 http://arxiv.org/abs/1907.00235.\*


来源

Exchange

 Exchange (freq:str='D', name:str='Exchange', n_ts:int=8,
           test_size:int=1517, val_size:int=760, horizons:Tuple[int]=(96,
           192, 336, 720))

*Exchange 数据集收集了八个国家相对于美元的每日汇率。这些国家包括澳大利亚、英国、加拿大、瑞士、中国、日本、新西兰和新加坡,时间范围从 1990 年到 2016 年。

参考文献:Lai, G., Chang, W., Yang, Y., and Liu, H。《Modeling Long and Short-Term Temporal Patterns with Deep Neural Networks》。SIGIR 2018。 http://arxiv.org/abs/1703.07015.\*


来源

TrafficL

 TrafficL (freq:str='H', name:str='traffic', n_ts:int=862,
           test_size:int=3508, val_size:int=1756, horizons:Tuple[int]=(96,
           192, 336, 720))

*这个大型 Traffic 数据集由加州交通部收集,报告了 862 个传感器的道路每小时占用率,时间范围从 2015 年 1 月到 2016 年 12 月。

参考文献:Lai, G., Chang, W., Yang, Y., and Liu, H。《Modeling Long and Short-Term Temporal Patterns with Deep Neural Networks》。SIGIR 2018。 http://arxiv.org/abs/1703.07015

Wu, H., Xu, J., Wang, J., and Long, M。《Autoformer: Decomposition Transformers with auto-correlation for long-term series forecasting》。NeurIPS 2021。 https://arxiv.org/abs/2106.13008.\*


来源

ILI

 ILI (freq:str='W', name:str='ili', n_ts:int=7, test_size:int=193,
      val_size:int=97, horizons:Tuple[int]=(24, 36, 48, 60))

*该数据集报告了美国疾病控制与预防中心记录的每周流感样疾病 (ILI) 患者数据,时间范围从 2002 年到 2021 年。数据以每周 ILI 患者占总患者的比例衡量。

参考文献:Wu, H., Xu, J., Wang, J., and Long, M。《Autoformer: Decomposition Transformers with auto-correlation for long-term series forecasting》。NeurIPS 2021。 https://arxiv.org/abs/2106.13008.\*


来源

Weather

 Weather (freq:str='10M', name:str='weather', n_ts:int=21,
          test_size:int=10539, val_size:int=5270, horizons:Tuple[int]=(96,
          192, 336, 720))

*该 Weather 数据集包含德国耶拿 Max Planck 生物地球化学研究所气象站 2020 年记录的 21 项气象测量数据,每 10 分钟记录一次。

参考文献:Wu, H., Xu, J., Wang, J., and Long, M。《Autoformer: Decomposition Transformers with auto-correlation for long-term series forecasting》。NeurIPS 2021。 https://arxiv.org/abs/2106.13008.\*


来源

LongHorizon

 LongHorizon (source_url:str='https://nhits-
              experiments.s3.amazonaws.com/datasets.zip')

*这个 Long-Horizon 数据集封装类提供了下载和整理以下数据集的工具:
ETT, ECL, Exchange, Traffic, ILI 和 Weather。

  • 每个数据集都使用训练数据的均值和标准差进行归一化。
  • 数据集被划分为训练集、验证集和测试集。
  • 对于所有数据集:70%、10% 和 20% 的观测数据分别用于训练、验证和测试,但 ETT 数据集使用 20% 进行验证。*