Weather (天气)

 Weather (freq:str='10M', name:str='weather', n_ts:int=21,
          test_size:int=10539, val_size:int=5270, horizons:Tuple[int]=(96,
          192, 336, 720))

*此Weather数据集包含2020年德国耶拿马克斯·普朗克生物地球化学研究所气象站每10分钟记录的21项气象测量数据。

参考:Wu, H., Xu, J., Wang, J., and Long, M. Autoformer: Decomposition Transformers with auto-correlation for long-term series forecasting. NeurIPS 2021. https://arxiv.org/abs/2106.13008.\*


TrafficL (交通L)

 TrafficL (freq:str='H', name:str='traffic', n_ts:int=862,
           test_size:int=3508, val_size:int=1756, horizons:Tuple[int]=(96,
           192, 336, 720))

*此大型Traffic数据集由加州交通部收集,报告了2015年1月至2016年12月期间862个传感器的道路每小时占用率。

参考:Lai, G., Chang, W., Yang, Y., and Liu, H. Modeling Long and Short-Term Temporal Patterns with Deep Neural Networks. SIGIR 2018. http://arxiv.org/abs/1703.07015.

Wu, H., Xu, J., Wang, J., and Long, M. Autoformer: Decomposition Transformers with auto-correlation for long-term series forecasting. NeurIPS 2021. https://arxiv.org/abs/2106.13008.\*


ECL (电力消耗负荷)

 ECL (freq:str='15T', name:str='ECL', n_ts:int=321, n_time:int=26304,
      test_size:int=5260, val_size:int=2632, horizons:Tuple[int]=(96, 192,
      336, 720))

*此Electricity数据集报告了2012年至2014年期间321个客户的每十五分钟用电量(KWh)。为了可比性,我们将其汇总为每小时数据。

参考:Li, S et al. Enhancing the locality and breaking the memory bottleneck of Transformer on time series forecasting. NeurIPS 2019. http://arxiv.org/abs/1907.00235.\*


ETTm2

 ETTm2 (freq:str='15T', name:str='ETTm2', n_ts:int=7, n_time:int=57600,
        test_size:int=11520, val_size:int=11520, horizons:Tuple[int]=(96,
        192, 336, 720))

*ETTm2数据集监测中国某省区域的电力变压器,包括油温和负荷变化(如高有用负荷和高无用负荷),时间范围为2016年7月至2018年7月,频率为每十五分钟。

参考:Zhou, et al. Informer: Beyond Efficient Transformer for Long Sequence Time-Series Forecasting. AAAI 2021. https://arxiv.org/abs/2012.07436\*


ETTm1

 ETTm1 (freq:str='15T', name:str='ETTm1', n_ts:int=7, n_time:int=57600,
        test_size:int=11520, val_size:int=11520, horizons:Tuple[int]=(96,
        192, 336, 720))

ETTm1数据集监测中国某省区域的电力变压器,包括油温和负荷变化(如高有用负荷和高无用负荷),时间范围为2016年7月至2018年7月,频率为每十五分钟。


ETTh2

 ETTh2 (freq:str='H', name:str='ETTh2', n_ts:int=7, n_time:int=14400,
        test_size:int=2880, val_size:int=2880, horizons:Tuple[int]=(96,
        192, 336, 720))

ETTh2数据集监测中国某省区域的电力变压器,包括油温和负荷变化(如高有用负荷和高无用负荷),时间范围为2016年7月至2018年7月,频率为每小时。


ETTh1

 ETTh1 (freq:str='H', name:str='ETTh1', n_ts:int=7, n_time:int=14400,
        test_size:int=2880, val_size:int=2880, horizons:Tuple[int]=(96,
        192, 336, 720))

ETTh1数据集监测中国某省区域的电力变压器,包括油温和负荷变化(如高有用负荷和高无用负荷),时间范围为2016年7月至2018年7月,频率为每小时。


LongHorizon2 (长期数据集2)

 LongHorizon2 (source_url:str='https://www.dropbox.com/s/rlc1qmprpvuqrsv/a
               ll_six_datasets.zip?dl=1')

*此Long-Horizon数据集包装类提供了下载和整理以下数据集的工具
ETT, ECL, Exchange, Traffic, ILI 和 Weather。

  • 每个数据集都使用训练数据的均值和标准差进行归一化。
  • 数据集被分割成训练、验证和测试集。
  • 对于所有数据集:70%的观测数据用于训练,10%用于验证,20%用于测试,但ETT数据集使用20%用于验证。*