长期原始数据集
用于长期数据集的下载和整理工具。这些数据集已被NHITS, AutoFormer, Informer, PatchTST, TiDE
等许多神经网络预测方法使用。数据集包括原始的ETTh1, ETTh2, ETTm1, ETTm2, Weather, ILI, TrafficL基准数据集。
源
Weather (天气)
*此Weather数据集包含2020年德国耶拿马克斯·普朗克生物地球化学研究所气象站每10分钟记录的21项气象测量数据。
参考:Wu, H., Xu, J., Wang, J., and Long, M. Autoformer: Decomposition Transformers with auto-correlation for long-term series forecasting. NeurIPS 2021. https://arxiv.org/abs/2106.13008.\*
源
TrafficL (交通L)
*此大型Traffic数据集由加州交通部收集,报告了2015年1月至2016年12月期间862个传感器的道路每小时占用率。
参考:Lai, G., Chang, W., Yang, Y., and Liu, H. Modeling Long and Short-Term Temporal Patterns with Deep Neural Networks. SIGIR 2018. http://arxiv.org/abs/1703.07015.
Wu, H., Xu, J., Wang, J., and Long, M. Autoformer: Decomposition Transformers with auto-correlation for long-term series forecasting. NeurIPS 2021. https://arxiv.org/abs/2106.13008.\*
源
ECL (电力消耗负荷)
*此Electricity数据集报告了2012年至2014年期间321个客户的每十五分钟用电量(KWh)。为了可比性,我们将其汇总为每小时数据。
参考:Li, S et al. Enhancing the locality and breaking the memory bottleneck of Transformer on time series forecasting. NeurIPS 2019. http://arxiv.org/abs/1907.00235.\*
源
ETTm2
*ETTm2数据集监测中国某省区域的电力变压器,包括油温和负荷变化(如高有用负荷和高无用负荷),时间范围为2016年7月至2018年7月,频率为每十五分钟。
参考:Zhou, et al. Informer: Beyond Efficient Transformer for Long Sequence Time-Series Forecasting. AAAI 2021. https://arxiv.org/abs/2012.07436\*
源
ETTm1
ETTm1数据集监测中国某省区域的电力变压器,包括油温和负荷变化(如高有用负荷和高无用负荷),时间范围为2016年7月至2018年7月,频率为每十五分钟。
源
ETTh2
ETTh2数据集监测中国某省区域的电力变压器,包括油温和负荷变化(如高有用负荷和高无用负荷),时间范围为2016年7月至2018年7月,频率为每小时。
源
ETTh1
ETTh1数据集监测中国某省区域的电力变压器,包括油温和负荷变化(如高有用负荷和高无用负荷),时间范围为2016年7月至2018年7月,频率为每小时。
源
LongHorizon2 (长期数据集2)
*此Long-Horizon数据集包装类提供了下载和整理以下数据集的工具
ETT, ECL, Exchange, Traffic, ILI 和 Weather。
- 每个数据集都使用训练数据的均值和标准差进行归一化。
- 数据集被分割成训练、验证和测试集。
- 对于所有数据集:70%的观测数据用于训练,10%用于验证,20%用于测试,但ETT数据集使用20%用于验证。*