概率预测评估

本 Notebook 提供了一个创建层次预测流程的分步指南。

在该流程中，我们将使用 HierarchicalForecast 和 StatsForecast 核心类来创建基本预测、协调和评估它们。

我们将使用 TourismL 数据集，该数据集总结了澳大利亚全国游客调查的大量数据。

大纲 1. 安装包 2. 准备 TourismL 数据集 - 读取和聚合 - StatsForecast 的基本预测 3. 协调 4. 评估

1. 安装 HierarchicalForecast

我们假设您已经安装了 StatsForecast 和 HierarchicalForecast，如果没有，请查看本指南以获取安装 HierarchicalForecast 的说明。

!pip install hierarchicalforecast statsforecast datasetsforecast

import os
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

from statsforecast.core import StatsForecast
from statsforecast.models import AutoARIMA, Naive

from hierarchicalforecast.core import HierarchicalReconciliation
from hierarchicalforecast.methods import BottomUp, TopDown, MinTrace, ERM

from hierarchicalforecast.utils import is_strictly_hierarchical
from hierarchicalforecast.utils import HierarchicalPlot, CodeTimer

from datasetsforecast.hierarchical import HierarchicalData, HierarchicalInfo

2. 准备 TourismL 数据集

2.1 读取层次数据集

# ['Labour', 'Traffic', 'TourismSmall', 'TourismLarge', 'Wiki2']
dataset = 'TourismSmall' # 'TourismLarge'
verbose = True
intervals_method = 'bootstrap'
LEVEL = np.arange(0, 100, 2)

with CodeTimer('Read and Parse data   ', verbose):
    print(f'{dataset}')
    if not os.path.exists('./data'):
        os.makedirs('./data')
    
    dataset_info = HierarchicalInfo[dataset]
    Y_df, S_df, tags = HierarchicalData.load(directory=f'./data/{dataset}', group=dataset)
    Y_df['ds'] = pd.to_datetime(Y_df['ds'])

    # Train/Test Splits
    horizon = dataset_info.horizon
    seasonality = dataset_info.seasonality
    Y_test_df = Y_df.groupby('unique_id', as_index=False).tail(horizon)
    Y_train_df = Y_df.drop(Y_test_df.index)
    S_df = S_df.reset_index(names="unique_id")

TourismSmall
Code block 'Read and Parse data   ' took:   0.00653 seconds

dataset_info.seasonality

hplot = HierarchicalPlot(S=S_df, tags=tags)
hplot.plot_summing_matrix()

Y_train_df

	unique_id	ds	y
0	total	1998-03-31	84503
1	total	1998-06-30	65312
2	total	1998-09-30	72753
3	total	1998-12-31	70880
4	total	1999-03-31	86893
…	…	…	…
3191	nt-oth-noncity	2003-12-31	132
3192	nt-oth-noncity	2004-03-31	12
3193	nt-oth-noncity	2004-06-30	40
3194	nt-oth-noncity	2004-09-30	186
3195	nt-oth-noncity	2004-12-31	144

2.2 StatsForecast 的基本预测

此单元使用 StatsForecast 的 AutoARIMA 计算 Y_df 中所有序列的基本预测 Y_hat_df。此外，我们还为需要它们的那些方法获取了样本内预测 Y_fitted_df。

with CodeTimer('Fit/Predict Model     ', verbose):
    # Read to avoid unnecesary AutoARIMA computation
    yhat_file = f'./data/{dataset}/Y_hat.csv'
    yfitted_file = f'./data/{dataset}/Y_fitted.csv'

    if os.path.exists(yhat_file):
        Y_hat_df = pd.read_csv(yhat_file, parse_dates=['ds'])
        Y_fitted_df = pd.read_csv(yfitted_file, parse_dates=['ds'])

    else:
        fcst = StatsForecast(
            models=[AutoARIMA(season_length=seasonality)],
            fallback_model=[Naive()],
            freq=dataset_info.freq, 
            n_jobs=-1
        )
        Y_hat_df = fcst.forecast(df=Y_train_df, h=horizon, fitted=True, level=LEVEL)
        Y_fitted_df = fcst.forecast_fitted_values()
        Y_hat_df.to_csv(yhat_file, index=False)
        Y_fitted_df.to_csv(yfitted_file, index=False)

3. 协调预测

with CodeTimer('Reconcile Predictions ', verbose):
    if is_strictly_hierarchical(S=S_df.drop(columns="unique_id").values.astype(np.float32), tags={key: S_df["unique_id"].isin(val).values.nonzero()[0] for key, val in tags.items()}):
        reconcilers = [
            BottomUp(),
            TopDown(method='average_proportions'),
            TopDown(method='proportion_averages'),
            MinTrace(method='ols'),
            MinTrace(method='wls_var'),
            MinTrace(method='mint_shrink'),
            ERM(method='closed'),
        ]
    else:
        reconcilers = [
            BottomUp(),
            MinTrace(method='ols'),
            MinTrace(method='wls_var'),
            MinTrace(method='mint_shrink'),
            ERM(method='closed'),
        ]
    
    hrec = HierarchicalReconciliation(reconcilers=reconcilers)
    Y_rec_df = hrec.bootstrap_reconcile(Y_hat_df=Y_hat_df,
                                        Y_df=Y_fitted_df,
                                        S_df=S_df, tags=tags,
                                        level=LEVEL,
                                        intervals_method=intervals_method,
                                        num_samples=10, 
                                        num_seeds=10)
    
    Y_rec_df = Y_rec_df.merge(Y_test_df, on=['unique_id', 'ds'], how="left")

Code block 'Reconcile Predictions ' took:   7.49314 seconds

定性评估，关于解析的分位数

unique_id = "total"
plot_df = Y_rec_df.query("unique_id == @unique_id").groupby(["unique_id", "ds"], as_index=False).mean()
for col in hrec.level_names['AutoARIMA/BottomUp']:
    plt.plot(plot_df["ds"], plot_df[col], color="orange")
plt.plot(plot_df["ds"], plot_df["y"], label="True")
plt.title(f"AutoARIMA/BottomUp - {unique_id}")
plt.legend()

4. 评估

from utilsforecast.losses import scaled_crps, msse
from hierarchicalforecast.evaluation import evaluate
from functools import partial

with CodeTimer('Evaluate Models CRPS and MSSE ', verbose):
    metrics_seeds = []
    for seed in Y_rec_df.seed.unique():
        df_seed = Y_rec_df.query("seed == @seed")
        metrics_seed = evaluate(df = df_seed,
                            tags = tags,
                            metrics = [scaled_crps, 
                                       partial(msse, seasonality=4)],
                            models= hrec.level_names.keys(),
                            level = LEVEL,
                            train_df = Y_train_df,
                            )
        metrics_seed['seed'] = seed
        metrics_seeds.append(metrics_seed)
    metrics_seeds = pd.concat(metrics_seeds)

    metrics_mean = metrics_seeds.groupby(["level", "metric"], as_index=False).mean()
    metrics_std = metrics_seeds.groupby(["level", "metric"], as_index=False).std()

    results = metrics_mean[hrec.level_names.keys()].round(3).astype(str) + "±" + metrics_std[hrec.level_names.keys()].round(4).astype(str)
    results.insert(0, "metric", metrics_mean["metric"])
    results.insert(0, "level", metrics_mean["level"])

results.sort_values(by=["metric", "level"])

Code block 'Evaluate Models CRPS and MSSE ' took:   4.25192 seconds

	级别	指标	AutoARIMA/BottomUp	AutoARIMA/TopDown_method-average_proportions	AutoARIMA/TopDown_method-proportion_averages	AutoARIMA/MinTrace_method-ols	AutoARIMA/MinTrace_method-wls_var	AutoARIMA/MinTrace_method-mint_shrink	AutoARIMA/ERM_method-closed_lambda_reg-0.01
0	国家	1.777±0.0	2.488±0.0	2.752±0.0	2.752±0.0	2.569±0.0	2.775±0.0	3.427±0.0	—
2	国家/目的	1.777±0.0	1.726±0.0	3.181±0.0	3.169±0.0	2.184±0.0	1.876±0.0	1.96±0.0	3.067±0.0
4	国家/目的/州	1.777±0.0	0.881±0.0	1.657±0.0	1.652±0.0	0.98±0.0	0.857±0.0	0.867±0.0	1.559±0.0
6	国家/目的/州/城市非城市	1.777±0.0	0.95±0.0	1.271±0.0	1.269±0.0	1.033±0.0	0.903±0.0	0.912±0.0	1.635±0.0
8	总体	1.777±0.0	0.973±0.0	1.492±0.0	1.488±0.0	1.087±0.0	0.951±0.0	0.966±0.0	1.695±0.0
1	国家	scaled_crps	0.043±0.0009	0.048±0.0006	0.048±0.0006	0.05±0.0006	0.051±0.0006	0.053±0.0006	0.054±0.0009
3	国家/目的	scaled_crps	0.077±0.001	—	0.114±0.0003	0.112±0.0004	0.09±0.0013	0.087±0.0009	0.089±0.0009
5	国家/目的/州	scaled_crps	0.106±0.0013	—	0.165±0.0009	0.249±0.0004	0.247±0.0004	0.18±0.0018	0.169±0.0009
7	国家/目的/州/城市非城市	scaled_crps	0.169±0.0008	0.231±0.0021	—	0.218±0.0013	0.289±0.0004	0.286±0.0004	0.228±0.0018
9	总体	scaled_crps	0.217±0.0013	0.218±0.0011	0.302±0.0033	—	0.193±0.0011	0.266±0.0004	0.263±0.0004

入门

教程

API 参考

1. 安装 HierarchicalForecast

2. 准备 TourismL 数据集

2.1 读取层次数据集

2.2 StatsForecast 的基本预测

3. 协调预测

4. 评估

参考文献

入门

教程

API 参考

​1. 安装 HierarchicalForecast

​2. 准备 TourismL 数据集

​2.1 读取层次数据集

​2.2 StatsForecast 的基本预测

​3. 协调预测

​4. 评估

​参考文献

1. 安装 HierarchicalForecast

2. 准备 TourismL 数据集

2.1 读取层次数据集

2.2 StatsForecast 的基本预测

3. 协调预测

4. 评估

参考文献