关于 TimeGPT
TimeGPT 是一种用于时间序列的生产就绪型生成预训练 transformer 模型。只需几行代码,它就能准确预测零售、电力、金融和物联网等各个领域的数据。
它易于使用且低代码。用户只需上传他们的时间序列数据,一行代码即可生成预测或检测异常。
TimeGPT 是唯一开箱即用的时间序列基础模型,可通过我们的公共 API、通过 Azure Studio 作为 TimeGEN-1 或在您自己的基础设施上使用。
功能和能力
-
零样本推理:TimeGPT 可以直接生成预测和检测异常,无需事先训练数据。这使得它可以立即部署并从任何时间序列数据中快速获取洞察。
-
微调:通过在您特定的数据集上微调模型来增强 TimeGPT 的能力,使模型能够适应您独特时间序列数据的细微差别,并提高针对定制任务的性能。
-
API 访问:通过我们强大的 API 将 TimeGPT 无缝集成到您的应用程序中(通过我们的 Dashboard 获取 API 密钥)。TimeGPT 还通过 Azure Studio 提供支持,以获得更灵活的集成选项。或者,将 TimeGPT 部署在您自己的基础设施上,以完全控制您的数据和工作流程。
-
添加外生变量:纳入可能影响您预测的附加变量,以提高预测准确性。(例如:特殊日期、事件或价格)
-
多系列预测:同时预测多个时间序列数据,优化工作流程和资源。
-
特定损失函数:通过选择多种损失函数来定制微调过程,以满足特定的性能指标。
-
交叉验证:实施开箱即用的交叉验证技术,以确保模型的鲁棒性和泛化能力。
-
预测区间:在预测中提供区间,以有效地量化不确定性。
-
不规则时间戳:处理带有不规则时间戳的数据,无需预处理即可适应非均匀间隔序列。
-
异常检测:自动检测时间序列中的异常,并使用外生特征来增强性能。
通过我们的 快速入门指南 入门,学习不同功能的教程,并在我们的文档中了解真实世界的用例。
架构
自注意力(Self-attention),这个由论文 Attention is all you need 引入的革命性概念,是这个基础模型的基石。TimeGPT 模型不是基于任何现有的大型语言模型(LLM)。相反,它是独立地在大量时间序列数据上训练的,并且大型 transformer 模型旨在最小化预测误差。
该架构由一个编码器-解码器结构组成,包含多个层,每层都有残差连接和层归一化。最后,一个线性层将解码器的输出映射到预测窗口维度。一般的直觉是,基于注意力的机制能够捕捉过去事件的多样性,并正确地推断出潜在的未来分布。
为了进行预测,TimeGPT“读取”输入序列的方式就像人类阅读句子一样——从左到右。它查看过去的窗口数据,我们可以将其视为“令牌”(tokens),并预测接下来会发生什么。这种预测基于模型在过去数据中识别的模式并将其外推到未来。
探索示例和用例
访问我们全面的文档,探索 TimeGPT 的广泛示例和实际用例。无论您是使用我们的 快速入门指南 入门、设置您的 API 密钥,还是正在寻找高级预测技术,我们的资源旨在指导您完成整个过程的每一步。
了解如何处理 异常检测、使用特定损失函数微调模型,以及使用 Spark、Dask 和 Ray 等框架进行大规模计算。
此外,我们的文档还涵盖了处理 外生变量、通过 交叉验证 验证模型以及使用 分位数预测 和 预测区间 在不确定性下进行预测等特殊主题。