Home » 部落格 » 具有“推理”能力的 ChatGPT 模型

具有“推理”能力的 ChatGPT 模型

最近推出的 ChatGPT o1(也称为 Strawberry)将整个人工智能 (AI) 领域推向了新的方向。新的 o1 模型不仅有望提供一种改进 LLM 功能的新方法,而且在回答复杂问题方面也更具功能性。

OpenAI 为其 Pro、Plus 和 Team 用户推出了两款型号,全新完整版 o1 和迷你版 o1。

这些推理能力为任何主动采用新 OpenAI o1 模型的企业提供了竞争优势。

那么,让我们看看这个模型与目前提供的其他模型相比如何,我们将介绍:

  1. OpenAI o1 是什么?
  2. OpenAI o1 与 ChatGPT 4 与人类专家
  3. 对客户服务行业的好处
  4. OpenAI o1 的用例
  5. 关于 OpenAI o1 的最终想法

OpenAI o1 是什么?

OpenAI o1 是一系列新的人工智能模型,旨在通过在响应之前花费更多时间思考来解决复杂的推理任务,例如科学、数学和编码挑战。

o1 Mini 是一款较小的模型,具有进行推理的能力,同时计算效率较高。

目前,这些模型的价格为每 100 万输入代币 15 美元,每 100 万输出代币 60 美元。

如果您是用户,您可以在 Plus 和 Team 计划 菲律宾电报 中使用具有较小速率限制的 o1(分别为每月 20 美元和每月 30 美元)。您还可以在 Pro 计划中获得更高的速率限制(每月 200 美元)。正如 Sam Altman 在 Twitter 上澄清的那样,Pro 计划适用于 ChatGPT 的高级用户。

2023 年ChatGPT 4发布后,又有一系列新版本发布。然而,在回复消息方面,没有一个新 LLM 比 ChatGPT 4 有显著的改进。

查看构建 o1 模型的 OpenAI 团队:

构建 OpenAI o1

OpenAI o1 通过打破范式有效 解决方案:实施框架 地突破了这一瓶颈。

让我们通过分解问题来以更简单的术语来理解它。

OpenAI LLM 课程分为三个阶段

1. 预训练

预训练是一个计算成本很高的 具有 中国新闻 “推理”能力的 ChatGPT 模型阶段,在这个阶段,Transformer 需要对大量未标记的数据进行训练。但是,在模型中可以进行的预训练数量有两个限制:

a.数据稀缺——2024年 7 月的一项研究估计,到 2025 年,将有更多人类生成的高质量数据来训练新模型。

b.计算成本——一种名为 GPT-MoE 的先进模型 (SOTA),在 1.8 T 代币上进行训练,需要全天候访问 8000 个 H100 GPU 90 天。

2. 培训

这是学习强化和微调模型所花费的时间。通常,这需要人类不断使用这些模型来改善其反应,以及一个机器学习奖励模型,该模型会随着时间的推移优化模型。OpenAI 引入了PPO,它优化了这些模型。

返回頂端