从而提升解决问题的能力

badabunsebl25 · Post by **badabunsebl25** » Wed Apr 23, 2025 9:58 am

该公司表示，这些模型代表着我们朝着更强大的代理人工智能 (AI) 系统迈出了一大步，这些系统能够代表用户独立执行任务。通过完全访问 ChatGPT 的工具和自定义工具，这些模型可以自主协调多项操作来解决复杂问题。

OpenAI 的最新模型是日益拥挤的人工智能市场中的最新举措。

谷歌 DeepMind 的多模态 AI 助手 Astra 项目在能力上与人工智能最接近，于一年前首次亮相。Astra 能够看到、听到并理解周围环境。然而，Astra 的推理能力不如 DeepMind，不具备自主性，而且尚未公开发布。

今年 3 月，OpenAI 首席产品官 Kevin Weil在一次会议上表示，虽然 ChatGPT 目前处于领先地位，“但这并不意味着我们会永远领先。我认为我们领先 12 个月的时代可能已经一去不复返了——现在聪明的人太多了，生态系统中也发生了太多事情。”

无论 OpenAI 是否保持领先，各大公司都已投入人工智能领域。

根据 PYMNTS Intelligence CAIO 2 月份发布的报告，近 90% 的首席财务官表示，他们从生成式人工智能中获得了“非常积极”的投资回报。这一数字是 2024 年 3 月份的三倍。

此外，至少有 91% 的受访首席财务官对生成式人工智能在 10 个关键领域的输出表示“高度”或“完全信任”，部分原因是他们使用公司自己的数据作为人工智能响应的基础。

然而，29% 的人表示，人工智能的回应“可能不是很有见地”——这是人们对生成人工智能输出的最大担忧。

阅读更多：OpenAI 产品负责人表示 ChatGPT 将于 2025 年成为 Agentic

o3 和 o4-mini 有何不同
这些模型与 OpenAI 的其他模型有以下不同之处：

他们可以使用 ChatGPT 内的每个工具，包括搜索互联网、分析上传的文件和其他数据、推理图像和生成图像。
他们将图像直接融入推理，。图像可以是模糊的、颠倒的，也可以是手绘的。如有需要，模型可以放大图像。
它们将 OpenAI o 系列 AI 模型的推理能力与 GPT 系列大型语言模型 (LLM) 的对话能力相结合。
它们会推理出应该使用哪些工具——一项任务需要使用 600 种工具——来解决复杂问题，通常在一分钟内完成。OpenAI 表示，这意味着性能“显著”提升。
OpenAI 首席研究官 Mark Chen 在 OpenAI 视频中表示：“我们对这些工危地马拉电报数据具如此兴奋的原因是，它使我们的推理模型更加有用、更加智能。”

举个例子：一个用户问：“加州夏季的能源使用情况与去年相比如何？”据 OpenAI 称，该模型在互联网上搜索公共事业数据，编写 Python 代码来构建预测，生成图形或图像并解释预测的关键因素。

至于性能，这家初创公司表示，o3 在执行复杂的实际任务时，重大错误比前代 o1（o2 被跳过）减少了 20%。它在编程、咨询和创意构思方面尤其出色。

与此同时，o4-mini 模型注重性能与效率的平衡。这个较小的模型在数学、编码和视觉分析任务中表现出色。效率的提升使 o4-mini 能够支持比 o3-mini 更高的使用量，使其成为处理更大、更复杂任务的理想选择。

OpenAI 表示，对于大多数实际用途而言，o3 和 o4-mini 将比 o1 和 o3-mini 更便宜，同时在任务上表现更佳。

ChatGPT Plus、Pro 和 Team 用户现已可以使用这些模型。ChatGPT Enterprise 和 Edu 用户将在一周内获得这些模型。免费用户可以在输入提示前选择“思考”来试用 o4-mini。开发者可以通过 Chat Completions API 和 Responses API 访问这些模型。