从而提升解决问题的能力

Explore workouts, and achieving AB Data
Post Reply
badabunsebl25
Posts: 703
Joined: Tue Jan 07, 2025 6:13 am

从而提升解决问题的能力

Post by badabunsebl25 »

该公司表示,这些模型代表着我们朝着更强大的代理人工智能 (AI) 系统迈出了一大步,这些系统能够代表用户独立执行任务。通过完全访问 ChatGPT 的工具和自定义工具,这些模型可以自主协调多项操作来解决复杂问题。

OpenAI 的最新模型是日益拥挤的人工智能市场中的最新举措。

谷歌 DeepMind 的多模态 AI 助手 Astra 项目在能力上与人工智能最接近,于一年前首次亮相。Astra 能够看到、听到并理解周围环境。然而,Astra 的推理能力不如 DeepMind,不具备自主性,而且尚未公开发布。

今年 3 月,OpenAI 首席产品官 Kevin Weil在一次会议上表示,虽然 ChatGPT 目前处于领先地位,“但这并不意味着我们会永远领先。我认为我们领先 12 个月的时代可能已经一去不复返了——现在聪明的人太多了,生态系统中也发生了太多事情。”

无论 OpenAI 是否保持领先,各大公司都已投入人工智能领域。

根据 PYMNTS Intelligence CAIO 2 月份发布的报告,近 90% 的首席财务官表示,他们从生成式人工智能中获得了“非常积极”的投资回报。这一数字是 2024 年 3 月份的三倍。

此外,至少有 91% 的受访首席财务官对生成式人工智能在 10 个关键领域的输出表示“高度”或“完全信任”,部分原因是他们使用公司自己的数据作为人工智能响应的基础。

然而,29% 的人表示,人工智能的回应“可能不是很有见地”——这是人们对生成人工智能输出的最大担忧。

阅读更多:OpenAI 产品负责人表示 ChatGPT 将于 2025 年成为 Agentic

o3 和 o4-mini 有何不同
这些模型与 OpenAI 的其他模型有以下不同之处:

他们可以使用 ChatGPT 内的每个工具,包括搜索互联网、分析上传的文件和其他数据、推理图像和生成图像。
他们将图像直接融入推理,。图像可以是模糊的、颠倒的,也可以是手绘的。如有需要,模型可以放大图像。
它们将 OpenAI o 系列 AI 模型的推理能力与 GPT 系列大型语言模型 (LLM) 的对话能力相结合。
它们会推理出应该使用哪些工具——一项任务需要使用 600 种工具——来解决复杂问题,通常在一分钟内完成。OpenAI 表示,这意味着性能“显著”提升。
OpenAI 首席研究官 Mark Chen 在 OpenAI 视频中表示:“我们对这些工 危地马拉电报数据 具如此兴奋的原因是,它使我们的推理模型更加有用、更加智能。”

举个例子:一个用户问:“加州夏季的能源使用情况与去年相比如何?”据 OpenAI 称,该模型在互联网上搜索公共事业数据,编写 Python 代码来构建预测,生成图形或图像并解释预测的关键因素。

至于性能,这家初创公司表示,o3 在执行复杂的实际任务时,重大错误比前代 o1(o2 被跳过)减少了 20%。它在编程、咨询和创意构思方面尤其出色。

与此同时,o4-mini 模型注重性能与效率的平衡。这个较小的模型在数学、编码和视觉分析任务中表现出色。效率的提升使 o4-mini 能够支持比 o3-mini 更高的使用量,使其成为处理更大、更复杂任务的理想选择。

OpenAI 表示,对于大多数实际用途而言,o3 和 o4-mini 将比 o1 和 o3-mini 更便宜,同时在任务上表现更佳。

ChatGPT Plus、Pro 和 Team 用户现已可以使用这些模型。ChatGPT Enterprise 和 Edu 用户将在一周内获得这些模型。免费用户可以在输入提示前选择“思考”来试用 o4-mini。开发者可以通过 Chat Completions API 和 Responses API 访问这些模型。
Post Reply