OpenAI 正式官宣 o3 & o4-mini：迄今最强模型

AI资讯 2天前硕雀

6 0 0

OpenAI于2025年4月17日正式发布了其最新一代推理模型——o3和o4-mini。这些模型是OpenAI迄今为止推出的最强推理模型，具有多模态处理能力，能够同时处理文本、图像和音频，并且能够作为智能体（Agent）自动调用网络搜索、图像生成、代码解析等工具，从而实现更高效、更智能的推理和任务执行。

o3模型：

性能与能力：o3被称为“迄今为止最强大的推理模型”，在多个基准测试中表现出色，包括数学、编程、科学和视觉推理等领域的领先表现。在AIME 2024和2025竞赛中，o3的准确率高达92.7%。此外，o3在编程和数学推理任务中超越了人类专家水平，甚至在某些情况下接近通用人工智能（AGI）的水平。
Agent能力：o3是第一代能够使用图像进行思维链推理的模型，可以连续调用多达600次工具，以解决复杂问题。
多模态能力：o3具备真正的视觉推理能力，能够直接将图像整合到思维链中，从而实现更自然的推理过程。
成本效益：尽管o3在性能上领先，但其成本和效率相比前代模型有所提升，例如在ARC-AGI基准测试中，o3在高计算设置下得分为87.5%，而在低计算设置下得分为75.7%，是o1性能的三倍。

o4-mini模型：

性能与能力：o4-mini是o3的轻量版，专注于快速、高效和成本效益的优化。在AIME 2024和2025竞赛中，o4-mini的准确率分别达到93.4%和92.7%，略高于o3，成为当前最准确的模型之一。
多模态能力：o4-mini同样支持多模态处理，能够处理文本、图像和音频，同时具备Agent能力，能够自动调用工具进行推理和任务执行。
应用场景：o4-mini在数学、编程和代码生成等场景中表现优异，特别是在Codeforces竞赛中，其评分达到2700分，超越了全球大部分程序员。
成本效益：o4-mini在性能和成本之间取得了平衡，适合需要快速响应和较低成本的场景，如教育和科研辅助。

共同特点：

安全性：两款模型都经过重新训练，以确保在生物威胁、恶意软件生成和代码安全等领域具备更高的安全性。
开源与工具：OpenAI还开源了轻量级编程Agent Codex CLI，为用户提供更灵活的使用体验。

总结：
o3和o4-mini的推出标志着OpenAI在多模态推理和Agent能力上的重大突破，不仅提升了模型的推理能力，还通过优化性能和成本，使其更适合实际应用需求。这些模型的发布，不仅推动了AI技术的前沿发展，也进一步巩固了OpenAI在AI领域的领先地位

声明：文章均为AI生成，请谨慎辨别信息的真伪和可靠性！

OpenAI 正式官宣 o3 & o4-mini：迄今最强模型

智谱开源了新一代GLM系列模型，体验入口“z.ai”免费开放

没有更多了...