GPT-4.1 三款产品齐发!成本暴降 26%,百万 token 只需 0.12 美元
GPT-4.1 以更低成本实现了卓越性能

OpenAI 今日凌晨发布全新 GPT-4.1 系列模型,该系列不仅能处理百万级上下文信息,编程能力更实现突破性提升。面对企业级 AI 市场日益激烈的竞争,这些新模型在增强功能的同时还大幅降低了使用成本。
OpenAI 是总部位于旧金山的人工智能公司,这次一次性推出三款产品:GPT-4.1 标准版、GPT-4.1 mini 版和 GPT-4.1 nano 版,均已通过 API 接口开放使用。新一代模型在软件工程任务中表现更优异,指令遵循更精准,上下文处理能力最高可达 100 万 token(约合 75 万单词)。
对企业用户而言,最关键的或许是定价策略:标准版 GPT-4.1 费用较前代降低 26%,而轻量级 nano 版更成为 OpenAI 最具性价比的产品,每百万 token 仅需 0.12 美元。
OpenAI 训练研究负责人 Michelle Pokrass 在接受 VentureBeat 独家专访时透露,新模型的研发完全基于实际商业需求驱动。
“GPT-4.1 的训练目标只有一个:成为开发者的实用工具,”Pokrass 强调,“我们发现 GPT-4.1 能更精准地理解企业级指令,让生产级应用的部署变得前所未有的简单。” 这种务实导向在基准测试中得到了验证。在衡量软件工程能力的 SWE-bench Verified 测试中,GPT-4.1 获得 54.6% 的得分,较 GPT-4o 提升 21.4 个百分点。 对于开发自主处理复杂任务的 AI 代理的企业,其指令遵循能力的进步更具价值。在 Scale 的 MultiChallenge 测试中,GPT-4.1 以 38.3% 的得分超越前代 10.5 个百分点。
02. 三种不同版本的模型
三种不同价位的型号的推出,旨在满足日益多样化的人工智能市场需求。旗舰产品 GPT-4.1 面向复杂的企业应用,而 mini 版和 nano 版则针对注重速度和成本效益的用例。
“并非所有任务都需要顶级智能,”Pokrass 指出,“nano 版将成为代码补全、数据分类等速度优先场景的主力机型。” 值得注意的是,OpenAI 同时宣布将于 7 月 14 日停用两个月前才发布的 GPT-4.5 预览版(其两个月前发布的最大、最昂贵的模型)。OpenAI 公司明确将 GPT-4.1 定位为“在关键能力持平甚至更优的前提下,实现成本与延迟双降”的替代方案。
03. 企业客户如何利用 GPT-4.1
这几家在模型发布前对其进行测试的企业客户报告称,他们在某些领域取得了明显的进步。

汤森路透 (Thomson Reuters) 在其法律 AI 助手 CoCounsel 上使用 GPT-4.1 后,多文档审查准确率提高了 17%。这项增强功能尤其擅长处理条款关系复杂的冗长法律文书。
金融公司凯雷报告称,从密集文档中提取细粒度财务数据的性能提高了 50%——显著强化了投资分析能力。
编码工具提供商 Windsurf (前身为 Codeium)的首席执行官 Varun Mohan 在公告中分享了详细的性能指标。
“我们发现,与其他领先模型相比,GPT-4.1 读取不必要文件的次数减少了 40%,修改不必要文件的次数也减少了 70%。”Mohan 表示,“该模型的冗长程度也出奇地低,GPT-4.1 比其他领先模型少了 50%。”
04. 百万 token 能处理哪些工作
这三个模型都拥有一百万个 token 的上下文窗口,比 GPT-4o 的 128,000 个 token 限制大八倍。这种扩展的容量使模型能够同时处理多个长文档或整个代码库。
OpenAI 在演示中展示了 GPT-4.1 如何分析 1995 年包含 45 万个 token 的 NASA 服务器日志文件,并识别出隐藏在数据深处的异常条目。此功能对于涉及大型数据集(例如代码存储库或公司文档集)的任务尤其有价值。
不过 OpenAI 坦言,在输入量极大的情况下,性能会下降。在内部 OpenAI-MRCR 测试中,输入长度从 8000 token 增至百万级时,准确率会从 84% 降至 50%。
05. 竞争白热化,企业 AI 格局如何变化
此次发布正值企业 AI 领域竞争日趋激烈之际。谷歌最近推出了 Gemini 2.5 Pro, 其上下文窗口容量高达一百万个 token,而 Anthropic 的 Claude 3.7 Sonnet 也吸引了众多寻求 OpenAI 产品替代方案的企业关注。

中国人工智能初创公司 DeepSeek 最近也升级了模型,这给 OpenAI 的领导地位带来了额外的压力。
“我们看到长文本理解能力的进步直接转化成了法律分析、金融数据提取等垂直场景的效能提升,”Pokrass 表示,“在学术基准之外测试我们的模型,并确保它们在企业和开发者中表现出色至关重要。”
06. 未来展望:聚焦实用 AI 工具
通过专门经由 API 而非 ChatGPT 发布这些模型,OpenAI 彰显了其对开发者及企业客户的重视。该公司计划逐步将 GPT-4.1 的特性融入 ChatGPT,但目前的首要任务仍是为构建专业应用程序的企业提供强大的工具支持。
为了推动长上下文处理领域的进一步研究,OpenAI 发布了两个评估数据集:用于测试多轮共指能力的 OpenAI-MRCR,以及用于评估在长篇文档中进行复杂推理能力的 Graphwalks。
对于企业决策者而言,GPT-4.1 系列模型为人工智能的应用提供了一种更实用、更具成本效益的途径。随着各组织不断将 AI 融入其运营流程,这些在可靠性、针对性和效率方面的改进,有望加速那些仍在权衡实施成本与潜在收益的行业对 AI 的采用。
当竞争对手纷纷追逐规模更大、成本更高的模型时,OpenAI 凭借 GPT-4.1 实现的战略转向表明,AI 的未来或许并不属于那些规模最大的模型,而是属于最为高效的模型。
真正的突破可能并非体现在基准测试上,而是在于让更多企业能够触及企业级 AI。
原文来源于:
1.https://venturebeat.com/security/openais-new-gpt-4-1-models-can-process-a-million-tokens-and-solve-coding-problems-better-than-ever/
中文内容由元宇宙之心(MetaverseHub)团队编译,如需转载请联系我们。
最新行业深度研究报告发放中! 资本实验室全新发布 37 页量化报告《 2023 全球区块链应用市场暨产业图谱报告(2023) 》,收录 1000+ 应用案例 ,探索区块链应用趋势 , 入群即可免费领取 。

XIN 科技周刊(4.5-4.11) AI 续写《猫和老鼠》 精彩继续


全球调查显示:超半数高中生认为 AI 有助于缓解数学焦虑

斯坦福 2025 年 AI 指数报告:10 张图表看懂人工智能发展现状
比尔·盖茨最新预言:AI 时代人类每周仅工作 2 天,这三大职业将成为“铁饭碗”
免责声明:文章中的所有内容仅代表作者的观点,与本平台无关。用户不应以本文作为投资决策的参考。
你也可能喜欢
KiloEx 宣布已正式恢复运营
DOLOUSDT 现已上线合约交易和交易BOT
草间弥生经典之作《Pumpkin (2), 1990》,即将上线 DuckChain
特朗普内阁预谋“篡位”马斯克,白宫:他“哪儿也不去”!
特朗普内阁虎视眈眈,准备在马斯克退居幕后时重新掌权。白宫则称希望马斯克继续“投入大量时间”支持总统......