OpenAI与Anthropic竞相推出AI新模型,企业级市场竞争日趋白热化。
两大AI巨头同日发布旗舰模型
周四,OpenAI与Anthropic在一小时内相继发布了各自产品线的新旗舰人工智能模型,凸显了领先开发商在企业软件和高级编码工具领域的竞争日趋激烈。
Anthropic率先推出了Claude Opus 4.6,强调其在长上下文推理和基于智能体的工作流方面取得的进展;不久后,OpenAI发布了专为智能体编码及软件开发优化的GPT-5.3 Codex模型。
近乎同步的发布凸显了竞争对手迭代速度之快,各公司正竞相争取大型企业客户的长期合约。
模型性能各有所长
基准测试结果显示,两款模型在不同领域各有优势。据两家公司公布的数据,Claude Opus 4.6在法律与金融推理相关任务上表现更佳,而GPT-5.3 Codex则在智能体编码测试和效率指标上领先。
Anthropic表示,Claude Opus 4.6具备100万token的上下文窗口,在复杂信息检索基准MRCR v2上获得76%的分数,在长上下文推理和专业任务方面实现突破。该模型在财务与法律任务上超越了前代版本,并引入了允许多个AI智能体并行处理编码与文档的“智能体团队”功能。
OpenAI随后发布的GPT-5.3 Codex定位为专注于智能体编码与研究的优化模型。该公司称,Codex在智能体编码基准Terminal-Bench 2.0中获得77.3%的分数(Claude Opus 4.6为65.4%),且能以更少token更快完成任务。OpenAI还透露,Codex的早期版本已在内部用于协助调试训练和管理部署,这是模型首次直接加速自身研发的案例之一。
行业竞争持续加速
综合来看,两款模型并未形成绝对的整体优势,其性能差异取决于企业更看重专业推理能力还是自主软件开发效率。
与此同时,投资者正在重新评估传统软件提供商的前景。由于担忧原生AI平台可能侵蚀现有企业工具的需求,多家信息与专业服务公司股价本周出现下跌。
谷歌预计在未来数月更新其Gemini模型,而包括DeepSeek在内的其他AI开发商也在筹备新版本发布,进一步推动了行业竞争节奏。
尽管基准测试结果难以单独决定市场主导地位——广泛采用与企业部署正日益塑造竞争格局,但竞争的持续激压将使基于智能体的工作流能否成为经济活动的核心组成部分,成为行业关注的重要命题。OpenAI与Anthropic显然正为此押注。
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。



