OpenAI o1 拉开与国产大模型差距？360集结16家国产大模型可以匹敌

　　日前，OpenAI 发布 o1-preview，问鼎最强大语言模型，引发业内轰动。也正因如此，国内也产生了质疑的声音：为何大模型领域国内追赶了一两年，差距好像没见缩小，甚至是扩大了。

　　差距真的是在扩大吗？事实可能并非如此。

　　根据行业专家张俊林的观点，o1-preview 之所以能够更强，其方法本质上是思维链(Chain-of-Thought, CoT)的自动化。通过 CoT 把一个复杂问题拆解成若干简单步骤，这有利于大模型解决复杂逻辑问题，但之前这个过程主要靠人工来达成。o1 采用的这种方法，将使得 Prompt 工程逐渐消亡，也就是说所有复杂人工环节的自动化成为了大势所趋。

　　但其实，这种思想和方法并非 OpenAI 的首创，更非独创。早在 7 月底的 ISC.AI2024 大会上，360集团创始人周鸿祎就宣布，“用基于智能体的框架打造慢思考系统，从而增强大模型的慢思考能力”，并且此后多次强调类似观点。这种方法的技术和产品应用上，国内也已经走在前面：还是在 ISC.AI 上 360 发布的CoE(Collaboration-of-Experts,专家协同)技术架构及混合大模型，就是该方法的产物；并且，该技术架构已经落地到了多个产品中，比如360AI搜索、360AI浏览器。

　　值得一提的是，在大模型技术前沿，国内比 OpenAI 在开放协作的道路上走的更远，更加“open”。比如 CoE 架构并非只接入了一家企业的模型，而是由 360 牵头，百度、腾讯、阿里巴巴、智谱AI、Minimax、月之暗面等 16 家国内主流大模型厂商合作打造的，目前已经接入了这些企业的 54 款大模型产品，未来预计会全量接入 100 多款大模型产品。

　　更进一步的是，CoE 技术架构不仅接入了“大模型”，还接入了很多十亿甚至更小参数的专家模型，这使得整个系统更加智能。CoE 架构在实现“让最强的模型回答最难的问题”的同时，还能在回答简单问题时调用更精准的“小模型”，在获得高质量回答的同时，节约推理资源、提升响应速度。

　　有了上述的多种底层技术创新，基于CoE 架构的混合大模型在翻译、写作等 12 项指标的测试中取得了80.49分的综合成绩，超越了GPT-4o的69.22分；特别是在“弱智吧”和“诗词赏析”这类比较具有中文特色的问题上，该架构的领先优势更加明显。即使是对于最新发布的 o1-preview，CoE 架构在未经专门优化的情况下也展现出了优势。

　　拥有了底层技术创新的情况下，国内在做应用和产品层面的优势更大。CoE 架构和混合大模型没有止步于技术创新，而是比OpenAI更快一步地进入了实际应用领域。

　　一方面，360 通过 CoE 技术架构，构建了大模型竞技平台——模型竞技场(bot.360.com)，目前已经入驻360AI浏览器，成为国内大模型领域的基础设施。在多模型协作模式下，用户可以从 16 家国内主流大模型厂商的 54 款大模型中任意选择 3 款大模型，进行多模型协作，以此达成比单个大模型回答问题好得多的效果。

　　另一方面，CoE 还成为了支撑360AI搜索的底层技术架构。正是由于全球领先的技术架构的支撑，和国内多家主流大模型厂商的通力协作，让360AI搜索能够让360AI搜索能够在2024年1月诞生后八九个月的时间里，就超越 Perplexity AI。

　　我国基于高素质的工程师人才优势和时代创新精神，完全有可能让AI大模型赛道，成为继新能源汽车之后的又一个领跑国际前沿的重要科技创新领域。【编辑:邵婉云】

相关推荐