讯飞星火X1升级突破：推理性能比肩全球一流水平

讯飞星火X1升级突破：推理性能比肩全球一流水平

4月20日，科大讯飞深度推理大模型——讯飞星火X1迎来全新升级；讯飞方面表示，升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上效果显著提升，在模型参数比业界同类模型小一个数量级的情况下，整体效果对标OpenAI o1和DeepSeek R1。

讯飞方面表示，星火X1除了在常见通用任务取得显著进步之外，由于融入了更多场景复杂类型数据，模型的泛化性也取得了进步，在教育、医疗、司法等领域表现明显。

面向企业和广大开发者，讯飞星火X1首发“快思考、慢思考统一模型”，全新升级模型定制优化工具链，进一步降低大模型私有化部署和定制门槛；同时，讯飞星火X1 API已上线讯飞开放平台开放服务，作为首个支持全国产算力微调的推理大模型，讯飞星辰MaaS平台同步上线了星火X1微调服务。

据讯飞方面表示，升级后的星火X1在多个任务上效果继续突破，展现出优异的性能，根据最新测试集评测结果，星火X1在通用任务效果评测中全面对标OpenAI o1和DeepSeek R1，在数学、知识问答等方面表现突出。

数学答题和复杂的数理逻辑推理方面，星火X1能够准确识别出复杂的数学公式，不仅给出完整的解题思路，输出结果也严谨清晰；在逻辑推理时全方位思考，思考可能出现的每一种假设，表现出更强的严谨性和准确性。代码能力上，星火X1不仅提高了代码生成的准确率，对生成代码逻辑理解也进一步提升，能够应对更复杂的编程需求，思考问题的多种可能性，帮助开发者快速实现功能。在语言理解方面，模型输出内容、格式更加符合用户指令要求，能够给到更加准确且深度思考的结果，生成内容更加连贯、准确。

此外，星火X1的长思维链能力支持图像输入，可以对输入的图像进行关联思考，对于图像中的多种复杂元素，探究可能的含义和目的，进行更深层次的信息整合和推理。

本次星火X1升级不仅提升了通用能力，也同步增强了面向行业的解决方案能力；以司法行业为例，对于行业专业需求，例如根据材料总结案件事实以及判决理由，升级后的星火X1能够精准把握用户指令，详细分析争议点，快速定位关键信息，并输出准确内容，为行业用户提供专业、可靠的智能支持。

在技术创新和模型部署方面，星火X1首发“快思考、慢思考统一模型”，由一个模型同时支持两种思考模式，提升了模型处理不同复杂度任务的能力，满血版星火X1仅需4张卡（华为910B）即可部署，简化了私有化部署流程。

同时，星火X1还全新升级了模型定制优化工具链，支持SFT（监督微调）、强化学习两种模型定制优化方案，只需16张卡（华为910B）即可完成行业定制优化，有效降低了企业AI的定制门槛。

讯飞星火X1的全新升级背后，是一系列独特的技术创新与理念突破。

首先，提出基于问题难度的大规模多阶段强化学习方法，在复杂推理、数学、代码、语言理解等场景全面提升模型效果及泛化性；同时提出强化学习动态更新算法，基于样本采样长度动态调整强化学习更新速度，进一步提升深度思考强化学习效率及效果。

其次，统一模型下的快慢思考混合训练方法，充分发挥快慢思考数据相互促进作用，实现基于系统指令控制模型是否深度思考，支撑下游更高效便捷地部署使用；

第三，实现多项工程技术创新，显存动态卸载技术大幅提升长文本推理并发、训推共卡协同实现高效训推资源转换、推理引擎冬眠机制实现快速拉起和恢复，实现国产算力平台上高效和稳定的强化学习训练全流程。

讯飞表示，在中美科技竞争日趋激烈的背景下，星火X1选择的全国产化技术路径更具深远意义。最近，科大讯飞与华为昇腾联合团队在前期工作基础上再获突破，升级MoE模型的PD分离+大规模专家并行系统方案，实现了集群推理性能翻番，包括PD分离部署提升20%+性能、MTP多token预测技术提升30%+整体性能、专家负载均衡算法优化使集群吞吐提升30%+，以及异步双发射技术降低服务请求调度耗时提升10%系统性能。（平章）

相关推荐：女孩手术好友进电梯玖辛奈被❌到深处喷水的美女裸体㊙️无遮挡視頻视

分享： 2025-04-24 18:25:49 共81款