6163银河.net163.am(中国·官方网站)-Webgame Platform
搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

不更大,更聪明:字节用Seed-1.5打响国产大模型 “差异化战争”

2025-04-23 18:52:29
来源:

猫眼电影

作者:

吴振东

手机查看

  猫眼电影记者 吴鉴明 报道w3u7903ejky2ywls

作者|高见科技论 高恒

在模型参数的 "军备竞赛" 陷入边际效益递减之际,字节跳动没走寻常路。

4月14日,字节跳动首次公开其自研思考模型Seed-Thinking v1.5的核心技术细节,宣布将在17日通过火山引擎面向企业用户开放接口。这是字节首次在大模型技术路径上完整亮相,也是继 "豆包" 之后,试图打破通用模型评价体系、重塑任务定义的又一次尝试。

不同于GPT-4、Gemini 等以超大参数模型主导的路线,Seed-Thinking v1.5采用了2000 亿参数规模的 MoE(混合专家)架构,但仅激活其中的10%左右,即20B专家参数进行推理。这意味着,在保持高性能的前提下,它的单位推理成本相比DeepSeek R1降低了50%,大幅拉低了通用大模型在实际使用中的成本门槛。

成本优化只是表象。更关键的是,字节用Seed-Thinking v1.5向外界释放出一个信号:国产大模型的竞争,已经从全域追赶迈入了 "专精路线"的分化阶段。而Seed-Thinking v1.5想做的不是 "通吃一切" 的大一统模型,而是 "会思考" 的差异化代表。

01·数学、编程、科学推理:构建 AI 的 "强智力肌肉"

回归大模型的能力本质,字节的思考模型强调的并非语言生成能力的花哨场景,而是对可验证推理能力的深耕,即AI是否真正 "理解" 了逻辑、规则与推导关系。

这一技术哲学直接体现在评测成绩上:

· 数学推理:Seed-Thinking v1.5在AIME 2024(美国高中数学竞赛)中取得86.7分,与OpenAI的o3-mini-high 相当,并独立构建了难度更高的BeyondAIME 数据集(100道无答案题干题目),追求评测维度的 "天花板效应" 突破。

· 编程能力:Codeforces pass@8 得分为55%,接近Gemini 2.5 Pro;不仅能解题,还能优化算法复杂度。

· 科学推理:GPQA 得分达到77.3%,同样进入全球第一梯队。

这些任务背后,有一个共同点:结果可以被精确验证。这也正是Seed-Thinking v1.5真正重兵布防的方向。相比于文字润色、诗词创作、图像描述等 "软偏好" 任务,字节跳动更关注的是模型在硬逻辑任务上的极限性能和稳定性,这不仅是通用模型泛化能力的基石,也更适合企业级应用的落地需求。

02·MoE之后:参数不再是王道,成本效率比才是竞争核心

在OpenAI走向GPT-5的多模态跃进之时,国内模型厂商普遍面临一个两难困局:

1. 如果继续 "拉参数、卷规模",云计算和算力成本将进一步压垮商业化路径;

2. 如果保守压缩模型,能力容易陷入 "知识贫瘠" 和 "逻辑跳跃" 的中庸陷阱。

而字节跳动选择了MoE架构这条并不新、但难度极高的 "中间道路":既保留超大模型的知识表示能力,又通过动态激活极少专家,完成 "精而不弱" 的推理执行。

通过张量并行、专家并行、序列并行组成的三层分布式架构,Seed-Thinking v1.5在万亿参数下实现了接近 95% 的训练稳定性;结合 KARP 算法动态分配 GPU 负载,其推理资源效率在大模型圈内首次达到了 "高可控+高经济性" 的平衡点。

底层的流式推理系统(SRS)和HybridFlow 编程框架也成为这一代模型的加速引擎,不仅支持异步推理与模型演进解耦,还实现了训练效率的3倍提升,为未来自演化模型预留了技术接口。

在推理成本逐步决定大模型商业化边界的今天,这场架构路线的选择,或许比模型分数更能决定胜负。

03·双轨训练:可验证与不可验证任务的 "范式分流"

传统大模型训练流程中,所有数据几乎一视同仁。但在字节跳动看来,"硬对错" 和 "软偏好" 本质上不该混为一谈,评估与奖励体系也必须分别演化。

于是,Seed-Thinking v1.5首次提出了 "双轨训练奖励机制":

· 对于数学、代码等可验证任务,引入Seed-Verifier 2.0评估器,放弃了字符级匹配,转而使用 "推理过程对齐" 机制来识别模型是否真正理解了问题,从而避免奖励欺骗。

· 对于创意写作、问答等软性任务,则使用pairwise对比方法,通过千万次 A/B 测试捕捉人类情感偏好,弥补指标缺失。

更关键的是,在混合任务场景下,字节跳动并未采取简单加权平均策略,而是开发了一套任务类型识别机制,实现硬指标与软偏好之间的协调 —— 这让模型能更灵活地在 "绝对正确" 与 "相对优秀" 之间切换语言模式 。

此外,其监督微调(SFT)训练数据中30万条为高质量、可验证实例,剩余10万条为人工优选创意数据。这一比例本身也透露了模型设计的目标方向 —— 强调思维与过程,而非单纯的语言 "漂亮话"。

04·字节的 "大模型方法论":行业化、任务化、模块化

Seed-Thinking v1.5的落地,某种意义上不是为了比肩GPT-4这样的超级模型,而是试图为 "模型细分场景化" 做出一种范式定义。

这种范式包含三重路径:

· 行业化:通过在火山引擎开放接口,推动其在教育、医疗、金融等 "可验证任务密集型" 行业率先落地;

· 任务化:将通用大模型拆解成模块化组件,用更低成本满足垂类需求,逐步构建 "多任务共生模型" 体系;

· 模块化:依托 MoE 架构和流式推理机制,实现模型组件化、可组合、可升级,适配不同场景与算力环境。

与其说字节在造一个万能的大脑,不如说它在构建一个可控的、分布式的 "思维工厂"。在这里,每一道逻辑,每一次决策,都是在计算效率与思维路径之间反复权衡后的产物。

写在最后:参数时代的终结,AI 进入 "成本约束下的智能战"

在通用大模型不断拔高天花板之时,字节跳动用Seed-Thinking v1.5重新定义了 "模型能力" 的维度边界:不是跑分最强、不是对话最顺,而是最懂得 "任务分层" 和 "资源利用效率" 的那一个。

这是一次AI范式的调整:从算力驱动,走向效率导向;从一体化模型,走向模块化系统;从语言对齐,走向推理对齐。

也许未来的大模型之战,拼的不是谁更 "聪明",而是谁能以更低成本、更高可靠性,把 "聪明" 变成落地价值。而这一轮产业升级的节奏,Seed-Thinking v1.5已经开始奏响。

 时事1:成人🔞QQ群2025

  04月23日,40℃来袭 实测重庆交巡警执勤温度,

  他感觉,这应该是一头血脉纯净、更为恐怖的穿山甲王留下的,不知道怎样被这头祭灵得到了。

,大胸少萝100%裸体无遮掩。

  04月23日,四川石渠县发生4.7级地震 暂无人员伤亡报告,

  四是试点乡镇示范带动不断突出,渗透作用日益延伸。小城镇建设在我市城镇化的梯级结构中处于最低一级,但它们在小天地里演绎了大精彩,纷纷唱起了“特色戏”。随着我市小城镇二、三产业的兴起,广大农民纷纷进镇务工经商,使农村生产力从纯农业中分离出来,对启动农村工业化,加速乡村城市化进程起到了很大作用。尤其是各县区所在的城关镇、城郊乡城乡二元结构差异小,经济发展较快,在年全市乡镇综合经济实力排序中稳居前列。目前,全市小城镇镇区非农业人口由年的万人增加到年底的万人,吸纳农村劳动力万人。小城镇试点的示范引导作用日益突出,我市自年以来先后确定了个综合改革试点乡镇,它们发展的显著成效,对全市的小城镇建设起到了很好的示范带头作用。据统计,试点镇(乡)的财政收入平均高出其它小城镇,国内生产总值平均高出,农民人均纯收入平均高出。个试点镇乡在全市个镇乡综合经济实力排序中,年有个升位,年有个升位。县镇突出以经济建设中心,六年来综合经济实力上升位,进入全市三十强,在全市产生了强烈的示范效应。还有一些小城镇的发展依托历史特点和自身优势进行定位,功能作用独具特色。如镇以发展旅游为主,以繁荣市场出名,靠“嫩头青”萝卜、靠柳编“打天下”,靠工业“唱大戏”,让边界贸易、服务业“登堂入室”,靠科技先导招纳四方,靠区位优势造镇,靠交通优势兴业。这些小城镇已成为我市小城镇建设的典范,在全市的经济建设和发展中起着不可低估的带动作用。值得一提的是,有些乡镇也建设了工业园区,如罗山的镇,规划建设了周南工业园区,已吸纳家乡镇企业入驻,区镇和镇分别建立了民营工业园和“双非”工业园,这些做法值得具备条件的乡镇借鉴。

,宋雨琦露出双乳让男生玩绿巨人,玖辛奈被扒开腿坐做❌同人游戏,原神❌18同人禁网站游戏。

 时事2:茶茶脚底lvK

  04月23日,志愿者黄慧星:踩下油门我就没想过回头,

  那么怎样才能提高自我保护的意识呢?

,女性自慰喷潮hh,15男生下面发育图片,无码自慰成人游戏。

  04月23日,(高质量发展调研行)解码新松如何助推辽宁制造业加快转型升级,

  四、辅导学生参赛成绩突出。

,班长扒开让我🍌蹭来蹭去,亚州美女屁股眼交9,扒开🍑伸进🍌❌免费视频。

 时事3:十八禁🔞裸体福利姬cos

  04月23日,飘香七十载,探访中国胡椒“兴隆之路”,

中信信用卡逾期三个月被起诉了会怎么样怎么办

,校花被❌娇喘出,㊙️羞羞漫画破解版,动漫男被❌c🐻扒衣服做小电影。

  04月23日,国道G318线四川雅江段全幅抢通,

  一是学风不浓。现在我们全国上下正为着重打造学习型社会而努力,各级党政主要领导一再强调加强学习的重要性。要求我们基层干部必须加强党的方针、政策的学习,加强对市场经济的学习,加强对科学知识的学习,而在我区上下,学习风气不是很浓,尤其是我们的一些同志整天围着杯子转、围着牌桌转,围着鱼杆转,有的甚至围着裙子转,不思学习,不想学习。整天无所事事,终日碌碌无为,相反,对社会上的一些无聊的东西,比如千变万化的麻将扑克新赌法,飞来飞去的黄色短讯,我们一些干部倒是学得很快,一看就懂,一学就会。我说这些人心事都没有用在正经的学习上面,大量的时间被浪费了。他们对党的方针政策理解不透,对新知识、新经验一知半解,对新问题、新情况麻木不仁,造成的直接后果就是素质很差、眼界狭窄、境界低下、思想保守,不能很好地完成党和人民交给的任务。当今时代知识奔流,信息密集,科学技术迅速转化为生产力,知识经济越来越直接地融化为综合实力。我们如果不学新知识,不学人家的先进经验,没有与时俱进、开拓创新的精神,面对新形势、新情况、新问题,便会束手无策,不知所措,干不成大事业。

,妓女动漫胸得到成熟,被到爽流片游戏,宿友c我🌿男男开车动漫。

 时事4:Gay FuckXXXXHD男男

  04月23日,中国驻菲大使寄语菲华青年:懂中国,传真相,树新风,

  “凭他们的身份地位,想来子嗣不会太差,想通过考验进入补天阁应该不会成问题,符牌所能领取到的宝药等,他们族中还会缺少吗?”夏幽雨不以为然。

,托比亚斯-哈里斯,深夜自慰小黄文爽到流水,斗罗大陆朱竹清钥匙扣。

  04月23日,遮风挡雨自带“空调”!“洞”感篮球赛在这里举行,

保护环境我们在行动国旗下讲话 篇9

,小武与妈妈1~9节内容概括,男生把🐔🐔桶30分钟无需网,性裸交直播。

责编:崔婧娥

审核:陈国强

责编:成惠琳

相关推荐 换一换