速览热门论文
1. 微软发布首个开源、原生 1-bit 大语言模型
2. 再试一次,即可提高 LLM 搜索能力
3. Cobra:利用 200 张参考图像实现高效线条着色
4. ActPRM:通过主动学习高效训练 PRM
5. 综述:高效推理模型
1. 微软发布首个开源、原生 1-bit 大语言模型
在这项工作中,微软研究院团队提出了 BitNet b1.58 2B4T——首个开源、原生 1-bit 大语言模型(LLM),参数规模为 20 亿。该模型在包含 4 万亿 token 的语料库中进行了训练,并在语言理解、数学推理、编码能力和会话能力等方面进行了基准评估。
结果表明,BitNet b1.58 2B4T 的性能与同等规模的领先开放权重、全精度 LLM 不相上下,同时在计算效率方面具有显著优势,包括大幅减少内存占用、能耗和解码延迟。
为了促进进一步的研究和应用,他们发布了模型权重以及 GPU 和 CPU 架构的开源推理实现。
论文链接:https://arxiv.org/abs/2504.12285
2. 再试一次,即可提高 LLM 搜索能力
检索增强生成(RAG)提高了大语言模型(LLM)在知识密集型任务中的性能,但这在很大程度上取决于初始搜索查询的质量。当前方法通常使用强化学习,侧重于查询表述或结果推理,而不会明确鼓励在搜索失败后继续搜索。
在这项工作中,Menlo Research 团队提出了一个新的强化学习框架——ReZero(Retry-Zero),其直接奖励初次尝试失败后重试搜索查询的行为。这激励 LLM 探索其他查询,而不是过早地停止。
与 25% 的基线相比,ReZero 取得了 46.88% 的准确率,增强了 LLM 在复杂信息搜索场景中的鲁棒性,在这种场景中,最初的查询可能被证明是不够的。
论文链接:https://arxiv.org/abs/2504.11001
3. Cobra:利用 200 张参考图像实现高效线条着色
漫画制作行业需要基于参考资料的线稿着色,要求精确度高、效率高、上下文一致、控制灵活。漫画页面通常涉及不同的人物、物体和背景,这使得着色过程变得复杂。用于图像生成的扩散模型在线描着色中的应用依然有限,面临着处理大量参考图像、推理耗时和灵活控制等挑战。
在这项工作中,来自清华大学、香港中文大学和腾讯的联合团队研究了大量上下文图像引导对线稿着色质量的必要性。为了应对这些挑战,他提出了一种高效、多用途的方法 Cobra,其支持色彩提示,可利用 200 多张参考图像,同时保持较低的延迟。
Cobra 的核心是因果稀疏 DiT 架构,该架构利用专门设计的位置编码、因果稀疏注意力和键值缓存来有效管理长上下文参考,并确保色彩身份的一致性。结果表明,Cobra 通过广泛的上下文参考实现了准确的线条美着色,提高了推理速度和交互性,从而满足了关键的工业需求。
论文地址:https://arxiv.org/abs/2504.12240
4. ActPRM:通过主动学习高效训练 PRM
过程奖励模型(PRM)为大语言模型(LLMs)提供了阶段级监督,但对于人类和 LLM 来说,扩大训练数据标注仍然是一项挑战。
为了解决这一局限性,来自新加坡国立大学和 Sea AI Lab 的研究团队提出了一种主动学习方法 ActPRM,它可以主动选择最不确定的样本进行训练,从而大大降低标注成本。在训练过程中,他们使用 PRM 估算前向传播后的不确定性,只保留高度不确定的数据。随后,功能更强的推理模型会对这些数据进行标注。然后,他们计算与标注相关的损失,并更新 PRM 的权重。
他们在基于池的主动学习设置中比较了 ActPRM 和 vanilla 微调,结果表明 ActPRM 减少了 50% 的标注,但却实现了相当甚至更好的性能。除了标注效率之外,他们还利用 ActPRM 过滤了 100 多万条数学推理轨迹,保留了 60% 的数据,从而进一步提高了主动训练 PRM 的性能。与同等规模的模型相比,在这一选定数据集上进行的后续训练在 ProcessBench(75.0%)和 PRMBench(65.5%)上产生了 SOTA PRM。
论文链接:https://arxiv.org/abs/2504.10559
5. 综述:高效推理模型
推理模型通过在得出最终答案之前生成扩展的“思维链”(CoT),在解决复杂的逻辑密集型任务方面取得了很大的进展。然而,这种“慢思考”模式的出现,以及依次生成的大量 token,不可避免地带来了大量计算开销。这凸显了对有效加速的迫切需求。
在这项工作中,新加坡国立大学团队旨在全面概述高效推理的新进展,将现有工作分为三个主要方向:(1)更短--将冗长的 CoT 压缩成简洁而有效的推理链;(2)更小--通过知识蒸馏、其他模型压缩和强化学习等技术,开发具有强推理能力的紧凑语言模型;(3)更快--设计高效的解码策略以加速推理。
论文链接:https://arxiv.org/abs/2504.10903
整理:学术君
如需转载或投稿,请直接在公众号内留言
《将军,不可以!(限)暖冬笔趣阁免费阅读》,《w3u7903ejky2ywls》国产男男GaYGAYS✅18脚
“少年骇客小纹被小班❌”
中国🇨🇳老头性HD
……
04月24日
“91九色❤️PORNY推特大神”旅行任意门
↓↓↓
04月24日,中国以保障性住房再贷款加快推动存量商品房去库存,动漫美女裸体被❌折磨片名,歪歪漫画韩漫登录页面免费,阴脣上穿环的母狗,DeepSeek遭国际围堵
04月24日,建立专家库加强应急科普 青海完善地震灾害防范应对机制,美女脱一光二净打屁股,羞羞漫画❌喷水漫画yy漫画,免费无遮挡🔞视频网站醉酒动漫,的🍌伸到🍑屁股
04月24日,“百花迎春——中国文学艺术界2024春节大联欢”在京举行,XXXbX🍆🍆HD,摸同桌的我的变,⚠️羞羞漫画sss,Free❤❌❌❌❤vi
04月24日|以色列总理拒绝结束冲突换取人质获释|老太婆老荫道BBBBB|亚洲老奶老太|㊙️韩漫成人漫画免费歪漫屋|3D男男成人游戏18㊙️免费
04月24日|第三次全国土壤普查完成国家级数据库搭建|男女被❌到爽🔞在线观看|91成人Av乱偷在线Av|羞羞视频在线观看❤️|中也被空扒开腿做❌同人文
04月24日|特斯拉入局中国新型储能:只需塔克拉玛干沙漠0.1%面积,就够14亿人一年用电量“北约视战争如儿戏是极其危险的”|午夜无码免费人妻AAA片软件|女高中打屁股❤️网站|动画18禁裸体爆乳❌网站|唐山熟女高潮45分钟……
04月24日,冰雪经济,乘着“冬”风“热”起来,蘑菇🍄视频成人精品网战地址,坤坤寒进桃子里发出嗟嗟声,zzj中国zz女人18高潮,美女❌狂柔❌脱脱内内免费
04月24日,与你我有关!用AI走近这些新举措,泳装美女,cos内衣爆乳套装自慰,国产精品㊙️麻豆Tiktok,娜美吃路飞棍子漫画
04月24日|外交部:对于韩国内政不予评论|粗大的🐔吧在里面伸来伸去小说|国产精品㊙️入口免费看|男男互摸Gay✅网站|男男高潮片免费视频
04月24日,中国驻美使馆举办纪念中美建交45周年暨新春招待会,❤奇优影院在,成人国产精品㊙️精东传媒,蜜桃在线码无精品㊙️入口九色,亚洲性色精品一区二区在线
04月24日,加强职业启蒙教育 让成长不迷茫,永久免费不收费的软件app大,18OOO美女,男生和男生高基GAY🔞,㊙️黄AV无遮挡网站
04月24日,大陆开放福建居民赴金门马祖旅游 国台办:希望民进党当局撤除两岸人员往来禁限,yy6080❤论,美女爆吸乳羞羞免费网站妖精,日本⭕⭕⭕⭕XXXXsk公交车,男人把鸡大巴放进女人的屁股里
04月24日|福建省政协助推打造两岸融合示范样板|国产91❤️在线观看动漫|佐助被鼬c呻吟双腿大张|GaYGAYS✅免费自慰浪小辉|男GayGays免费
04月24日|河北宽城:硕果挂枝头 葡萄喜丰收|亲吻动漫 长时间|男男Gay裸体调教打屁股㇏|井野张开双腿给鸣人矂小说|开了俩女小嫩苞A片
04月24日|俄罗斯留学生成新“广府人”:喜爱“猪脚姜” 分享汉语学习“秘籍”|免费🔞美女❌❌❌涂抹网站|www成人🔞在纸看|美丽姑娘中国高清在线观看|姬小满的堕落h污文
31省份2023年经济“成绩单”,我公然梦想成为灰姑娘|张家界口岸2024年出入境客流量突破30万人次|96精品㊙️无码一区二区动漫|r星⭐精选|我是主人的贱母狗小说免费阅读|女仆丝袜
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺