关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者2587人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

前英超裁判:桑德兰绝杀切尔西的进球因越位应被取消

懂球帝 浏览 2693

60+女人,秋天穿衣“上紧下宽”,不紧绷、不暴露优雅显年轻

静儿时尚达人 浏览 2870

不止造车 奥迪在北京做了一件关乎自然未来的事

网易汽车 浏览 2863

发球都不会的球员混进ITF职业比赛!引国外网友和专家愤怒

网球之家 浏览 1786

新华社权威快报|“中国天眼”揭示快速射电暴双星起源关键证据

新华社 浏览 1668

IPO观察丨东鹏饮料再递表港交所,大单品收入占比近8成,上半年广告费超8.8亿元

红星资本局 浏览 2921

商竣程香港250赛再爆大冷排名狂飙95位,郑钦文官宣退出2026澳网

网球之家 浏览 1763

终端价普涨!茅台9月动销同比增20%,机构称白酒行业底部愈发清晰

澎湃新闻 浏览 3308

何聪睿剧扑甩锅女主,本人发声道歉

扒虾侃娱 浏览 1646

福建舰入列消息刷屏 美媒对其达到的技术高度表示赞叹

环球网资讯 浏览 7359

西班牙足协主席:我们会充分照顾球员利益,俱乐部可以放心

懂球帝 浏览 2615

A股利好,一夜之间多家公司密集宣布

21世纪经济报道 浏览 2119

约10米高吊罐掉落砸伤3名路人 40岁驾驶员被警察带走

大风新闻 浏览 8108

天价索赔后,欣旺达还能稳当“老六”吗?

财经无忌 浏览 1510

章子怡醒醒给汪峰打电话:哈尔滨冷记着多穿衣服

观察鉴娱 浏览 2466

直播间买货更放心了!两大新规封堵虚假宣传、仅退款乱象

贝壳财经 浏览 1406

今日热点:车银优代言广告被隐藏;《巅峰对决》主演担任米兰冬奥会火炬手……

伊周潮流 浏览 1576

邵佳一:退役画面还在脑海;做教练最适合我,离不开这个地方

懂球帝 浏览 1725

智驾下一个关键挑战,是不被别人摘“桃子”?

虎嗅APP 浏览 1882

深圳联通官宣可预约上门办理eSIM业务,暂定截至10月31日

IT之家 浏览 2722

卫星互联网低轨 12 组卫星发射成功,长征系列火箭 600 次里程碑

IT之家 浏览 2946
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1