关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者4367人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美股反弹!纳指收涨2.21%,黄金、白银期货飙涨创历史新高

中新经纬 浏览 4439

伊朗情报部长:伊成功渗透以色列核研究设施

每日经济新闻 浏览 4863

2025生命科学大会在穗召开,发布器官医学十大进展

南方都市报 浏览 5106

印尼国家队经理:克鲁伊维特教练团队必须重新接受评估

懂球帝 浏览 4478

美称对“占领”委内瑞拉保留选择权

南方都市报 浏览 2750

上海AI实验室重新定义视频理解:让AI像侦探一样思考长视频

科技行者 浏览 4360

韩综镜头下,中国南极站vs韩国世宗王站,差距大到韩网友集体破防

时评人李文君 浏览 3318

欧洲多国向格陵兰岛派遣军事人员 白宫回应

大象新闻 浏览 3170

重庆女子乘"黄色法拉利"去内蒙古:计价器爆表了

大风新闻 浏览 20173

采用插混动力 奇瑞风云A7谍照曝光

车质网 浏览 2310

辽宁98-86送北控3连败,威尔斯31+7,廖三宁9中9空砍22+7

懂球帝 浏览 3665

歌手黄安透露音乐人屠颖离世细节

情感大头说说 浏览 4151

汕头火灾致12人遇难 幸存家属讲述逃生细节

红星新闻 浏览 20770

迅雷起诉前CEO陈磊:指控其隐秘掏空公司,追索资产2亿元;知名游戏公司发布反腐公告:3名员工涉嫌收受贿赂,已被拘留;京东成立文旅公司

雷峰网 浏览 3240

最有种的女明星

江湖人称艾掌门 浏览 4128

特斯拉Model Y低调升级?标配16寸2K大屏+0息政策

大李说车 浏览 3499

专家:自民党与公明党谈崩了 给高市早苗当头一记闷棍

澎湃新闻 浏览 4903

被Meta点醒,苹果砍掉廉价头显,押注智能眼镜

网易科技报道 浏览 4414

齐溪晒二胎宝宝正脸!身材发福明显

松林侃世界 浏览 3427

OpenAI:人类打字速度将成通用人工智能发展瓶颈

IT之家 浏览 3578

CBA最新排名!3队争第四,浙江崛起,6队在最后6轮竞争第12!

篮球资讯达人 浏览 1739
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1