关闭广告

Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了

量子位6647人阅读

西风 发自 凹非寺
量子位 | 公众号 QbitAI

谷歌Gemini修改bug让网友大开眼界!

X一小伙分享,为测试Gemini 1.5 Pro,自己在编写一个网页的代码时故意留了3个bug,并分别录制了网页bug视频。

接着把代码库打包成文件连同视频一起输给了Gemini 1.5 Pro,提示它找到并修复代码中的所有bug,且要提供一个简要指南以及所做更改的说明。

没想到,Gemini 1.5 Pro还真就分分钟正确识别并修复了每一个bug。



小伙将这种玩法po出来后热度不断攀升,网友们纷纷一键三连,转赞收藏量过万。

其本人还在评论区强调,“这只是一个简单的例子,也将是它最差的表现”,Gemini这小汁前途不可限量啊。



有网友表示想起来一件事觉得有趣:英伟达黄院士前段时间曾公开表示“孩子们以后不需要学编程了”,那时候还有很多人反对称“AI不会取代程序员”





但甭管怎么说,AI可以给程序员提供帮助是有目共睹的。



接下来我们展开来看Gemini 1.5 Pro修复bug的经过。

事件经过

正如开头提到的,网友先是在编写网页代码时故意写错了3处:



这就导致网页上的一些功能操作无法正常运行,于是小伙分别拍摄了3处无法正常运行的视频,每个视频十几秒。

然后将视频连同代码库一起输给了Gemini 1.5 Pro。

prompt为:

Fix the bugs in my code.Create a simple markdown guide for me to fix them,and then write the actual code to fix the bugs.I need the full code like it’s for a complete PR so I am make the changes.(修复我代码中的bug,为我创建一个简单的Markdown指南以修复bug,然后编写实际的代码来修复。我需要完整的代码,就像它是为了一个完整的Pull Request一样,这样我才能进行更改。)



随后,Gemini 1.5 Pro立刻准确识别了3个bug:

  • 点击一个待办事项并不会将其标记为完成/未完成
  • 主题切换器不会切换主题
  • 点击登录按钮不会触发任何操作



紧接着就分别给出了修复方案,附带代码:



小伙仔细对照自己敲的代码,确认Gemini 1.5 Pro给出的答案是正确的:



小伙还强调,这3个bug在代码库文件中其实离着很远,这也就意味着Gemini 1.5 Pro确实读完了完整的上下文。



“想要访问权限”

网友看到这一系列操作后激动搓手,直呼想要Gemini 1.5 Pro访问权限:





除坐等外,还有网友表示用GPT-4帮忙修复代码也很好使,顺带畅想了一下GPT-5:

接下来可能是实时交互?或许能与GPT-5进行屏幕共享?



而另一边已经获得访问权限的网友早就玩嗨了。

比如,一次性输给Gemini 1.5 Pro最新的10篇论文,让它从中找到一个作者的电子邮件地址。

结果Gemini 1.5 Pro第一次就成功找到了:



然后又让Gemini 1.5 Pro从超360000token的《哈利·波特与凤凰社》整本书中找到一句话的说话人,Gemini 1.5 Pro也成功找到了。





测试继续上难度,一次性输入三本书,Gemini 1.5 Pro最后用时约1分钟再次成功找到对应的说话人:



惊讶之余,这位测试者总结了Gemini 1.5 Pro的逻辑推理能力:

对于常规提示,接近GPT-4的性能。
但当我添加数十个例子时,Gemini的性能在提升,似乎没有上限。多示例提示成为了新的微调方法。



沃顿商学院教授Ethan Mollick也来整活了。输给Gemini 1.5 Pro一本352页的《太空60年》规则手册,约250000token,然后要求它扮演一个角色。

即使说明书分散在很多页上,而且非常复杂,但Gemini“似乎明白了”:



Ethan Mollick教授表示,对所有其他AI进行这项测试都是失败的,只有Gemini 1.5 Pro成功了。



这位网友想要编译整个X算法的代码存储库并将其上传到Gemini 1.5 Pro,正在线向网友征集想问的问题。



只见编译完成后,共310489token,Dogan Ural向Gemini 1.5Pro提出了网友们关心的一系列问题,比如“在推特上扩大或者减少影响力的前5件事是什么?”

Gemini 1.5Pro很轻松地给出了这样婶儿的答案:



你还见过哪些有趣的玩法?欢迎评论区分享~

[1]https://twitter.com/mckaywrigley/status/1762175776726663267
[2]https://twitter.com/mattshumer_/status/1759981272779108403?s=46&t=iTysI4vQLQqCNJjSmBODPw

— 完 —

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

赵丽颖妆容进化史2.0

COSMO美人计 浏览 13333

拜登在台湾选举后表示"不支持台湾独立" 国台办回应

环球网 浏览 44659

15岁男孩玩直播花光姐姐17万彩礼 姐姐:本想给他买房

新闻晨报 浏览 37429

马克龙将再次会见马斯克 谈论特斯拉在法国投资的可能性

IT之家 浏览 10489

初中学历的男子冒充富二代跟20多名女性交往,其中有一位女性被诈骗900多万

趣看热点 浏览 994235

事关特朗普大选资格 美国最高法院发声

每日经济新闻 浏览 42386

冯柳新进4家公司!段永平偷着乐...

格隆汇 浏览 12447

六七十岁中国大妈,帽子别戴“太婆帽”和“针织帽”,这些更减龄

潮人志Fashion 浏览 6699

达芙妮们,都想成为南极电商

斑马消费 浏览 8913

贝尔巴托夫:我希望鲁尼攀登教练之路,未来他想执教曼联

直播吧 浏览 7216

零食很忙,果然很忙!估值超百亿,获上市公司7亿增资

证券时报e公司 浏览 7219

雷军再曝小米汽车猛料,2月22日有大瓜?

汽场汽车APP 浏览 6814

全世界最美的8条裙子 没有女人能拒绝

LinkFashion 浏览 9089

关掉1000家门店!通用汽车通过收购将别克品牌经销网络削减一半

网易科技报道 浏览 7026

女孩从海南乘大巴到广州用了30小时 票价仅480元

上游新闻 浏览 48851

募资650亿,近13年之最!“巨无霸”IPO要来了,下周有10只新股申购

每日经济新闻 浏览 10883

网红减肥产品效果来自禁药,副作用远大于减肥作用

趣看热点 浏览 19788

张一鸣的路,OpenAI走得通吗?

字母榜 浏览 7168

美英打击胡塞武装 行动规模或限定在“小范围”

澎湃新闻 浏览 7018

大成基金:“高新技术产业股票A”成立8年多收益率260%,最大回撤45.77%

面包财经 浏览 13420

碾压GPT-4!DeepMind CEO自曝:下一代大模型将与AlphaGo合体

新智元 浏览 10103
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1