ChatGPT 修 bug 横扫全场，准确率达 78%_IT科技网

ChatGPT到底有多会修 bug？

(资料图)

这事终于有人正儿八经地搞研究了 ——

来自德国、英国的研究人员，专门搭了个“擂台”来检验 ChatGPT 的这项本领。

除了 ChatGPT 之外，研究人员还找来了其它三位修 bug 的“AI 猛将”，分别让它们修复40 个错误代码。

结果真是不比不知道，一比吓一跳。

ChatGPT 准确修复了其中31 个bug，遥遥领先第二名（21 个），直接拿下“AI 修 bug 界”的SOTA成绩！

于是乎，这项研究引来了众多网友的围观和讨论，Reddit 上发布此帖的标题更是用上了“小心”、“注意”这样的字眼：

但事实上，这真的会让程序员“危”吗？

我们不妨先来看下这项研究。

很会修 bug 的 ChatGPT

虽然 ChatGPT 并非是为了专门修改 bug 而生，但自打它问世以来，不少网友们都发现它是具备这项能力的。

因此研究人员为了摸清 ChatGPT 到底能修改 bug 到什么程度，便引入了标准的错误修复基准集QuixBugs来进行评估。

以及与它同台竞技的 AI 选手，分别是CodeX、CoCoNut和Standard APR。

研究人员从 QuixBugs 中挑了 40 个问题，分别让它们来修复 bug。

让 ChatGPT 来修 bug 的方法，就是在对话框里向它提问：

这个代码有什么错误吗？

在第一轮较量过后，结果如下：

从第一轮 battle 结果来看，ChatGPT 修复了 19 个，CodeX 修复了 21 个，CoCoNut 修复了 19 个，Standard APR 则是 7 个。

而且研究人员还发现，ChatGPT 的答案与 CodeX 最为相似；这是因为它俩是来自同一个语言模型家族。

这时候就会有小伙伴要问了，“ChatGPT 不是还没有 CodeX 厉害吗”。

别急，不要忘了，ChatGPT 的一个特点就是越问越“上道”。

例如在这个基准集中，有一个叫 bitcount 的问题，ChatGPT 在刚才第一轮修复过程中是给了错误的答案：

原本 ChatGPT 应该将第 7 行的 n ^ = n - 1 改为 n & = n - 1。

但在第一轮中它的回答是：

如果没有更多关于预期行为和导致问题的输入信息，我无法判断程序是否存在错误。

于是在给予它更多信息之后，ChatGPT 便答对了这个问题。

以此类推，在对第一轮没答对的问题进行更多信息提示之后，ChatGPT 的修 bug 能力有了大幅提高：

最终，ChatGPT 在 QuixBugs 的 40 个问题里答对了 31 个。

网友忧喜参半

对于这样的实验结果，网友们对 ChatGPT 修 bug 拿下 SOTA 这事产生的态度却不太一样。

有网友认为这事不应该让程序员感到危机，而是会让他们觉得开心才对。

言外之意，便是程序员们有了这么好用的工具，干活儿就会变得事半功倍。

不过也有人对此给出了不一样的看法：

工作变得简单，不也就意味着需要的人力更少了吗？

但还网友觉得，活儿是干不完的：

即使 AI 能把开发时间缩短一个数量级，也只是意味着程序员将更快处理下一个工作。

整体来看，ChatGPT 很会修 bug，并不会给程序员带来什么致命伤害。

但若是把目光放到 OpenAI 其他的行动中呢？

全球招外包训练 ChatGPT 写代码

在此之前，OpenAI 就表示过 ChatGPT 的重要用途之一是帮助程序员检查代码。

换言之，它被定位可用的辅助工具。

相比“ChatGPT 带来威胁”的看法，等 ChatGPT 能力彻底进化，程序员都不用再怕写 bug 了。

OpenAI 布局的棋盘上，可不只有改 bug 偷塔程序员岗位这一件事。

为了让它更大更强，OpenAI 被曝在拉美和东欧等地区，提供了1000 个外包岗位。

外包员工的主要工作是标注数据，以及训练 ChatGPT写代码

这 1000 人中，40% 是程序员，他们为 OpenAI 的模型创建数据，用来学习软件工程任务。

一直以来，OpenAI 的训练数据是从 GitHub 上抓取的。

现在外包程序员们新手搓的数据集，不仅包括代码行，还包括代码行背后的人类思考逻辑步骤。

有位南美的软件开发人员爆料，他为 OpenAI 完成了五小时的无偿编码测试。

整个过程中，他的任务分为两部分。

用书面英语解释如何处理一个编码问题；

提供解决方案。

如果发现 bug，OpenAI 会向他详细询问 bug 的具体情况，并请教如何修正。

程序员需要展示思考问题的每个步骤，他据此猜测 OpenAI 很可能想为 ChatGPT 提供非常具体的训练数据。

特斯拉前 AI 主管 Andrej Karpathy 在推特上调侃：

最新的热门编程语言是英语。

不过话说回来，ChatGPT 修 bug 能力强是好事，要真能搞进化到可以完成代码里死记硬背的部分，也是好事。

毕竟 OpenAI 成立时对外宣称的宗旨，就是希望“确保通用人工智能可以造福全人类”。

虽然乍一看它这些年做的事，有点像在致力于用一部分人的努力，让更多人失业。

从 Dota2 赛场上碾压人类，到 GPT-3、DALL-E2、ChatGPT 的闪耀表现，它带来的新产品总是伴随着“快要让 xxx 失业了”的议论声。

但无论如何，商业却一直对它青睐有加。

就目前而言，OpenAI 的主要商业模式是 API 费用、token 费用和软件许可。

OpenAI 近期还发布了 ChatGPT 的付费版ChatGPT Pro，每月费用 42 美元（约合 285 元人民币）。

虽然机器人对话初创公司如雨后春笋般冒出，但诸多迹象表明市场对 OpenAI 的持续看好。

微软刚刚宣布将向 OpenAI 加码投资数十亿美元，并将 OpenAI 的模型融入微软必应等消费级和企业级产品中。

根据知情人士透露，此次追加投资数额约为 100 亿美元。

与此同时，WSJ 披露的消息显示，1 月初，亿万富翁 Peter Thiel 创立的风投基金 Founders Fund 正在就投资 OpenAI 进行谈判。

据悉，融资金额将至少达 3 亿美元。

One More Thing

在第一轮实验中，ChatGPT 并没有解决 QuixBugs 数据集的 bitcount 问题。

但若是你现在再重头问一次这个问题，就会发现 ChatGPT 可以“一遍过”：

那么这是否意味着 ChatGPT 已经从这次研究过程中学会求解了呢？

免责声明：本文由作者原创。文章内容系作者个人观点，转载目的在于传递更多信息，并不代表EETOP赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请及时联系我们，我们将在第一时间删除！

推荐内容

ChatGPT 修 bug 横扫全场，准确率达 78%

2023-02-06
e络盟开售安森美能源基础设施解决方案

2023-02-06
环球短讯！WiSA Technologies开始向先期测试客户交付WiSA E多声道音频功能开发工具套件

2023-02-06
伪造金融票证罪怎么办案？_今日最新

2023-02-06
当前速递！特点鲜明四款自主紧凑型SUV购车推荐

2023-02-06
刀锋战士新一代传祺GS3·影速新车图解

2023-02-06
质选车：蔚来EC7能否获得年轻消费者青睐-天天速读

2023-02-06
千禧开机号和试机号对应金码_千禧开机号

2023-02-06
筑牢交通安全线守护春运平安路世界观点

2023-02-06
攻略男主爸爸叔叔的快穿小说_攻略男主爸爸叔叔的快穿-天天播报

2023-02-05
意大利能源专家：欧洲能源危机远未结束|世界热点

2023-02-05
天天日报丨元宵节最带感的烟花，还得看人民海军

2023-02-05
世界快讯:东莞市广泰电子有限公司

2023-02-05
眼球追踪眼镜用来记录顾客的眼球运动

2023-02-05
男孩鼹鼠狐狸和马AppleTV+|当前讯息

2023-02-05
代号启程

2023-02-05
新款P7欧洲亮相：激光雷达完美隐藏大灯中-每日快报

2023-02-05
奇瑞汽车为何敢整车终身质保？总经理回应世界聚焦

2023-02-05
本田CR-V氢燃料版2024年推出可外接充电

2023-02-05
天天简讯:奔驰销售吐槽：向每位进店客户推荐买新能源

2023-02-05
世界快报:特斯拉Cybertruck最新曝光三角形后视镜

2023-02-05
热点评！黑暗乡村

2023-02-05
质选车：别克GL8 ES陆尊能否继续保持优势|天天资讯

2023-02-05
法系颜值新高度东风标致408X新车图解|当前观察

2023-02-05
养老保险费

2023-02-05
宋濂苦学_宋濂苦学世界快播

2023-02-05
前国安中场核心或与C罗成队友，先助家乡球队升级再淘金每日聚焦

2023-02-04
巡视组“内鬼”受贿近3000万，曾是“老虎”王立科的副手全球视点

2023-02-04
中国橡胶工业年鉴_百事通

2023-02-04
tusiji|环球百事通

2023-02-04
世界资讯：淘宝投诉后如何撤销_怎么撤销淘宝投诉

2023-02-04
科研经费花在哪？怎么花？山西这12家单位试点“包干制”

2023-02-04
好买网_视讯

2023-02-04
1月交付6,137辆长安深蓝SL03将迎来OTA升级

2023-02-04
同比增长均超20% 现代·起亚公布去年业绩全球今日报

2023-02-04
全球热讯:创历史新高长城汽车2022年营收1373.51亿元

2023-02-04
智加科技在德国开展重卡测试验证自动驾驶

2023-02-04
2022年锂矿企业动力电池业绩普遍预增

2023-02-04
每日快播：福特2022年净亏损20亿美元，在华亏损5.72亿

2023-02-04
ADAS技术哪家强？福特最牛，特斯拉退至第7 头条焦点

2023-02-04
传禾赛敲定赴美IPO发行价区间天天观焦点

2023-02-04
观热点：福特1月美国销量同比增长2%

2023-02-04
天天快消息！广州玖鑫物业管理有限公司

2023-02-04
2022款奇瑞瑞虎8 PRO完全评价报告_实时焦点

2023-02-04
推荐735Li豪华套装全新宝马7系购车指南|全球微动态

2023-02-04
《原神》永恒绿洲3个记忆解谜怎么玩？永恒绿洲3个记忆解谜玩法Get√具体是什么情况

2023-02-04
阳了应该怎么办-阳性感染者如何用药 02月04日00时福建泉州疫情数据天天快看点

2023-02-04
临沧拟竹蝗|天天短讯

2023-02-04
重点聚焦!首届配音初赛投票通道 | 决赛名额由你定夺！

2023-02-03
乌鲁木齐市第113中学动态

2023-02-03
微头条丨inSona智能照明系统应用于杭州雅正口腔医院

2023-02-03
中国移动与科大讯飞合作成立“联创+”智慧家庭智能交互创新实验室

2023-02-03
天天精选！新款Model 3最新谍照国内售价有望20万以下

2023-02-03
重点聚焦!最高优惠8.66万蔚来发布2月购车促销方案

2023-02-03
2023南京龙之谷元宵节夜场开放到几点

2023-02-03
逆水行舟不进则退世界热头条

2023-02-03
厘米秀查找故事线索教程是什么？ qq上精确查找是怎么加的？

2023-02-03
禁止U盘拷贝文件设置教程是什么？怎样把电脑上的文件传到u盘？

2023-02-03
百度图片打不开解决办法是什么？手机百度无法显示图片怎么办？

2023-02-03
PDF解密教程是什么？ pdf加密文件怎么打印？

2023-02-03
引擎分辨率设置教程是什么？手机游戏分辨率怎么调？

2023-02-03
KK录像机高清视频上传教程是什么？ kk录像机没有声音怎么办？

2023-02-03
360云盘加群教程是什么？手机百度网盘app在哪里加群？

2023-02-03
360云盘下载教程是什么？百度网盘下载的文件在哪？

2023-02-03
将微信收藏的小视频保存到电脑上的方法是什么？微信收藏的录音怎么导出？

2023-02-03
奇兔刷机双清教程是什么？手机进入奇兔刷机模式怎么退出？

2023-02-03
KK录像机录制视频教程是什么？摄像头不录像怎么回事？

2023-02-03
优酷视频黑屏解决办法是什么？电视上怎么把酷喵设置成主页？

2023-02-03
爱奇艺不能快进解决方法是什么？爱奇艺怎么调快进速度？

2023-02-03
爱奇艺视频亮度调节教程是什么？手机爱奇艺怎么调画面比例？

2023-02-03
厘米秀故事卡成熟时间是多久？ QQ厘米秀主题背景怎么设置？

2023-02-03
利桑德罗：很高兴韦霍斯特能进球我同林德洛夫的配合很默契|世界滚动

2023-02-03
360壁纸彻底卸载教程是什么？电脑桌面壁纸怎么删除？

2023-02-03
360壁纸收藏方法是什么？电脑壁纸怎么设置永久有效？

2023-02-03
360壁纸自动更换设置教程是什么？桌面自动换壁纸怎么取消？

2023-02-03
百度壁纸分享微博教程是什么？如何上传百度壁纸？

2023-02-03
百度壁纸开启自动更换教程是什么？怎样设置桌面壁纸？

2023-02-03
当前热文：搭载4.0T V8发动机迈凯伦750S将4月发布

2023-02-03
极氪第三款车型定名ZEEKR X 20万买不？百事通

2023-02-03
秦PLUS DM-i冠军版官图将于2月10日上市-天天观速讯

2023-02-03
厘米秀抢胶囊方法是什么？ QQ厘米秀怎么换服装？

2023-02-03
QQ厘米秀添加表情教程是什么？ QQ厘米秀如何制作自定义表情动作？

2023-02-03
奇兔刷机救砖修复教程是什么？手机奇兔刷机开不了机怎么办？

2023-02-03
Win10家庭组密码查询教程是什么？ win10系统如何创建家庭组网络共享？

2023-02-03
Steam游戏帧数显示方法是什么？ epic怎么设置帧数显示？

2023-02-03
坦克世界视频录制教程是什么？战舰世界录像怎么下载？

2023-02-03
炉石传说录制视频解说教程是什么？炉石传说怎么看回放？

2023-02-03
DNF视频录制教程是什么？ DNF截图和视频怎么保存？

2023-02-03
CF视频录制教程是什么？ kk录像机怎么剪辑视频？

2023-02-03
奇兔刷机强制卸载手机内置软件方法是什么？奇兔刷机recovery模式怎么解除？

2023-02-03
谷歌员工举行抗议活动：反对裁员及薪资过低天天头条

2023-02-03
世界今头条！苹果：不到万不得已，绝不裁员！

2023-02-03
手机中的二八定律：销量仅占18%，利润独霸85%！

2023-02-03
【新要闻】cf名胜古迹bug_cf名胜古迹

2023-02-03
热头条丨1月理想汽车新开门店17家理想L7将全面到店

2023-02-03
当前动态:王者数据榜:前、中、后期哪些英雄的强度最低?典韦甄姬连续上榜

2023-02-03
春节车市淡季看差距：蔚小理相互渐行渐远_环球看热讯

2023-02-03
全球即时看！发布全新用户品牌神龙汽车文化节即将开幕

2023-02-03
快报：优化产品矩阵梅赛德斯-奔驰将停产CLS等车

2023-02-03
豪华猎装轿跑极氪001 1月交付3116台

2023-02-03