CHATGPT有一半的编程问题都是错误的
2023-08-11 16:09:45行业资讯

WechatIMG3386.jpg

CHATGPT向公众发布后不久,很多程序员开始注意到OpenAI的ChatGPT的一个显著特性:它可以快速地吐出代码,以响应简单的提示。

但是软件工程师真的应该相信它的输出吗?CHATGPT目前存在哪些问题呢?

1、具有答案错误的问题

在一项尚未进行同行评审的研究中,普渡大学的研究人员发现,这个超级流行的人工智能工具从流行的问答平台Stack Overflow获得的517个软件工程提示中,有一半以上是错误的-因此程序员在采用ChatGPT的答案之前需三思而后行。

2、具有病理性说谎的问题

这项研究(论文)还发现了人类能力中有趣的细微差别。研究人员让一组12名具有不同编程专业知识水平的参与者分析ChatGPT的答案。虽然他们倾向于在包括正确性、全面性、简洁性和有用性在内的类别中对Stack Overflow的答案评分更高,但他们并不擅长识别ChatGPT错误的答案,在39.34%的情况下无法识别错误答案。

换句话说,ChatGPT是一个非常有说服力的骗子-这是我们已经非常熟悉的现实。“用户忽略了ChatGPT答案中的错误信息(39.34%的时间),因为ChatGPT答案中的全面,清晰,和人形见解,” 该研究论文中也写道。

我们到底该有多担心呢?首先,有很多方法可以在软件中得到相同的“正确”答案。许多人类程序员也说他们验证了ChatGPT的输出问题,表明他们具有理解工具的局限性。但这种情况是否会频繁出现类似问题目前还有待观察。

3、缺乏理解和推理

研究人员同时也认为,目前仍需要做大量工作来解决这些缺点。他们在论文中写道:“虽然现有的工作集中在从大型语言模型中消除幻觉,但这些工作只适用于修正事实错误。”“由于概念错误的根源不是幻觉,而是缺乏理解和推理,现有的幻觉修复方法不适用于减少概念错误。

我们需要重点专注于“教ChatGPT推理”,目前存在的这几个问题对当前AI技术从业人员来说是一个艰巨的任务。