CHATGPT有一半的编程问题都是错误的-北京着陆云科技有限公司

CHATGPT有一半的编程问题都是错误的

2023-08-11 16:09:45行业资讯

在CHATGPT向公众发布后不久，很多程序员开始注意到OpenAI的ChatGPT的一个显著特性：它可以快速地吐出代码，以响应简单的提示。

但是软件工程师真的应该相信它的输出吗？CHATGPT目前存在哪些问题呢？

1、具有答案错误的问题

在一项尚未进行同行评审的研究中，普渡大学的研究人员发现，这个超级流行的人工智能工具从流行的问答平台Stack Overflow获得的517个软件工程提示中，有一半以上是错误的-因此程序员在采用ChatGPT的答案之前需三思而后行。

2、具有病理性说谎的问题

这项研究(论文)还发现了人类能力中有趣的细微差别。研究人员让一组12名具有不同编程专业知识水平的参与者分析ChatGPT的答案。虽然他们倾向于在包括正确性、全面性、简洁性和有用性在内的类别中对Stack Overflow的答案评分更高，但他们并不擅长识别ChatGPT错误的答案，在39.34%的情况下无法识别错误答案。

换句话说，ChatGPT是一个非常有说服力的骗子-这是我们已经非常熟悉的现实。“用户忽略了ChatGPT答案中的错误信息（39.34%的时间），因为ChatGPT答案中的全面，清晰，和人形见解，” 该研究论文中也写道。

我们到底该有多担心呢？首先，有很多方法可以在软件中得到相同的“正确”答案。许多人类程序员也说他们验证了ChatGPT的输出问题，表明他们具有理解工具的局限性。但这种情况是否会频繁出现类似问题目前还有待观察。

3、缺乏理解和推理

研究人员同时也认为，目前仍需要做大量工作来解决这些缺点。他们在论文中写道：“虽然现有的工作集中在从大型语言模型中消除幻觉，但这些工作只适用于修正事实错误。”“由于概念错误的根源不是幻觉，而是缺乏理解和推理，现有的幻觉修复方法不适用于减少概念错误。“

我们需要重点专注于“教ChatGPT推理”，目前存在的这几个问题对当前AI技术从业人员来说是一个艰巨的任务。