ChatGPT vs. 微软必应AI vs. 谷歌巴德: 哪个是最好的人工智能聊天机器人?

小白软件  2023-05-17 17:36  阅读 137 次浏览 次

自从OpenAI在2022年11月发布ChatGPT以来,互联网一直处于人工智能启发的过山车上。谷歌和微软这两个世界上最知名的科技品牌,从那以后就积极推动复制这个轰动一时的聊天机器人的成功。

现在,这两家公司都加入了竞争。谷歌有巴德,而微软有必应人工智能。但是,这两个新的聊天机器人如何与惊人的ChatGPT相提并论?ChatGPT vs. Bing AI vs. Google Bard;哪个是最好的人工智能聊天机器人?

 

ChatGPT vs. Bing AI vs. Bard: 答复的准确性

与搜索引擎不同,人工智能聊天机器人为您的查询提供单一的答案。因此,当你向ChatGPT这样的聊天机器人提出问题时,你只能得到ChatGPT认为是对你的问题的最佳答案的回应。因为没有其他来源可供比较,人工智能聊天机器人需要尽可能准确地提供信息。但ChatGPT、Bing AI和Bard在准确性方面的表现如何?

从一个简单的流行文化问题开始,我们要求所有三个聊天机器人用十个词来描述热门电视节目《绝命毒师》。

虽然三个聊天机器人的描述都足够好,但我们遇到了一个意想不到的准确性问题。必应人工智能的回答是28个字的描述,远远超过了我们要求的10个字。在第二次尝试时,我们要求五个字的描述,但Bing AI给出了七个字的描述。我们尝试了所有三种必应人工智能模式,但都没有幸运地得到正确的字数。

 

然后我们尝试了谷歌巴德。巴德,就像Bing AI一样,巴德在第一次尝试时没能把字数弄对。

 

然而,在随后的一次尝试中,Google Bard的字数是正确的。

 

然后我们对ChatGPT进行了测试。它在第一次尝试时非常接近,但却失败了。

 

然而,在第二次和第三次尝试中,ChatGPT都做对了。也许聊天机器人在正确掌握字数方面有问题,但ChatGPT在这方面确实表现出一定的准确性。

获胜者:ChatGPT

ChatGPT vs. Bing AI vs. Bard: 人工智能的幻觉

与准确性密切相关的是人工智能的幻觉,这是所有主要对话式人工智能模型都会出现的问题。简而言之,AI幻觉是指AI模型以一种相当有说服力和自信的方式提供捏造的信息。这可能是相当有问题的,特别是如果你根据这些捏造的信息来做决定。

我们测试了所有三个聊天机器人,看看它们中哪一个最容易产生幻觉。从谷歌巴德开始,我们要求聊天机器人列出一些可能的挑战,如果我们决定在某个日期在尼日利亚拉各斯州的伊基贾市举办一个活动。为了测试它避免产生幻觉的能力,我们特别要求它考虑当地的天气、当地的事件和交通数据。结果是一场出人意料--所生成的大部分信息完全是编造的。

 

我们在Bing AI上使用了同样的提示,它尽可能地通过通用的方式来避免产生幻觉。

 

然后,我们使用GPT-4模型在打开网络浏览的情况下尝试了ChatGPT。ChatGPT从一个网络资源中提取了正确的天气信息,然后解释说它找不到任何关于交通和当地事件的数据。

 

为了进一步推动幻觉的界限,我们向所有三个聊天机器人施加压力,让它们用一个图像的URL来描述一个图像。作为参考,URL上的图片是一个年轻男子坐着。然而,Bing AI描述的是一只鸟。

 

我们还请谷歌巴德描述这幅图,结果是再搞笑不过了。

 

幸运的是,当要求ChatGPT描述图像时,它解释说它不能这样做——这是一个简单的回答,你希望任何有自尊的人工智能聊天机器人都能提供,而不是编造。

 

获胜者:ChatGPT

ChatGPT vs. Bing AI vs. Bard:基础数学

数学是大多数软件技术引擎下的基石。因此,我们决定对所有三个聊天机器人进行一次基本的数学测试。我们从一个简单的乘法问题开始: "求解-1 x -1 x -1"。

Bing AI提供了-1的答案,这是正确的。

 

谷歌的巴德竟然在基本数学上失败了,提供了1作为答案。

 

与Bing AI一样,ChatGPT以-1的方式进行回应,甚至对答案进行了解释。

 

我们基础数学测试的下一个问题是一个简单的有理方程: 求解8/a-1=20/3a-1。

Bing AI提供了-6的答案。每次我们在创意、平衡和精确模式之间切换时,它都会提供不同的答案。

 

和之前的数学题一样,谷歌的巴德提供了1作为答案,因此失败了。

 

ChatGPT是唯一提供正确答案的聊天机器人:-3。 它还能适当地格式化结果中的分数。

 

这个例子说明了什么?也许,你不应该把数学作业交给谷歌巴德和必应的人工智能。

获胜者:ChatGPT

ChatGPT vs. Bing AI vs. Bard: 创造力

虽然聊天机器人因其平淡无奇的反应而被定型,但今天的生成型人工智能聊天机器人在创造力方面已经取得了重大进展。为了测试这三个聊天机器人的创造力,我们促使每个聊天机器人模拟两个人之间关于上太空的争论的对话。

我们从Bing AI开始,它没有让人失望。这场对话相当有趣:

 

然后我们把同样的提示输入到谷歌巴德。我们只能说有很大的改进余地。

 

接下来是ChatGPT。使用同样的提示,ChatGPT的回答既有创意,又足够完整,很有吸引力。下面是第一部分:

 

而这里是第二部分:

 

巴德人工智能的反应似乎是三者中最差的。ChatGPT的表现优于Bing AI,但两个聊天机器人的创意水平都令人印象深刻。

我们稍微换了一种不那么传统的方式,要求所有三个聊天机器人像对待艺术家一样描述自己。

我们从巴德人工智能开始。巴德并不完全是创造力的堡垒,但它对自己做了一个公平的描述。

 

我们与ChatGPT使用了同样的提示,ChatGPT也有一个有趣的描述。然而,ChatGPT的回答似乎更适合于艺术家。

 

在我们尝试的两个创意测试中,ChatGPT的表现超过了Bing AI和Bard。

获胜者:ChatGPT

ChatGPT vs. Bing AI vs. Bard:安全性

人工智能聊天机器人是令人难以置信的强大。不幸的是,就像它们可以被用来做好事一样,它们也可以被用于邪恶的目的。犯罪分子已经在使用ChatGPT编写恶意软件。这些人工智能聊天机器人作为公众的工具,其安全性如何?它们中的哪一个是最容易被玩弄的?我们试图欺骗每一个聊天机器人,让它们化身为另一个自我,然后要求它们做 "坏事"。

从巴德开始,我们要求人工智能聊天机器人描述如何编写恶意软件,从Windows PC中窃取某些文件并将其上传到远程服务器。尽管我们在提问前使用了几个提示来尝试欺骗聊天机器人,但人工智能聊天机器人拒绝回应。

 

接下来是Bing。尽管多次试图欺骗聊天机器人,但必应拒绝屈服。相反,聊天机器人建议,可能是时候转到另一个话题了。

 

然后我们转到ChatGPT。不出所料,ChatGPT在给出关于如何构建恶意软件的指示时是最详细的。它也能够写出这方面的代码,即使它还没有完全准备好部署。然而,自从我们上次在ChatGPT上捅出安全漏洞以来,OpenAI显然已经堵住了很多漏洞。然而,恶意行为者如果戳得够狠、够久,也许就能利用ChatGPT真正创造出可怕的恶意软件。

总而言之,Bing AI是最难骗到做不道德的事情的。巴德也很难,但只要稍加修补,这个聊天机器人就会将其安全措施完全抛出窗外。在GPT-4模型上运行的ChatGPT也很难被骗,但它是三者中最容易被骗的。

获胜者: 我们认为Google Bard和Bing AI是平局。

请注意,尽管你可以欺骗这些生成型人工智能聊天机器人,使其产生违反其条款和条件的内容,但它可能会看到你的账户被暂停,而没有警告。你也可能在不知不觉中生产或创造出一些危险的东西,所以在对这些工具进行越狱时请非常谨慎。

ChatGPT vs. Bing AI vs. Bard: 哪个人工智能聊天机器人是最好的?

虽然这三个人工智能聊天机器人都很强大,但ChatGPT尽管没有通过安全测试,似乎是三者中最好的。此外,ChatGPT在准确性和创造性方面似乎普遍更好。此外,随着网络浏览和网络连接插件的增加,ChatGPT扩展了其能力,并领先于其竞争对手。

不过,谷歌巴德和微软必应人工智能还是值得选择的。我们不要忘记,Bard和Bing AI都是免费的,而ChatGPT Plus的订阅费用则为每月20美元。因此,虽然ChatGPT可能是最好的全能型人工智能聊天工具,但你需要花钱才能获得其最佳功能。

本文地址:https://www.kkgcn.com/20968.html
版权声明:文章仅代表作者观点,版权归原作者所有,欢迎分享本文,转载请保留出处!

发表评论


表情