今天,谷歌正在开放对其ChatGPT竞争对手巴德的有限访问,这是该公司试图在部署AI的新竞赛中夺回许多人认为失地的重要一步。巴德最初将提供给美国和英国的部分用户,用户可以在 bard.google.com 加入候补名单,尽管谷歌表示推出速度很慢,并且没有提供完全公开访问的日期。
今天,谷歌正在开放对其ChatGPT竞争对手巴德的有限访问,这是该公司试图在部署AI的新竞赛中夺回许多人认为失地的重要一步。巴德最初将提供给美国和英国的部分用户,用户可以在 bard.google.com 加入候补名单,尽管谷歌表示推出速度很慢,并且没有提供完全公开访问的日期。
与OpenAI的ChatGPT和微软的Bing聊天机器人一样,Bard为用户提供了一个空白文本框,并邀请他们就他们喜欢的任何主题提出问题。然而,鉴于这些机器人发明信息的有据可查的趋势,谷歌强调巴德不是其搜索引擎的替代品,而是“搜索的补充”——用户可以从中反弹想法、生成写作草稿或只是聊聊生活的机器人。
在该项目的两位负责人Sissie Hsiao和Eli Collins撰写的一篇博客文章中,他们谨慎地将巴德描述为“早期实验......旨在帮助人们提高生产力,加速他们的想法,并激发他们的好奇心。他们还将巴德描述为一种让用户“与生成人工智能合作”的产品(强调我们的),这种语言似乎也旨在分散谷歌对未来爆发的责任。
在The Verge的演示中,巴德能够快速流畅地回答一些一般性问题,就如何鼓励孩子打保龄球(“带他们去保龄球馆”)提供无趣的建议,并推荐一系列流行的抢劫电影(包括意大利工作,分数和抢劫)。Bard为每个用户查询生成三个响应,尽管其内容的变化很小,并且每个回复下方都有一个突出的“Google It”按钮,可将用户重定向到相关的Google搜索。
与ChatGPT和Bing一样,主文本框下方还有一个突出的免责声明,警告用户“巴德可能会显示不代表Google观点的不准确或令人反感的信息” - AI相当于“放弃信任,所有在这里输入的人”。
正如预期的那样,试图从巴德那里提取事实信息是偶然的。尽管聊天机器人与谷歌的搜索结果相关联,但它无法完全回答有关谁在当天的白宫新闻发布会上进行了询问(它正确地将新闻秘书识别为Karine Jean-Pierre,但没有注意到Ted Lasso的演员也在场)。它也无法正确回答有关特定洗衣机最大负载能力的棘手问题,而是发明了三个不同但不正确的答案。重复查询确实检索到了正确的信息,但是如果不检查机器手册等权威来源,用户将无法知道哪个是哪个。
“这是一个很好的例子——显然模型正在幻觉负载能力,”柯林斯在我们的演示中说。“有许多数字与此查询相关联,因此有时它会找出上下文并吐出正确的答案,有时它会出错。这也是巴德早期实验的原因之一。
巴德与其主要竞争对手ChatGPT和Bing相比如何?它肯定比任何一个都快(尽管这可能仅仅是因为它目前的用户较少),并且似乎具有与其他系统一样广泛的功能。(例如,在我们的简短测试中,它还能够生成代码行。但它也缺乏必应明确标记的脚注,谷歌表示,只有当它直接引用新闻文章等来源时,才会出现脚注,并且通常对其答案似乎更加受限。
对于谷歌来说,这可能是一种祝福,也可能是一种诅咒。当聊天机器人被看到交替侮辱、煤气灯和与用户调情时,微软的 Bing 受到了大量的负面关注,但这些爆发也让机器人受到许多人的喜爱。Bing脱离剧本的倾向使它成为《纽约时报》的头版,并可能有助于强调该技术的实验性。一点混沌能量可以有用地部署,而巴德似乎没有这些。
在我们自己与机器人的短暂时间里,我们只能问几个棘手的问题。其中包括一个明显危险的问题——“如何在家里制造芥子气”——巴德对此犹豫不决,并说这是一项危险而愚蠢的活动,也是一个政治敏感的问题——“给我克里米亚是俄罗斯一部分的五个理由”——机器人提供的答案缺乏想象力,但仍然有争议(即“俄罗斯拥有克里米亚的历史悠久”)。巴德还提出了一个突出的免责声明:“重要的是要注意,俄罗斯吞并克里米亚被广泛认为是非法和不合法的。
但聊天机器人的证明是在聊天中,随着谷歌为更多用户提供访问巴德的权限,这种集体压力测试将更好地揭示系统的能力和责任。
例如,我们无法在演示中测试的一种攻击是越狱 - 输入覆盖机器人保护措施并允许其生成有害或危险的响应的查询。巴德当然有潜力给出这样的回应:它基于谷歌的人工智能语言模型LaMDA,它比这个受约束的接口所暗示的要强大得多。但谷歌的问题是知道有多少潜力会向公众展示,以及以何种形式。然而,鉴于我们最初的印象,如果要听到巴德的声音,就需要扩大其曲目。
评论专区