首页 Metaverse Google发布多模态AI模型Gemini
Google发布多模态AI模型Gemini

Google发布多模态AI模型Gemini

  北京时间2023年12月7日凌晨,Google公司发布了其最新的名为Gemini的人工智能模型。一些媒体认为,Gemini的发布是希望能够重振Google的人工智能对话助手Bard的命运。在此之前,Bard的表现乏善可陈,未能达到预期的效果。

  在今年早些时候,Google发布了Bard,这被很多人看作是Google对OpenAI的ChatGPT的回应。然而,用户很快发现Bard的回答是有限的,不准确也容易出错。这在社交媒体上引发了广泛的嘲笑,人们认为Bard的能力低于竞争对手。

  然而,Google现在正在将Gemini人工智能模型集成到Bard中,以解决其中的许多缺陷。Google公司声称,在几个基准测试中,Gemini的表现优于GPT-3.5等人工智能模型,尤其是在理解和推理方面。

  Gemini还有一款名为Gemini Nano的轻量级版本,可以在安卓设备上本机和离线运行。以及一个版本叫做Gemini Pro,它将很快为许多Google人工智能服务提供支持。还有一款功能更强大的名为Gemini Ultra的模型,它是Google迄今为止创建的最强大的大语言模型,主要是为数据中心和企业应用程序设计的。

  Google的此次升级将分两个阶段进行。首先,Google已经对Gemini Pro版本进行了专门的调整,以提高Bard的会话技能。这将提高Bard理解问题的能力,并提供相关的、细致入微的答案。这个更新从今天开始就可以使用。然后,在明年初,Bard将获得Google迄今为止最大、最先进的人工智能项目Gemini Ultra的使用权。

  据报道,Bard现在由Gemini Pro提供支持,而Pixel 8 Pro手机用户将获得Gemini Nano的一些新功能。从12月13日开始,开发者和企业客户将可以通过Google Generative AI Studio或Google Cloud中的Vertex AI访问Gemini Pro。Gemini目前只有英语版本,其他语言版本很快就会推出。但Google公司首席执行官Sundar Pichai表示,Gemini模型最终将被整合到Google的搜索引擎、广告产品、Chrome浏览器等产品中,并在全球范围内推广。

  和同行竞品相比,Gemini最明显的优势来自于它理解视频和音频并与之互动的能力。多模态从一开始就是Gemini计划的一部分。Google没有像OpenAI创建DALL-E和Whisper那样,为图像和语音分别训练模型。Google从一开始就建立了一个多模态模型。Google DeepMind的首席执行官Demis Hassabis表示,我们一直对非常非常通用的系统感兴趣。他对如何混合所有这些模式特别感兴趣,从任意数量的输入和感官中收集尽可能多的数据,然后给出尽可能多的响应。

  目前,Gemini最基本的模型是文本输入和文本输出,但更强大的模型,如Gemini Ultra,可以处理图像、视频和音频。Demis Hassabis表示,它将变得更加普遍。还有动作和触觉之类的东西,更像是机器人类型的东西。随着时间的推移,Gemini会有更多的感官,变得更有意识,在这个过程中变得更准确和更扎实。这些模型只是对它们周围的世界有了更好的了解。当然,这些模型仍然会产生幻觉,它们仍然存在偏见和其他问题。但它们(模型)知道的越多,它们就会做得越好。

  Google似乎特别将编码视为Gemini的杀手级应用。它使用了一种名为AlphaCode 2的新的代码生成系统,Google公司表示,该系统的表现优于85%的编码比赛参与者,而最初的AlphaCode只有50%。对Google同样重要的是,Gemini显然是一种效率高得多的模式。它是在Google自己的Tensor Processing Units上进行训练的。与Google之前的PaLM等模型相比,它的运行速度更快,成本更低。此外,Google还推出了其TPU系统的新版本TPU v5p,这是一款专为数据中心训练和运行大型模型而设计的计算系统。

  Google可能感到了迅速对Bard进行改造升级的压力,因为它最初的人工智能模型显然与ChatGPT等聊天机器人相比相形见绌。早期的用户评论将Bard描述为有故障且能力有限,损害了Google在人工智能领域的声誉。通过升级到Gemini,Google的目标是挽回Bard,并证明自己可以在生成式人工智能领域竞争。

  然而,风险依然存在。像所有大语言模型一样,Gemini有传播错误信息和内容的可能性。Google公司声称正在彻底审核Gemini,但监控人工智能的安全性仍然具有挑战性。

  不过,如果Gemini能够像承诺的那样改造Bard,Google可能会在与人工智能竞争对手的竞争中收复失地。随着生成式人工智能的快速发展,争夺领导权的竞争仍然十分激烈。目前,Google正把宝押在Gemini身上,希望它能让Bard重新成为一款有竞争力的产品。

延伸阅读:

Powered by Froala Editor