编程学习网 > IT圈内 > 正在赶超谷歌和ChatGPT的是……?
2023
05-18

正在赶超谷歌和ChatGPT的是……?


年2月,Meta为学术界提供了能够理解会话语言的复杂机器学习模型,引发了人工智能发展的大爆发。几周之内,学者们就把这些模型变成了开源软件,为ChatGPT和其他专有人工智能软件的免费替代品提供了动力。

加州大学伯克利分校(University of California, Berkeley)计算机科学教授Ion Stoica表示,免费的人工智能模型现在在性能上“相当接近”谷歌和ChatGPT开发商OpenAI的专有模型,大多数软件开发人员最终将选择使用免费的模型。Stoica利用Meta的技术帮助开发了一个关键的开源人工智能模型。

如果Stoica是对的,开源AI可能会颠覆谷歌、OpenAI、微软(Microsoft)和其他出售专有模型使用权的公司的商业计划。相反,强大的人工智能工具可以让任何人以很小的成本使用,Meta也可以获得回报。

Stoica是利用Meta的研究开发Vicuna的学者之一,Vicuna是三月份发布的开源语言理解模型。Vicuna通过一个网站使用ChatGPT的数据,人们在这个网站上发布他们与OpenAI聊天机器人的对话。尽管如此,Vicuna的质量和开源人工智能的迅速发展促使谷歌高级工程师Luke Sernau警告同事,他们的公司在努力追赶OpenAI的过程中,专注于专有软件,可能会落后。

“如果有一个免费的、高质量的、没有使用限制的替代产品,谁会为一个有使用限制的谷歌产品付费?”Sernau在一份内部备忘录中写道。他写道,开源人工智能的发展正在“击败我们”,并补充说,“谷歌应该确立自己在开源社区的领导者地位”,并“放弃对我们模型的一些控制”。

这份备忘录引起了整个行业的共鸣,包括谷歌的一些员工,尽管它的论点可能夸大了开源人工智能的能力,低估了它的成本和其他风险。但大多数人工智能从业者都同意备忘录的结论之一,即Meta将从发布其模型中获益。Meta在内部使用AI模型进行内容推荐和广告定位。随着开发人员改进Meta发布的模型,Meta将能够将这些改进整合到其内部AI中。

今年4月,Meta首席执行官Mark Zuckerberg在与分析师的电话会议上被问及公司的战略时表示:“如果行业对我们正在使用的基本工具进行标准化,那就更好了,这样我们就可以从其他人的改进中受益。”

Meta发布的这些模型统称为LLaMA,不能合法地用于商业目的。但是,与Stoica一起开发Vicuna的伯克利大学研究生Lianmin Zheng说,Meta为研究人员提供了足够的信息,可以复制该模型用于商业应用。

谷歌并没有对人工智能软件采取完全专有的方法。早在ChatGPT出现之前的2020年,它就发布了一个开源语言模型T5,使开发人员能够构建可以完成翻译和摘要等任务的软件。它随后发布了一个更高级的版本,Flan-T5。但据斯托伊卡和其他从业人员说,Meta发布的软件使谷歌的模型得到了重大改进,这使得工程师们更有可能选择基于Meta软件的模型。

OpenAI的开源模型

谷歌在开源人工智能领域发挥更大作用的压力可能会因为另一个原因而增加。据一位知情人士透露,微软在人工智能领域的主要竞争对手OpenAI正准备向公众发布一种新的开源语言模型,该计划此前从未被报道过。目前尚不清楚OpenAI即将推出的开源软件是否会抢走Vicuna或其他使用Meta模型开发的软件的风头。但它不太可能发布一款能与它正在销售的专有机型GPT竞争的机型。尽管GPT的前两个版本是开源的,但该公司270亿美元的私人估值取决于未来最复杂的商业人工智能不是开源的。

OpenAI发言人没有回应置评请求。

像Vicuna这样的开源模型只需几百美元的培训费用,这让用户可以选择避免向软件提供商支付昂贵的费用。相比之下,谷歌、OpenAI和微软一直在出售对其专有模型的访问权,企业可以将这些模型用于一系列目的,包括自动化客户服务、总结医学研究或生成营销文案。去年,微软开始出售OpenAI开发模型的使用权,并向OpenAI投资了数十亿美元,而谷歌和亚马逊今年也开始向外部开发者出售自己的模型。

但最近几周,开源替代品激增。除了基于Meta软件的Vicuna等模型外,工程师还可以从德国非营利组织LAION以及Databricks和Stability AI等初创公司中选择其他模型。Stoica创建了一个网站,试图衡量那些开源模型与专有模型(如OpenAI的GPT-4)的质量。

Stoica是Databricks的联合创始人之一,该公司销售帮助数据科学家使用人工智能的软件。


与开源软件相比,谷歌仍然有两个优势,Stoica说。他说,如果谷歌利用其用户数据宝库(外部人员无法访问),它的模型可能会在内容推荐等一些特殊用途上表现得更好。(谷歌发言人表示,该公司并未在现有用户数据上训练其“基础”人工智能模型。)Stoica还表示,这家搜索公司在管理大型计算机基础设施方面的专长意味着,它将能够以更低的成本运行人工智能软件模型,包括为其云客户运行。谷歌上周宣布了一系列对Bard专有模式的改进,这是它对ChatGPT的回应。

与此同时,OpenAI在收集数百万人与ChatGPT互动方式的数据方面处于领先地位,这无疑有助于它改进人工智能软件,而且这家初创公司与微软达成了一项私下协议,可以使用微软的计算基础设施。

但开源人工智能软件将允许更多公司使用专有数据自行解决问题。Stoica说,例如,一家航空公司可以利用其数百万个客户服务电话的记录来创建自动响应。彭博社在3月份表示,它利用自己的数据来训练一个机器学习模型,该模型能更好地理解金融信息。根据开发人员运行的Discord服务器上的消息,工程师们一直在尝试用Vicuna进行创意写作和编程。

Stoica说,为了提高Vicuna的能力,Stoica和他的同事们正在努力增加其模型中的计算次数,这将有助于它完成涉及推理的任务,比如编写代码。开发Vicuna的小组是伯克利天空计算实验室(Sky Computing Lab)的一个分支,该实验室每年的预算为数百万美元,其中大约50万美元来自微软、谷歌和亚马逊等上市公司。

开源AI软件之前曾挫败过OpenAI的雄心。OpenAI通过发布和出售DALL·E 2的访问权限,抓住了互联网的想象力,当人们输入他们想要看到的东西的简单文字描述时,DALL·E 2就会产生原始图像,一个开源的替代品,稳定扩散,突然出现在人们的视野中。Stable Diffusion的突然崛起让人工智能界的许多人感到惊讶,包括OpenAI的员工。DALL·E 2并没有成为一个庞然大物。

Stoica说:“我看不出有什么理由不让大型语言模型遵循同样的模式。”

以上就是正在赶超谷歌和ChatGPT的是……?”的详细内容,想要了解更多IT圈内资讯欢迎持续关注编程学习网。

扫码二维码 获取免费视频学习资料

Python编程学习

查 看2022高级编程视频教程免费获取