谷歌云平台(GCP)、亚马逊云科技(AWS)和微软Azure争夺市场主导地位的前线战场已在很大程度上从云转向生成式人工智能(GenAI),每家都在寻求为越来越多的用户案例和设备提供新的大型语言模型(LLM)。

研究公司Omdia将GCP评为在尖端AI技术上的领导者,同时在价格和运营效率方面更青睐AWS。

与此同时,微软通过数十亿美元投资先锋OpenAI建立了早期的领导地位,据研究公司称,该公司正在转向自定义芯片。

在近期举办的谷歌I/O大会上,首席执行官桑达尔·皮查伊表示,公司已经在AI领域投资了10多年,Omdia指出,这在进行基础研究方面具有优势。

值得注意的是,生成式人工智能(GenAI)是AI的一个子集。Radio Free Mobile Richard Windsor博士将GenAI定义为“能够生成文字、图像和视频的AI。”

数字

跟踪每家大型云提供商与AI相关的收入数据不是很透明,但是亚马逊的首席执行官Andy Jassy曾在公司2024年第一季度财报电话会议上表示,AWS已经“积累了数十亿美元的收入运行率。”

AWS的收入同比增长了17%,达到250亿美元,其首席财务官Brian Olsavsky 指出,在GenAI和非GenAI工作负载方面显示强劲需求。他表示,客户正在签署更长期的交易并做出更大的承诺。

Jassy指出,随着企业用户正在将其注意力转向新计划,例如在AWS的架构上运行GenAI服务,云成本优化计划已经基本完成。

谷歌云服务收入在第一季度上涨28%,达到95亿美元,得益于对依赖云架构、服务和应用程序的GenAI工具的需求。皮查伊表示,公司正朝着“通过广告、云以及订阅实现AI盈利(货币化)的清晰路径”迈进。

微软首席执行官桑达尔·纳德拉表示,包括Azure在内的第三季度的云服务收入超过350亿美元,增长了23%。他指出,超过1亿美元的Azure交易增长了80%以上,金额在1000万美元之上的交易数量增加了一倍多。

Synergy研究集团认为,GenAI的影响使企业第一季度在云架构服务的支出超过760亿美元,比一年前增长了21%。

Canalys副总裁Alex Smith指出,云服务供应商正在将AI嵌入到他们的产品和服务中,使融合“不是新奇,而是常态”。

现场障碍

AvidThink的创始人兼负责任Roy Chua告诉Mobile World Live现在宣布三家巨头中的GenAI赢家为时过早。他指出,虽然AWS、GCP和微软正在努力推动AI战线,“每家都有不同但重合的战略”。

他解释道,在处理GenAI方面有很多相似之处,例如采用开源模型,为开放和封闭模型提供模型花园和库,并为各种用例预训练不同规模的基础模型(FMs)。

三家公司还提供AI开发平台和管道,用于训练、微调和构建GenAI,以及AI驱动的应用程序。

“他们还试图将云资产和数据放在云存储中,并构建和设计更好的芯片以提高性能和效率,”Chua说道,“但是差异化体现在他们已经建立的关系上,以及对基础模型、芯片和管道方面的投资规模上。”

除了谷歌的内部AI能力,Chua指出,它还以公司的Gemini系列形式构建自己的基础模型,并且继续在谷歌DeepMind等其他项目上投资。

他表示,虽然微软已经在OpenAI上投入巨大,但这家科技巨头也在自己并行创新,包括聘请Inflection AI和谷歌DeepMind联合创始人Mustafa Suleyman领导其AI消费者小组。

Chua说,微软与其他基础模型提供商如Mistral和开源模型如Meta平台的Llama,或阿布扎比技术创新学院的Falcon采用对冲策略。

“他们最近还展示和开源了一些非常骄人的模型,如Phi-3,”,他指出,“特别是Phi-3 mini,尽管它的尺寸相对较小,但是具有显著的性能。”

同样,他指出AWS对Anthropic进行了重大投资,许多首屈一指的用例都涉及Anthropic的Claude模型。

同时,他解释说,AWS的Bedrock基础模型推动多重专属和开源模型,以及一种与模型无关的方法。它专注在AWS云的工作负载、平台以及数据功能,用于训练、微调和模型使用。

Chua指出,“AWS还在构建增强功能,围绕其AI管道提供函数调用和护栏机制。”

最重要的是,他表示,AWS强调其用于AI工作负载的Trainium和Inferentia芯片的自定义芯片,成本和性能进一步改善,并有更好的能效。

Chua告诉Mobile World Live,有传言称AWS内部在训练一种代号为Olympus的新基础模型。

热门趋势

Omdia表示,超大规模企业是大多数AI行业计算服务的重要供应商,是那些在建立模型推理基础架构以服务客户的第一联系人。

Jassy指出,虽然目前重点是训练AI模型,但一旦这些模型投入生产,收益将转向干扰AI模型。

“你在推理上花费的时间比在训练上花费的要多得多,因为你训练只是周期性的,但是你一直都要进行预测和推理,”他说,“我们还看到相当多的公司正在构建他们自己的生成式AI应用程序,以便在AWS之上进行推理。”

虽然Omdia预测推理将占全部AI计算需求越来越大的份额,但它指出谷歌和微软在CPU推理方面远远落后于AWS.

从单体大型语言模型(LLMs)过渡到自定义模型的举措也在进行中。

Gartner预测,到2027年,企业使用的GenAI模型中将有超过50%特别用于行业或者业务功能,高于2023年的约1%。

泡沫破灭?

Radio Free的Windsor在一份研究报告中表示,因果关系是迄今为止GenAI最大的局限性, “因为这些模型对它们在做的事情没有因果理解。”

他指出,这种缺乏理解导致LLM捏造事实,犯简单的错误并且仍然“这样做而不自知”。

Windsor解释道,“毫无疑问,估值和期望值太高。”

他指出,洪水般资本涌入GenAI是由大众强烈兴奋而驱动的,但是绝大多数LLM在性能方面大致相当,“这意味着竞争和价格下跌”。

他预测,所有这些都将“触发对现实的重置”。