myfreax

SemiAnalysis 称 Google Gemini 模型远胜 GPT-4

半导体研究和顾问公司 SemiAnalysis 日前发表文章,认为 Gemini 模型似乎准备好运用强大的算力,来与 OpenAI 的 GPT-4 模型一较高下

3 min read
By myfreax
SemiAnalysis 称 Google Gemini 模型远胜 GPT-4
SemiAnalysis 称 Google Gemini 模型远胜 GPT-4

Gemini 是 Google DeepMind 团队紧锣密鼓开发的下一代 AI 模型,据悉是 Google 第一个能够处理文字、图片、视频等不同数据形式的多模态模型。

预期今年稍晚发表,最快将在秋季揭晓。半导体研究和顾问公司 SemiAnalysis 日前发表文章,认为 Gemini 模型似乎准备好运用强大的算力,来与 OpenAI 的 GPT-4 模型一较高下。

面对 ChatGPT 及其背后的 GPT 系列模型掀起全球生成式 AI 浪潮,Google 这个沉睡的巨人终于醒过来,正以一定的速度加紧产品迭代,SemiAnalysis 称 Google 今年底预训练模型的每秒浮点运算次数( FLOPS)可望有超越 GPT-4 五倍的表现,且到明年底之前,AI 产品蓝图将会越来越清晰。

SemiAnalysis 甚至提出一套 GPU-Rich 和 GPU-Poor 的论点,引起业界人士的激烈争论。

拥有强大的 AI 算力通常意味着掌握许多高阶运算芯片,世界上仅少数公司拥有超过2 万个 NVIDIA A100 / H100 GPU,包括 OpenAI、Google、Anthropic、Inflection、X、Meta,其研究人员手上的案例能够使用约 100 个至 1,000 个 GPU,相较其他公司拥有更多的运算资源,这几家公司就是 SemiAnalysis 所称的 GPU-Rich,尤其点名Google 拥有许多 GPU 和庞大算力,有助于推动 Gemini 模型。

另一方面,有些新创公司和开源开发者正努力使用更少的 GPU 开发 AI 产品,SemiAnalysis 认为他们花费大量时间和精力试图做一些根本无关紧要的事,比方说,许多研究人员花无数个小时微调没有足够 VRAM 的模型。使用 GPU 的效率相当重要,这些 GPU-Poor 却忽略这一点。

如今美国、中国在全球 AI 竞赛可望持续领先,许多中东国家正在扩大投资基础设施,为发展AI 急起直追。

相较之下,SemiAnalysis 认为欧洲新创公司和政府支持的超级电脑计划较无竞争力,因为对算力缺乏大规模投资,选择当个 GPU-Poor,还点名几家 AI 公司如Hugging Face、Databricks、Together 也是 GPU-Poor 的一分子,尽管他们拥有世界一流的研究人员,仍受限于系统算力。

SemiAnalysis 的论点加上吹捧 Gemini 模型,让 OpenAI 董事长 Sam Altman 很不是滋味,甚至发推嘲讽 Google 竟让 SemiAnalysis 发布他们内部销售招聘图表。SemiAnalysis 则称相关数据是从 Google 供应商取得的。

incredible google got that semianalysis guy to publish their internal marketing/recruiting chart lol

— Sam Altman (@sama) August 29, 2023

ChatGPT 一炮而红,用户心目中占有一席之地,其他公司也纷纷加入大型语言模型的竞争,像是 Meta 的 Llama 2 模型。

Google 的 Gemini 模型则来势汹汹,急欲挑战 OpenAI 主导的地位,2023 年末的 AI  大战将为未来发展产生长远影响。可以肯定的是,大型语言模型推动的 AI 服务,将以各种方式越来越融入生活、工作当中,未来带来便利、效率。