Google Gemini 模型训练数据远超 ChatGPT
OpenAI 的 ChatGPT 及其背后运算的 GPT 模型,在全球 AI 竞赛处于领先地位,地位恐怕无法持续下去,最具挑战是 Google Gemini 模型于今年秋季现身
OpenAI 的 ChatGPT 及其背后运算的 GPT 模型,目前在全球 AI 竞赛处于领先地位,这要归功于领先竞争对手推出 ChatGPT 这种大众有感的 AI 服务,加上微软数据中心和云端基础设施的支持。
不过,ChatGPT 地位恐怕无法永远持续下去,因为更新、更强大的 AI 模型不断出现,其中最具代表性的挑战者是 Google Gemini 模型最快在今年秋季现身。
新一代基础模型 Gemini 已在今年 I/O 大会由 Google 董事长 Sundar Pichai 率先公开,采取多模态(multimodal),能有效率整合其他工具、API。根据国外媒体 The Information 近日报导,Gemini 最快在秋季推出。
Gemini 可望取代 PaLM 2 模型,支持现有的对话式 Bard AI 以及 Google 文件、Excel、简报等企业应用。Google DeepMind 科学家纪怀新透露,未来 Bard 将会移植至 Gemini。
另一外媒 WIRED 6 月份报导则指出,Gemini 采用 AlphaGo 为基础的革命性技术加以训练。DeepMind 的 AlphaGo 是第一个在复杂的围棋比赛击败世界级职业棋士的 AI 系统,可帮助建构 Gemini 规划策略和解决问题的能力。
Google DeepMind 主导开发 Gemini
今年 4 月,Alphabet 旗下 2 大研究团队 DeepMind 和 Google Brain 克服多年竞争关系,整并成全新部门 Google DeepMind,由 DeepMind 创办人 Demis Hassabis 担任负责人。
皮蔡此一出人意料的合并举动,目的在于提升 AI 研发效率,将 Google 运算资源和2 个团队研究能量结合在一起,我们即将见证 Gemini 诞生。
值得一提的是,近年未参与公司经营的 Google 共同创办人布林(Sergey Brin),传为 Gemini 这项产品重回第一线,每星期 3~4 天会进办公室与研究团队一起工作。
在此之前,2 个研究团队皆对 ChatGPT 这项产品做出回应,DeepMind 着手展开Goodall 专案,Google 则以 Google Brain 的模型为基础推出 Bard。尽管两者之间相互竞争,DeepMind 最终决定放弃 Goodall 专案,转而与 Google Brain 合作开发Gemini。
Gemini 训练数据量超过 GPT-4
Gemini 之所以成为 ChatGPT 及背后 GPT-4 强大的竞争对手,是因为 Google 拥有大量资源,尤其是可用于训练 AI 模型的数据。
Google 在 YouTube 视频、Google 图书、Google 学术搜索以及搜寻引擎产生的庞大结果,大部分训练资料是 Google 独有的,加上构建和训练大语言模型方面拥有深厚的人才资源和多年经验,Google 比其他公司更具优势。
据悉 Gemini 将是 Google 第一个能够处理文字以及图片、视频等不同数据形式的多模态模型,换句话说,它不仅能以对话方式理解、产生文字内容,对于图片和视频的内容输入也能理解,这点与 ChatGPT 有很大的不同。
The Information 报导谈到,Gemini 接受训练的 token 量相当于 GPT-4 的两倍,使它的处理和反应更睿智。
Alphabet 旗下团队强强联手,组成 Google DeepMind 整合技术和资源,相信已给OpenAI 和其他竞争对手带来不小的压力,外界也正期待 Gemini 模型如何为对话式AI 及其它 Google 服务带来升级进化。