2018 年,世界开始谈论 Deepfake,我就觉得好像有商业化的潜力。Rask AI 创办人Maria Chmir 回顾 Deepfake 引起自身好奇心的原因。

Rask AI 是一款 AI 视频语音翻译服务,可以直接将一部视频翻译为六十多种语言,还能让影片中的人物变换嘴型、调整口音。举例来说,任何讲中文的影片创作者,都可以轻松使用 Rask AI,让影片中的人看起来就像是真的在讲英文,而非仅是翻译。Rask AI 的客户包含环球音乐等。

通过 Rask AI 的 Deepfake 技术,基本演讲、线上课程、企业培训都不必再请翻译,可以直接发布于全球市场。但事实上,Maria Chmir 最初踏入这一行的原因,是为了拯救公司财务危机。

为了拯救图片搜索引擎 Everypixel 资金危机

Maria Chmir 硕士原就读广告系,毕业后便理所当然地进入广告公司工作,负责为公司开拓客源、经营与合作厂商的关系,2 年后被挖角至图片搜寻引擎 Everypixel 担任产品经理,也无意间开启认识 Deepfake 技术的大门。

2017 年,Everypixel 开发 AI 技术,帮助使用者在各个图库平台搜索,而且能自动筛掉画质差、构图不佳的图片,即使产品对于消费者来说十分方便,也被各大媒体报导,却遇到一个棘手问题:无法赚钱。

公司想到两个解决方案:增加广告服务、向投资人募资。前者需要增加大量平台流量,才能吸引企业购买广告版位。后者则是因 Everypixel 从来没有与投资人打交道的经验,成功机率较微小。

最后,Everypixel 并没有选择其中任何一个方案,而是将希望放在第三个选择:AI 视频识别服务。

Everypixel 内部当时正发展一套功能,帮助使用者在上传完照片后,为照片贴上标签、自动新增文字描述,希望能够借此获利,最终还是失败收场。

当时刚上任销售经理 Maria Chmir 就思考究竟是哪个环节出了问题?

她发现 Everypixel 无法盈利的原因,是因为没有用消费者的角度来看待产品,缺乏和消费者近距离互动、沟通,因此无法察觉消费者的根本需求,这是一个蒙眼的行业:你不会知道今天要制作哪些内容,也不会知道产品会被哪些消费者购买。

正好在 2018 年,也是 Deepfake 技术越趋发达期间,Maria Chmir 看到了比利时社会民主党透过 Deepfake 技术制作的一段假川普影片,第一时间便想到这技术是否能为公司赚钱、商业化应用,于是针对 Everypixel 的另一项 AI 换脸工具 Reflect 寻找客户,联系过往在广告业培养的人脉,而这次总算成功,为公司增加许多收入。

眼见 Everypixel 终于开始赚钱,公司高层决定重点发展 Deepfake 技术,为此成立一间新公司 Dowell,并让 Maria Chmir 兼任创办人暨董事长的角色,专门为影视产业提供服务。

过了一年多的时间,Dowell 走上正轨的同时,Maria Chmir 的野心也越来越大,认为Deepfake 具有更多可能性,促使她决定跳出来成立 Rask AI。

将 Rask AI 定位为教育科技

Rask AI 是一个影片语音翻译 SaaS 服务,如同 Maria Chmir 的愿景,该服务全自动化,使用者只要把视频上传、选择指定语言,就能把视频自动翻译为六十多国语言,而人物的嘴型、口音也会随之而变。

目前分为2种费用方案,分别是基本版(每月49美元)和进阶版(每月119美元),前者可翻译 25 分钟、后者有 100 分钟的时间,如果视频时间较长,则每多 1 分钟增加 1 美元。

有趣的是,Maria Chmir 将公司定位为教育科技,期望通过 Deepfake 技术的力量扩大世界上所有内容的影响力,我们正在打破语言障碍,使人们能够学习新事物,或以母语观看他们最喜欢的YouTuber。

Rask AI 的应用场景也不局限于视频产业里,而是更加广泛,例如帮助 YouTuber、线上课程和国际企业的员工培训课程翻译,也正呼应 Maria Chmir 多年前学到的教训:始终以消费者的角度打造产品。

即使 Deepfake 技术得以让历史人物复活,她也补充 Deepfake 技术 3 大发展挑战,第一,无法得知人物过去的习惯行为、动作、情绪,我们明白我们的观众往往不想创造某个英雄的外表,而是想要现人物的性格、本质、思维、言谈举止、情感。

第二,光线容易影响 Deepfake 换脸技术的完整度,例如在很暗的环境下,就难以实现换脸技术;最后,则是容易吃官司,因此需要特别注意图像的使用权限。