close
正在加载
让「郭德纲」说英语相声,HeyGen 的视频生意不好做
互联网 · 2023-11-09 10:41:26
币界网报道:
「AI 孙燕姿」显示了 AI 仿声的能力,妙鸭相机展示了 AI 处理图片的技艺,HeyGen 用则用「英语相声」呈现了 AI 的多语言能力。


撰文:木沐


听郭德纲的新相声了吗?飙英语的那种。

 

最近,一段「郭德纲用英语说相声」的视频在社交平台传疯了。视频中,老郭用自己声音说的英语不仅发音准确,嘴型自然,语法错误都少。

 

实际上,这段视频又是 AI 技术参与的二创作品,这个「没有翻译腔的真正翻译」作品被网友怒赞,不少人觉得,即使是真人配音也无法达到这样传神的效果。

 

深扒一下发现,这段爆款视频的背后有一家名叫诗云科技的中国公司,他们的产品 HeyGen 就是把郭德纲相声中译英的「神器」,AI 翻译仿声打得其实是视频制作生意的算盘。

 

如果说「AI 孙燕姿」显示了 AI 仿声的能力,妙鸭相机展示了 AI 处理图片的技艺,HeyGen 用则用「英语相声」呈现了 AI 的多语言能力。

 

过去以高端示人的人工智能,正在以人民群众喜闻乐见的方式走进大众视野。娱乐过后,「AI 孙燕姿」的话题降温,妙鸭相机也因非高频、刚需而昙花一现,HeyGen 又如何不步后尘?它的出现真的能直击视频制作的痛点吗?


AI 仿声再进化 能说外语了


今年 10 月, 「郭德纲说英语相声」的视频在全网火了,B 站浏览量达到几百万,并迅速带动 UP 主们创作名人说外语的反差视频。

 

于是,老郭不但能说英语相声,还能用英语访问本山大叔,对方也是说的英语,访谈节目一下变得 International(国际化)起来;而「于谦大爷」也能唱英语 Rap 了,「泰勒·斯威夫特」和「艾玛·沃森」甚至在访谈节目中用中文对答如流。

 

这可不是给人物配外语字幕或译制片一样的配音,而是真正让人物操上了一口流利的外语,不仅声音神似本人,连在嘴型都能对上,这样的视频在海外视频平台也火了。

 

爆火的翻译配音视频背后是 AI 工具 HeyGen 在发挥作用,即展现了 AI 对语言翻译的能力,也再次炫技了 AI 仿声,效果被网友怒赞。

 

在排队等待 7000 个视频后,网友@Gorden Sun 在 HeyGen 上只上传了一段原素材就制作出了霉霉说中文的视频,「效果绝对目前最好,没有之一,」他也表示,「声音克隆稍有缺陷」、「情感还原度稍有欠缺」。从他的体验感受看,属于瑕不掩瑜了。

 

网友排队 7000 个视频,生成霉霉说中文视频


借助 HeyGen 工具,用户只需上传视频,选择语言,就能自动翻译,调整音色,生成嘴型匹配的外语视频。

 

很快,一大批 AI 翻译仿声的有趣视频就此出现,很多视频的观看量都破百万,HeyGen 也因此大圈了一波流量,最火爆的时候,生成一段视频,前面排队的都有几万个。比前段时间人们用妙鸭相机生成写真照片的时间都长了去了。

 

值得注意的是,HeyGen 背后是一家名为诗云科技的中国公司, 2020 年 11 月成立,该公司官网显示,其产品除了 AI 翻译仿声,还有 AI 数字头像生成、AI 脚本生成等服务。

 

天眼查显示,诗云科技已完成两轮数百万美元融资。其中 2021 年 3 月,诗云科技获得红杉中国种子基金和真格基金的天使轮投资;同年 8 月,又获得数百万美元 Pre-A 轮融资,由 IDG 资本领投,红杉中国和真格跟投。 

 

据悉,HeyGen 的目标是要做到 AI 视频创作领域的 Midjourney。目前,它背后的团队团队大概 30 人。尽管 HeyGen 尚未达到 Midjourney 的用户体量,但也成功成为了国内市场上继「妙鸭相机」之后最新的一款爆款 AI 应用。

 

根据社交平台 X 上一位网友的统计,今年 8-9 月,各大文生图、文生视频类 AI 网站的访问量均开始呈现下降趋势,但 HeyGen 的访问量实现了逆势上涨,上升高达 92%。

 

HeyGen 的访问量逆势上涨

 

创始人 Joshua Xu 曾透露,HeyGen 产品正式上线后,在 7 个月内实现了 100 万美元的 ARR(年度经常性收入),并保持连续 9 个月 50% 的月环比增长率。


推出付费版 击中视频创作者痛点了吗?


访问量持续上升,HeyGen 这样的态势还能保持多久?这与它是否能切中视频制作的痛点有关。

 

AI 生成写真的「妙鸭相机」一度被誉为「能暴打海马体」。而如今,海马体活得好好的,以小程序形态面市的妙鸭相机,流量指标经历了约 3 个月的短暂高峰后出现断崖式下跌。微信指数显示,目前「妙鸭相机」的指数趋势已经回到爆火前的水平。

 

「妙鸭相机」的火爆昙花一现


以「写真」走红的妙鸭相机走不长,是因为面向 C 端的写真照片并不是普通大众高频且刚需的场景,尽管也需要付费,但妙鸭相机没能在写真之外创造更多的功能,用户的付费意愿大大降低,用完即丢也就成了必然命运。

 

HeyGen 也是因大众在短视频娱乐中再次发现了 AI 的亮点而走红,进而进入了视频创作者的工具库里。但这个工具真的能直击视频创作者的痛点吗?

 

在知乎、抖音上,不少视频博主们分享过视频制作的真实痛点。爆款视频的背后是脚本创作、拍摄、后期剪辑等制作环节的高成本投入,AI 生产力的确能解决成本问题,但创意仍需要人类发挥。

 

目前,HeyGen 主要提供四项功能,可以用 AI 视频工具制作各种用途的视频,比如产品营销、内容营销、销售推广、学习培训等;用户可以使用平台自带数字人形象、真实形象或 AI 绘画形象,让人物说不同语言。目前,HeyGen 支持 40 多种语言。

 

可以看出,HeyGen 在尽力引导产品扩展视频创作的应用场景,但似乎并不是要解决视频创作者的痛点,更多是利用 AI 的仿声翻译能力让视频内容跨国、跨地域传播。

 

目前,HeyGen 推出了免费版和付费版两种版本。付费版最便宜的需要每月 24 美元,未来将逐步开放 API 接口、团队协作和企业功能。 而免费版仅限于生成 1 分钟时长视频,且生成需要排队等待很长时间。

 

很明显,HeyGen 的盈利来源主要在 B 端。10 月底,商业版本上市,新功能包括可以生成长达 3 小时的内容; 画质最高提升至 4K; 能帮助用户制作 PPT;可以文本转视频,支持音频上传、视频分享等。商业版 HeyGen 可以满足广告、电商、新闻等行业各种需求。

 

升级后到的 HeyGen 仍然重场景,回避了视频制作者在创作环节上的刚需。

 

而在视频制作场景中,AI 工具依然不少,几乎都冲着制作环节而去。例如能直接将脚本转化成视频的 Pictory.AI,可以实现 AI 语音、匹配素材与音乐的功能;腾讯智影、一帧秒创、万彩微影这些应用也利用了 AI 技术来简化视频创作过程,并提供了文本配音、文章转视频、数字人播报等功能。

 

但所有做视频生意的 AI 工具都绕不过版权问题,而这个问题是最令视频创作们瑟瑟发抖的困境之一。技艺从 AI 仿声进化到译制的 HeyGen 也不能解决版权问题,难题还是抛给了视频制作者。

 

当前,HeyGen 被广泛应用于短视频的二次创作,比如 AI 换声等。 对此,有律师表示,用 AI 技术为他人更换声音、做「翻译」并发布视频,可能涉嫌著作权、肖像权、声音权三个方面的侵权。比如,相声、小品等都属于《中华人民共和国著作权法》保护的「作品」。网友用 AI 软件将相声、小品等「翻译」成其他语言,需经过著作权人授权,否则就存在侵权问题。

 

此外,网友用他人形象制作视频,并在网站发布,需要取得肖像权人的同意,否则涉嫌侵权。最后是声音权,根据《中华人民共和国民法典》规定,对自然人声音的保护,参照适用肖像权保护的有关规定。也就是说,需要取得声音权人的同意,才能够使用他人的声音。

 

从去年年底至今,由 ChatGPT 打开的 AI 魔盒仍在不断展现新魔法,人类似乎拿到了人工智能的车票,但顺利搭上这列提升生产力的高速列车,似乎还得等很久。

s_logo
App内打开