作者|顾彦
2021年,元宇宙概念开始流行,数字人市场持续升温。

去年10月,虚拟美妆专家刘在上传了自己的第一部作品,一夜之间涨了百万;年底,出道9年的洛天依登上春晚舞台,与月亮姐姐、罗伊一起表演了儿童歌舞《听我说》。今年5月,虚拟偶像Vox宣布落户哔哩哔哩,首日直播收入突破百万...
《虚拟数字人深度行业报告》显示,预计到2030年,中国虚拟人整体市场规模将达到2700亿元。
数字人可以追溯到2007年,在语音合成程序基础上开发的音源库“初音未来”成为第一个现象级虚拟偶像。
一段时间后,虚拟数字人也作为二次形象出现。2D“纸人”是1.0阶段数字人的代表。
2016年6月,人工智能绊爱“唤醒了自己”。她是YouTube上的虚拟主播。如今,虚拟主播热潮席卷全球。
艾媒咨询发布的《2021年中国虚拟偶像产业发展及网民调查报告》显示,2020年中国虚拟偶像核心产业规模为34.6亿元,预计2021年将达到62.2亿元。
“皮衣人”是2.0阶段数字人的代表。他们依靠模型、动态捕捉和“中间的人”的表演来赋予数字人灵魂。
去年6月,由萧冰公司推出的华智冰亮相,进入清华大学计算机系知识工程实验室。作为一名AI学生,华的旁白、背景音乐、人脸、诗词、绘画都是基于AI技术生成的。
今年6月7日,在全网热议高考作文《我的手,我的手,我的手》的难度时,AI数字人杜潇潇在40秒内创作了40多篇文章,平均1秒生成1篇,并随机选取其中一篇。语文名师沈懿考了48分,他的分数已经超过了75%左右的高考考生。
在AI的推动下,数字人进化到了3.0时代。
AI数字人能做什么?
商汤科技发布的《AI数字人:数字经济发展新动能》白皮书中,将数字人按照进化程度分为五类,并指出“L4的AI数字人可以从大量的人类对话、面部表情、肢体语言中学习。它可以通过自然的面部表情和肢体动作实现智能的类人交互”。
这意味着AI数字人将不再依赖“中间的人”,完全由AI驱动。它不仅是一个具有数字外观的虚拟人物,而且除了外表和行为之外,还具有人的思想,能够识别外部环境并与他人交流。
换句话说,AI数字人才是元宇宙中的“原住民”。
这种转变的核心在于对“深度学习能力”的重视。
深度学习能力是机器学习的一种,需要给机器人“喂”大量的数据,直到它们能够理解并回答客户的问题。
这是一个长期的过程,需要数据、算法和计算能力的结合,需要模型的不断训练、调整和打磨。但一旦核心技术被突破,AI数字人的优势和应用领域将更加多样。
比如杜潇潇,除了写高考作文,还会AI画画,创作歌曲。还担任过工人日报的“AI记者”,采访过五一劳动模范等等。另一个AI数字人Hijiajia,也会画画,写诗,作曲,会说多国语言,还会直播。
AI数字人除了能够“像人一样”学习、交流、工作,还将拥有超强的创造力,颠覆现有的内容生产模式。
AIGC指的是人工智能自动生成内容,这是当前人工智能领域的热门概念之一。它将颠覆现有的内容生产模式。
基于这项技术,杜潇潇挑战高考语文作文时,平均每秒可以做到一篇文章,画一幅图只需要几十秒。与人类的生产力相比,这是一个指数级的提高。
这一切都源于搜索引擎海量数据的先天优势,工业级深度学习平台的飞桨和工业级“知识增强”的大模式。

2019年起,深度参与前期训练模型的研发,成功打造了飞桨和文艺心的大模型家族。心智系列模型以“知识增强”为核心特征,基于持续学习的语义理解框架,融合了大规模知识和海量数据的学习。
比如数字人的绘图能力,用的是文学心智的大模型——跨模态图形生成模型ERNIE-ViLG;;而人的对话能力用的是对话生成的大模型——文献柏拉图,柏拉图拥有接近真人水平的对话能力,对话效果达到了世界领先水平。
另一方面,有了深度学习能力,处于更高发展水平的数字人可以快速从各种场景中获取知识,成为特定领域的“专家”。
AI数字人可以深入B端领域,实现降本增效。比如,科大讯飞推出了智能医疗助手;尚科技AI数字人出现在医院场景,为患者进行分诊和咨询;以及浦发银行打造的“数字员工”小普,每月为46万人提供金融服务。
互联网公司已经加入了构建数字人技术的浪潮。目前,华为、阿里巴巴、腾讯、字节跳动等。已经开始开发和应用数字人。
“数字人是免费的”
未来AI数字人可以承担更多的工作和责任,但目前AI数字人的大规模落地仍面临各种挑战。
首先,AI深度学习是一个长期且昂贵的训练。例如,简单的模型调整可能会使计算资源增加100倍以上。当谷歌子公司DeepMind训练AlphaGo玩围棋时,估计需要花费3500万美元。
此外,如何优化算法提高效率和稳定性,如何提高机器学习和深度神经网络预测的准确性,也是AI技术面临的挑战。而不能自主学习和互动的数字人,就失去了AI的灵魂。
其次,AI数字人还会使用动作捕捉收集表情/动作数据和CG技术合成,这需要巨大的开发、制作和设备运维成本。
36Kr此前报道称,一场全息虚拟演唱会的成本约为2000万元。腾讯NExT Studios团队进一步证实了这一观点。“恐怕一个超逼真的虚拟数字人物,至少要投入100万到200万的制作成本,才能避免丢人现眼,而且即使投入,也不一定能拍出满意的角色”。
另一方面,合格的数字人的生产周期也很长。数字一分钟视频,可能需要2到3个月制作。
天风证券研究报告也指出了虚拟数字人行业生存运营成本高的发展问题。报告认为,在未来很长一段时间内,降本增效将是企业关注的重点。
随着技术的进步,AI数字人也在不断突破。
五年前,我在AI开发者大会上喊出了“All in AI”的口号;现在,一个“AI数字人家庭”已经搭建起来,包括、希佳佳、文……这背后,是智能云西岭数字人平台,通过全场景、平台化的能力,为企业和品牌提供数字人生产运营服务。
近日,杜潇潇在“2022虚拟数字人商业价值潜力”榜单中排名第一;在第三方机构发布的榜单中,因为语音、视觉等AI能力的积累,位列数字人综合实力第一。
在日前的“2022世界大会”媒体预沟通会上,集团副总裁袁佛宇表示:“通过AI算法的突破,我们可以十倍、百倍地降低数字人的生产成本,将数字人的生命周期从几个月缩短到一个小时。”
降低AI应用门槛,带动AI大规模应用,是文心大模型的核心价值观。
今年4月,2021认知AI创意大赛“AI创意派”决赛正式举行。这是业内首次将先进的AI大模型能力对外开放。
“只有门槛低到大家都能方便使用,各种创意才能真正大规模爆发。”集团副总裁吴添说。
目前,文心大模型已应用于搜索、信息流、智能音箱等互联网产品。大规模地应用于各行各业,如工业、能源、金融、通信、媒体、教育等。通过飞桨开源平台和智能云赋能。
现在,我们可以在多个场景中看到AI数字人的身影:

2022年北京冬奥会,AI手语主播根据直播主播的语音和画面,24小时实时转换成手语;今年5月,文博虚拟推广员“文瑶瑶”正式持证上岗,为各大博物馆提供讲解、导览、直播等服务;杜潇潇不仅能“陪聊”——几轮接近真人水平的流畅对话,还能在对话中识别用户的搜索和服务需求。
早在2019年,李彦宏就预言数字人将在旅游咨询、医疗健康、移动通信等领域大显身手“每个人都会有一个或多个专属的数字人来为你服务。我相信这个时代很快就会到来”。
IDC近期发布的报告显示,中国AI数字人市场规模呈现快速增长趋势,预计到2026年将达到102.4亿元人民币。
这一切都来自于压力和马拉松式的RD在AI领域的投入。公开数据显示,在RD投资方面,2021年核心研发支出221亿元,占核心收入的23%,RD投资强度位居中国民营企业500强之首。
巨头的涌入,热钱的涌动,企业的长盛不衰,数字人3.0时代将迎来一个回归期。


