中国首个原创“虚拟学生”入读清华大学

2021-06-18

来源：新华社新媒体

新华社北京6月17日电（记者魏梦佳）正值高考季，一位幸运的“女生”，不需经过高考，已正式“就读”清华大学计算机系，成为清华大学计算机系副主任唐杰教授的学生，开启大学生活。

“她”就是由清华大学计算机系研发团队主创的中国首个原创虚拟学生“华智冰”。

虚拟学生华智冰。受访者供图

近年来，随着人工智能（AI）等技术高速发展，人机共存的序幕已然拉开，数字人技术正逐渐应用于各种场景。当前，AI正由感知智能时代向认知智能时代迈进。在中国，各种虚拟偶像、虚拟主播已经以三维动画的立体姿态参与到开演唱会、主持节目、直播带货、客串“导游”等现实世界，收获大量年轻粉丝。

作为中国首个原创“虚拟学生”，华智冰自本月初推出以来就广受关注。屏幕中，在清华园中徜徉的“她”，面容姣好，声音温柔，能写诗、作画，会跳舞、创作音乐、写短文，十分“多才多艺”。

这位虚拟大学生如何诞生？将在清华怎样学习？

15日，清华大学计算机系副主任唐杰在发布会上。受访者供图

在近日举办的清华大学计算机系“华智冰”成果发布会上，唐杰说，华智冰的脸部、声音都是通过AI模型生成，背后依托的是清华多学科交叉的技术团队，以及一个具有1.75万亿参数的超大规模AI模型“悟道2.0”。在“悟道2.0”的模型中，中文、英文、图片三者之间可实现相互切换表达，而整合各种数据和知识的大模型平台，就成为华智冰诞生的基础。

“我们希望华智冰有个人体的外形，能不断学习，希望将来‘她’能像人一样思考，甚至在很多任务上超越图灵测试，具有通用机器学习的认知能力。”在唐杰看来，下一代认知AI应具备“适应与学习”“定义与语境化”“错误探测和编辑”“决策与执行”等9项能力。

清华大学计算机系副教授贾珈负责华智冰的外形及声音、表情、口型和肢体动作的生成。她说，为了创造具有高真实感、多风格的人物形象，团队专门构建了高精度的3D表情包，同时通过广泛的3D人脸建模，使华智冰可以低成本地学习相应的细节动作，包括一些微表情。

“我们人在说话时，每个人的发音特点不一样，比如有些人说话时习惯嘴张得大一点，有人说话嘴张得小一点。我们通过不同的人类视频输入给华智冰之后，让‘她’能够在说同一段文本的时候，根据我们不同的人设，有不一样的口型生成。”贾珈说。

为了让华智冰可以随音乐翩翩起舞，研发团队还记录了不同音乐下不同舞种的舞蹈动作运动轨迹，将其构建成数据集“教”给华智冰。目前，华智冰已学会恰恰等4种舞姿，共有164种编舞单元。

15日，清华大学计算机系研发团队在发布会上回答记者提问。受访者供图

尽管集合了多种AI技术，研发团队坦言，华智冰还需要在入学后不断学习。下一阶段，团队将不断给“她”输入大量“语料”，让其持续学习数据中隐含的模式，包括文本、视觉、图像、视频等，便于其像人类一样，能不断从身边经历中学习知识经验，迅速成长，从而变得越来越聪明。

除了学习知识和技能，研发团队也希望华智冰在情商上有更多提升。例如，未来当与华智冰交流时，“她”不仅能回答人类的问题，还能像朋友、家人一样自然、愉悦地交流互动。

“我们希望华智冰是一个情商非常高的数字人，能在语言生成过程中，做非常合适的情感表达。比如让‘她’给小朋友讲故事，‘她’会用和蔼的声音来讲述。”贾珈说。

清华大学计算机系副教授刘知远说，基于大量的文本、图像等相关参数，他们已集成了不同领域的语料，可利用技术手段实现“可控的生成”，比如要生成一首诗，可以控制其主题、情感等。“在这些技术支持下，我们希望能在华智冰的虚拟形象上进行相关验证，也期望未来在华智冰的场景中，让更多公众了解AI技术的最新进展。”

按照规划，华智冰将在清华的实验室不断“深造”，最终具有丰富知识，与人类有良好交互能力。

唐杰期待，未来，这个虚拟学生能在多项认知智能上超过人类，不仅能识别图像、写诗作画、回答数学问题，甚至还会编程、写代码、做网页。“或许到那时，‘她’就可以毕业了。对‘她’来说，这也将是一次非常艰难的认知过程。”

阅读61