中国首个原创“虚拟学生”入读清华大学

2021-06-18
来源:新华社新媒体

新华社北京6月17日电(记者魏梦佳)正值高考季,一位幸运的“女生”,不需经过高考,已正式“就读”清华大学计算机系,成为清华大学计算机系副主任唐杰教授的学生,开启大学生活。

“她”就是由清华大学计算机系研发团队主创的中国首个原创虚拟学生“华智冰”。

虚拟学生华智冰。受访者供图

近年来,随着人工智能(AI)等技术高速发展,人机共存的序幕已然拉开,数字人技术正逐渐应用于各种场景。当前,AI正由感知智能时代向认知智能时代迈进。在中国,各种虚拟偶像、虚拟主播已经以三维动画的立体姿态参与到开演唱会、主持节目、直播带货、客串“导游”等现实世界,收获大量年轻粉丝。

作为中国首个原创“虚拟学生”,华智冰自本月初推出以来就广受关注。屏幕中,在清华园中徜徉的“她”,面容姣好,声音温柔,能写诗、作画,会跳舞、创作音乐、写短文,十分“多才多艺”。

这位虚拟大学生如何诞生?将在清华怎样学习?

15日,清华大学计算机系副主任唐杰在发布会上。 受访者供图

在近日举办的清华大学计算机系“华智冰”成果发布会上,唐杰说,华智冰的脸部、声音都是通过AI模型生成,背后依托的是清华多学科交叉的技术团队,以及一个具有1.75万亿参数的超大规模AI模型“悟道2.0”。在“悟道2.0”的模型中,中文、英文、图片三者之间可实现相互切换表达,而整合各种数据和知识的大模型平台,就成为华智冰诞生的基础。

“我们希望华智冰有个人体的外形,能不断学习,希望将来‘她’能像人一样思考,甚至在很多任务上超越图灵测试,具有通用机器学习的认知能力。”在唐杰看来,下一代认知AI应具备“适应与学习”“定义与语境化”“错误探测和编辑”“决策与执行”等9项能力。

清华大学计算机系副教授贾珈负责华智冰的外形及声音、表情、口型和肢体动作的生成。她说,为了创造具有高真实感、多风格的人物形象,团队专门构建了高精度的3D表情包,同时通过广泛的3D人脸建模,使华智冰可以低成本地学习相应的细节动作,包括一些微表情。

“我们人在说话时,每个人的发音特点不一样,比如有些人说话时习惯嘴张得大一点,有人说话嘴张得小一点。我们通过不同的人类视频输入给华智冰之后,让‘她’能够在说同一段文本的时候,根据我们不同的人设,有不一样的口型生成。”贾珈说。

为了让华智冰可以随音乐翩翩起舞,研发团队还记录了不同音乐下不同舞种的舞蹈动作运动轨迹,将其构建成数据集“教”给华智冰。目前,华智冰已学会恰恰等4种舞姿,共有164种编舞单元。

15日,清华大学计算机系研发团队在发布会上回答记者提问。 受访者供图

尽管集合了多种AI技术,研发团队坦言,华智冰还需要在入学后不断学习。下一阶段,团队将不断给“她”输入大量“语料”,让其持续学习数据中隐含的模式,包括文本、视觉、图像、视频等,便于其像人类一样,能不断从身边经历中学习知识经验,迅速成长,从而变得越来越聪明。

除了学习知识和技能,研发团队也希望华智冰在情商上有更多提升。例如,未来当与华智冰交流时,“她”不仅能回答人类的问题,还能像朋友、家人一样自然、愉悦地交流互动。

“我们希望华智冰是一个情商非常高的数字人,能在语言生成过程中,做非常合适的情感表达。比如让‘她’给小朋友讲故事,‘她’会用和蔼的声音来讲述。”贾珈说。

清华大学计算机系副教授刘知远说,基于大量的文本、图像等相关参数,他们已集成了不同领域的语料,可利用技术手段实现“可控的生成”,比如要生成一首诗,可以控制其主题、情感等。“在这些技术支持下,我们希望能在华智冰的虚拟形象上进行相关验证,也期望未来在华智冰的场景中,让更多公众了解AI技术的最新进展。”

按照规划,华智冰将在清华的实验室不断“深造”,最终具有丰富知识,与人类有良好交互能力。

唐杰期待,未来,这个虚拟学生能在多项认知智能上超过人类,不仅能识别图像、写诗作画、回答数学问题,甚至还会编程、写代码、做网页。“或许到那时,‘她’就可以毕业了。对‘她’来说,这也将是一次非常艰难的认知过程。”


阅读 1
分享
写评论...