读而思

AIGC正通过生成逼真的人类语言和图像,并提高数字人的真实感和互动性,拓展数字人的应用场景,提高数字人的个性化程度,推动数字人产业的创新和发展。未来,随着技术的不断进步和应用场景的不断拓展,数字人产业将会迎来更加广阔的发展空间和机遇。

孟繁科  本刊副总编

AIGC全称为AI Generated Content,即生成式AI或者人工智能生产的内容,被认为是继PGC(Professional Generated Content,专业生产内容)、UGC(User Generated Content,用户生成内容)之后的新型内容创作方式。

在技术上,AIGC能以优于人类的制造能力和知识水平承担信息挖掘、素材调用、复刻编辑等基础性内容生成,以低边际成本、高效率的方式满足海量个性化需求。

在市场需求上, 由于Web3.0 时代的到来,人工智能、关联数据和语义网络构成全新格局,与之相应,AIGC作为新的内容生产方式,被认为是元宇宙和 web3.0 的底层基础设施之一。

目前,AIGC已广泛应用于新闻、游戏、社交媒体、视频、艺术创作等领域。AIGC正在不断驱动数字人产业升级,助力实现元宇宙场景下的人机交互与信息共享。

中国科学院院士韩启德曾在公开演讲中表示,AIGC在创造内容上比人类更高效,在创作成本上比人类更低,在传播效果上比人类更好。因此,AIGC将会成为元宇宙的重要生产力,在人机交互中扮演越来越重要的角色。

数字人产业现状

据中商产业研究院发布的报告显示,2022年中国数字人产业市场规模已达1464亿元,同比增长57%,预计2025年将达2600亿元。

数字人技术已从基础层向应用层快速跃升,其应用场景日益丰富,从娱乐、社交、广告、金融等领域逐渐渗透到医疗、教育、文旅等行业中,并逐步渗透至虚拟主播、虚拟偶像等新兴领域。

在应用场景不断丰富的需求推动下,其技术不断迭代升级,产业链条正在被不断重塑。

技术维度:从低精度到高精度

传统的数字人技术主要是通过语音合成技术、计算机视觉技术等进行建模,在语音合成方面主要是基于深度学习中的深度神经网络进行语音识别和语音合成,在计算机视觉方面主要是通过计算机视觉模型如3D模型进行建模。以深度神经网络为例,其将图像特征的空间表示转化为高维空间的向量表示,而传统的基于深度学习的方法由于不能考虑到特征之间的空间依赖关系,导致其计算复杂度非常高,训练时间非常长。目前,深度学习中基于深度神经网络模型进行建模的方法已经得到了广泛应用。

从算法维度看,传统方法主要是基于深度神经网络进行建模,通过调整参数和调整模型结构来实现语音识别和语音合成。随着深度学习技术的发展,近年来出现了基于多个网络模型组合在一起进行建模的方法。以深度学习中常见的多层感知机模型(MLP)为例,其采用了卷积神经网络和循环神经网络两个网络进行建模。在训练过程中,首先利用卷积神经网络将输入数据映射到低层次空间(即一层输入数据对应一个低层次空间),然后根据上一层的结果进行下一层网络结构建模(即下一层网络对应一个高层次空间),最后对不同层次间的网络参数进行调整。因此,该模型具有一定的泛化能力和推理能力,可以应用不同领域、不同类型的数据。

应用维度:从单一到多元

当前,数字人已被应用于多个行业。

国内数字人在教育、金融、文旅、医疗等领域的应用场景不断拓展,技术不断迭代升级,数字人在行业内的渗透率稳步提升。

以教育为例,在 AI教育领域,各大科技公司纷纷推出了“AI老师”和“AI助教”等产品,实现了从真人老师到 AI助教的升级。2022年3月,新东方的英语老师姜浩杰(虚拟人)正式入驻抖音,开启了她在抖音平台上的首次直播教学。而在金融领域,虚拟数字人已经广泛应用于各大金融机构中。例如,浦发银行、广发银行、招商银行等各大商业银行已经推出了具有专属形象的虚拟数字员工来进行各类金融服务。此外,百度智能云推出了全球首个可交互虚拟主播“小度”;上海市黄浦区积极探索城市治理、民生服务等领域的应用实践。

2022年2月,Meta推出了全球首个完全由 AI驱动的虚拟形象“Meta Quest 2”。“Meta Quest 2”可以在不连接到PC、控制台或手机的情况下畅享游戏、电影等,让人有身临其境的体验。此外,Meta还与索尼合作推出了以数字人形象为主角的电影《黑镜:潘达斯奈基》;2022年4月,Meta与微软合作推出了“Arena”系列虚拟人,并以其为原型开发出虚拟偶像。

AIGC的优势与特征

AIGC相较于传统的人工生成内容具有更高的效率和更多的内容可供选择。AIGC基于深度学习算法,使用大规模训练数据,可以在短时间内生成大量多样化、高质量、个性化的内容,降低了人工制作成本,使创作者能够快速地进行内容创作。在短时间内完成海量素材的收集,并对数据进行优化处理,有效地提高了生产效率。

相比于传统内容创作模式, AIGC还能够根据用户反馈快速迭代生成内容。以游戏为例,AIGC能够根据用户需求进行设计,创作出符合玩家喜好的游戏内容,如在游戏中加入NPC对话、角色配音等元素。

AIGC具有智能性、易操作性和可扩展性等特征。AIGC可以通过人机对话的方式与人类交互,在一定程度上降低了创作门槛,促进了创作群体的多样化和丰富化。同时,AIGC还具有学习能力,能够通过对大量样本的学习与积累来获取更多有用信息。AIGC可以帮助创作者更高效地完成内容生产,快速产出内容;在短时间内生成海量素材和个性化内容,满足用户对于个性化定制化服务的需求。此外,AIGC还具有可扩展性与可移植性等特点,能够通过修改参数或添加辅助信息等方式,来优化生成的内容,增强用户体验感。

智能性

AIGC的智能性主要体现在 AIGC可以根据用户的输入生成内容。传统的内容生产模式是根据用户的输入进行内容创作,创作者在创作过程中需要根据需求收集大量数据并对数据进行筛选与处理,整个过程较为繁琐且效率较低。而 AIGC通过学习人类创作过程,可以自主完成对文本、图片等数据的学习,生成符合用户需求的内容。由于AIGC 可以快速地完成任务,在一定程度上降低了创作门槛,提高了创作者的工作效率。

此外,AIGC还具有学习能力。通过对人类创作过程的学习与积累,AIGC能够自主地判断所需的信息与内容。

易操作性

AIGC能够在短时间内生成大量个性化、多样化、高质量的内容,同时还能够在生成的内容中加入辅助信息,增强内容的交互性。与传统创作方式相比,AIGC具有更强的易操作性。

一方面,AIGC能够通过人机对话的方式来创作内容,降低了创作门槛。另一方面,AIGC能够通过“自我学习”来提升生成内容的质量,无需创作者进行过多的干预和引导,提升创作效率。随着人工智能技术和计算机算法的发展,人工智能在内容生成领域已经取得了长足进步,这为 AIGC提供了强大支撑。算法模型可以根据输入信息自动调整参数和模型结构,并自动生成所需的内容。此外,AIGC技术还具有自动反馈功能和自我学习能力,能够根据用户反馈及时进行内容优化并更新模型,为用户提供更好的体验。

可扩展性

AIGC可以在较短时间内生成大量不同风格、不同类型的内容,使创作者能够根据需求来灵活地选择生成的内容。用户可以根据自己的喜好、风格、类型等对生成的内容进行个性化定制,并且在生成的内容中添加自己想要表达的信息,如作者心情、场景设置、剧情走向等,从而增强内容的可识别性与个性化。

AIGC通过将算法模型与机器学习等技术相结合,能够使生成的内容更加符合用户需求。随着技术不断发展,AIGC有望将更多类型和风格的内容融入到数字人制作中,丰富数字人的类型与风格。在数字人制作过程中,创作者可以根据需求加入不同类型或风格的元素。例如,在影视制作领域,创作者可以将影视制作中所需的虚拟场景、人物形象等元素融入到数字人中,丰富数字人在影视领域中的表现。

AIGC对数字人产业的影响

AIGC应用于数字人产业,可大幅降低数字人生产成本,提升数字人质量,增强数字人互动能力。通过人工智能技术,可以实现快速创建和生成多样化的数字人形象,无论是外貌、声音还是行为。这使得数字人产业能够更加灵活地满足不同客户的需求,并且能够更快地响应市场变化。在生产方面,AIGC可自动生成丰富多样的内容,包括视频、音频、文本、图片等多种形式,降低了数字人制作的门槛。同时,AIGC可帮助数字人创作出更多的高质量内容,进一步扩大其影响力。在互动方面,AIGC能帮助数字人完成人机交互任务,让数字人拥有更强的交互能力,提升用户体验。

AIGC带来了更真实和逼真的数字人形象。通过先进的人工智能技术,数字人产业可以创建高度逼真的数字人形象,包括面部表情、语音交流和肢体动作等。这使得数字人形象更加接近真实人类,更容易引起观众的共鸣和认同。例如,可以利用数字人形象提供个性化的教育和培训,通过数字人形象进行产品推广和品牌宣传,提供更便捷、更丰富的客户服务。

AIGC在数字人产业中的应用,使得数字人的生产流程、交互方式和人机协作方式等,都发生了重大变革。不仅改变了人们对数字人的认知、使用方式和消费习惯等,而且加速了数字人产业从内容生产到应用落地的转化。

同时,AIGC也带来了一些潜在的风险和挑战。例如,AIGC可能引发伦理和隐私问题,尤其是在涉及使用真实人类形象的情况下。此外,数字人产业的发展也可能导致一些职业的消失或者变革,需要社会和政府对相关政策进行监管和调整。

总起来说,AIGC对数字人产业的影响,主要是两个方面。

一方面,AIGC使数字人产业的发展从内容生产、交互体验到场景应用等各个环节都发生了变化。未来,数字人的交互体验将会更加真实自然,且交互体验也将随着AI技术的进步不断优化升级。

另一方面,AIGC对数字人产业的发展也具有较大的促进作用。例如,AIGC不仅将进一步提升数字人在交互体验方面的表现。同时,AIGC也将推动数字人产业朝着更加智能化的方向发展。

数字人发展的未来趋势

从应用场景来看,随着AIGC的不断发展,数字人应用范围将持续拓宽。随着元宇宙的发展,数字人的应用场景将更加多元化,除了目前已经在新闻、社交媒体、视频等领域有所体现的数字人外,未来还将有更多以数字人形象为载体的新应用场景涌现。

首先,在社交媒体领域,基于人工智能的数字人有望实现更高水平的内容生产。在未来的元宇宙中,社交媒体将成为一个高度智能化、可交互的世界。基于人工智能和算力支持的虚拟数字人将会承担更多信息传递和信息交流的任务,帮助用户更好地了解世界、认识自己,构建起虚拟与现实之间的桥梁。

随着数字人技术的不断发展和完善,虚拟人将会逐步具备视觉、语音、情感等多种能力。在未来元宇宙中,虚拟人将与用户产生更多交互,迸发新的交互方式。用户可以通过虚拟人对世界进行感知和参与。

未来,智能制造将会成为产业数字化转型和经济高质量发展的重要支撑。基于人工智能和算力支持的虚拟人可以帮助企业实现更加智能化、自动化、人性化和定制化的生产,有助于企业降本增效。

元宇宙

元宇宙是互联网的下一个阶段,是依托于虚拟现实、人工智能和区块链等技术的多维空间。元宇宙的本质是对现实世界的虚拟化、数字化过程。

元宇宙包含三大要素:一是物理世界,即现实世界;二是虚拟世界,即虚拟化的现实世界;三是数字世界,即数字化的虚拟世界。

在元宇宙中,物理世界和数字世界相互融合、相互映射、相互影响。通过在物理世界中建立虚拟空间,实现人与人、人与物、物与物之间的交流。

目前,元宇宙还处于初级阶段,虽然部分企业已经开始探索元宇宙产业应用领域,但元宇宙商业模式尚未确定。未来,随着元宇宙相关技术的不断成熟以及人们对元宇宙认识的不断加深,未来元宇宙产业将呈现多样化和个性化的特点。从已有的应用场景来看,虚拟数字人应用场景将更加多元化,以数字人为载体的新应用场景将不断涌现。

数字人

从应用场景来看,数字人将进一步拓宽应用领域,呈现出多元化、个性化、多样化的特点。

当前数字人主要集中于娱乐领域,而随着元宇宙的发展,未来数字人将逐渐向政务、金融、医疗、教育等领域延伸。已经有部分企业开始布局数字人产业,包括百度、腾讯等互联网巨头和众多AI公司,都已经开始布局数字人产业。

2022年8月,腾讯正式推出数字人“小冰”;2022年11月,百度发布了新一代人机交互操作系统——百度智能云 AIUI;2022年12月,华为发布首个“数字员工”。

在政务领域,未来数字人将通过语音交互和人脸识别等技术手段,提供精准高效的政务服务;在金融领域,未来数字人将通过语音交互和人脸识别等技术手段,为用户提供更便捷的金融服务;在医疗领域,未来数字人将通过语音交互和人脸识别等技术手段,提供更加精准高效的医疗服务;在教育领域,未来数字人将通过语音交互和人脸识别等技术手段,为学生提供更加便捷高效的教育服务。

AIGC对数字人产业的影响主要体现在以下几个方面。

一是提高数字人的真实感和互动性:通过生成逼真的人类语言和图像,AIGC提高了数字人的真实感和互动性,使用户更容易与数字人进行交互,提高了用户体验。

二是拓展数字人的应用场景:数字人在娱乐、教育、医疗、旅游等领域的应用越来越广泛,满足了人们多样化的需求。

三是提高数字人的个性化程度:通过深度学习和神经网络,AIGC可以生成个性化的数字人形象和语言,使数字人更符合用户的个人偏好和需求。

四是推动数字人产业的创新和发展:越来越多的企业和机构开始涉足数字人产业,推动了技术的进步和市场的发展。

未来, AIGC还将持续释放巨大潜力,推动元宇宙产业在技术、场景、生态等方面加速发展。在这个过程中,数字人产业将与AIGC进一步深度融合,数字人产业将会迎来更加广阔的发展空间和机遇,加速实现数字人产业升级和经济高质量发展。

END

来源:中国工业和信息化