近日,Science杂志发布了2022年度科学十大突破,AIGC赫然在列。

AIGC或许是当下最炙手可热的概念了。无论是震惊世人的ChatGPT,还是火遍全网的AI绘画,都属于AIGC这一概念,即生成式AI。

AIGC 即AI-generated content,简单来说,就是指利用人工智能技术生成内容,也就是说内容的制作者从实打实的人或机构变成了AI。

震惊世人的ChatGPT

最近,OpenAI发布了免费机器人对话模型ChatGPT,一时间火爆全球,成为科技圈第一大热潮,短短一周吸粉便超过百万。ChatGPT也称为科技圈的必聊话题。

作为基于GPT-3.5的对话式AI,ChatGPT最大的特点即是能够“理解”对话者的语义,能够进行更有效的反馈,并进行连续对话。基于对超大规模数据的深度学习,ChatGPT在文本生成领域几乎能“以假乱真”,让你认为其真的拥有了意识。

此外,ChatGPT不仅能答疑解惑,还能写故事、作诗,甚至编程,生成内容的能力空前提高。

写论文

写代码

写旅游计划

写诗

火遍全网的AI绘画

与ChatGPT类似的,还有近日在短视频平台走红的AI绘画,使用用户已超千万。

这是一种将海量二次元画面预录入,通过大数据寻找画面构图、形状、色彩等方面的相似元素,按照AI解读生成新画面的应用。在短视频平台上,用户上传照片或点击屏幕,只需几秒钟时间便可以生成二次元动漫风格的图片。

(图片来源于网络)

早在今年8月,AI绘画就已出圈一次,只需在最基础的终端设备上输入关键词,就能生成高质量的AI图像。甚至出现使用AI作画参赛获奖的新闻,引起广泛热议。

AI画作《太空歌剧院》参赛折桂

为何AIGC能火爆全网?

ChatGPT和AI绘画的爆发式发展,让AI凭借“创作”强势崛起,AIGC也迎来完全不同的发展时期。

不止是商业化案例的落地推广,技术的突破也是AIGC爆火的主要推动力量。

具体而言,CLIP 模型广泛利用互联网图片,搜集了网络上超过40亿个“文本-图像”训练数据,为 AIGC 领域文本生成图片和应用奠定了基础。

与此同时,Diffusion 扩散化模型实现了算法创新:一方面,给图像增加高斯噪声,通过破坏训练数据来学习,找出逆转噪声、恢复原始图像的过程;另一方面,Stable Diffusion把模型的计算空间从像素空间降维到了一个可能性空间的低维空间里,大幅降低了计算量和计算时间,使得模型训练效率大大提高。

不仅如此,开源模式也推动了AIGC的加速。2022年下半年,随着Stable Diffusion的开源,短短几个月的时间内,从模型优化到应用拓展方面,均涌现了大量的二次开发,大幅降低了用户使用 AIGC 进行创作的门槛,提升了创作效率。

总的来看,AIGC在2022年实现破圈,主要就是在深度学习模型方面有了长足进步。

AIGC独特技术特征

AIGC 成为“不可替代”的新一代内容生成方式,与其本身数据巨量化、强化持续学习等技术特征密切相关。

AI数据是人工智能和机器学习的基础,需要收集海量标注数据来对算法模型进行不断训练与调优,需要通过大量的训练来实现更精准的结果,做到处理更多更复杂的场景。

如迦百农AI的超集燕子极光JC326采集训练图片超过200 余万张,让产品面对复杂背景也拥有强劲的算力性能表现,识别准确率高达 99.78%。

而AIGC 丰富的“想象力”和惊为天人的“创作能力”,就是在海量数据的基础上由计算机学习和模拟生成的,每一幅 AI 画作的背后都是无数的标注数据与训练。在零样本学习成熟之前,AIGC 通过巨量数据实现内容创作的发展路线仍难以撼动。

另外,AIGC的自主学习能力也是显著特征。以ChatGPT为例,ChatGPT 整体技术方案是基于 GPT-3.5 大规模语言模型,首次采用RLHF方式,通过人工反馈强化学习来微调模型,让模型一方面学习人的指令,另一方面学习回答的好不好,利用人类反馈的强化学习。

深度强化学习在AI领域广有应用,迦百农AI旗下的超集燕子巡航FK710就是通过系统自动派发任务,再通过任务反馈让AI持续自主学习,从而不断提升预测准确性。

在技术进步的推动下,AIGC 作为新一代创作方式,是数智时代的典型应用创新,它的快速发展不仅正在革新数字文化创作的生产范式,也在改变用户与人工智能的交互模式。

在元宇宙、web3等概念叱咤风云的2022年里,AIGC有望接棒元宇宙成为2023年科技和资本圈的最热门概念,进入AI万亿赛道。