尽管引发了各种各样的“杂音”,但我们不得不承认的是,ChatGPT所展现出来的令人惊艳的对话理解与表达能力,让越来越多人意识到人工智能已经迎来了全新的里程碑,并且有望作为一个至关重要的基座系统,以前所未有的速度渗透进各行各业,持续引爆未来世界的数字经济体系。
在由复旦大学管理学院日前主办的“复旦科创先锋论坛”上,复旦大学计算机科学技术学院教授、MOSS系统负责人邱锡鹏对ChatGPT的未来做出了如下判断:考虑到ChatGPT已拥有通用语言理解的能力,并可以进一步增加对外接口,成为通用人工智能的技术基座。这就意味着通用人工智能(Artificial General Intelligence,AGI)的加速实现对于现阶段的人类来说已经不是梦想。甚至乐观一点说,像科幻片里面的人工智能形象可能很快就会在我们的生活中出现。
ChatGPT是2022年底由美国Open AI公司发布的一个人工智能模型,60天内月活用户直接破亿,成为了史上用户增长最快的消费级应用,其主要的功能就是与人类直接对话。邱锡鹏表示,要想解析ChatGPT背后的技术原理,首先要解一下“语言模型”(Language Model),即利用计算机去重新建模人类语言,把自然语言转化为机器能够理解并判断的语言的一种机制,“我们迫使语言模型努力发现这些文字背后所蕴含的各种各样的规律,从而使这个模型更好理解人类语言和世界知识。”
目前,Transformer已经在整个人工智能领域成为了最主流的语言模型架构体系。邱锡鹏透露,除了能力强之外,还有一个非常重要的原因在于它的架构设计对于GPU运算特别友好。由于Transformer出现在GPU之后,设计方面天然地充分考虑最大限度利用GPU能力,更容易做到大规模语言模型的效果。
“要想模型的预测越准确,就势必需要大量的参数对其进行训练,以帮助大规模语言模型能够充分理解人类语言规则及其逻辑关系。目前在Transformer的加持之下,我们已经可以把模型规模做到百亿级、千亿级,这就是如今的大型语言模型。在大型语言模型当中,我们可以通过输入一些上文,经过语言模型背后的仿人类神经元构成的Transformer神经网络加工处理,从而实现对下一个词的预测,并输出相应文本。”邱锡鹏介绍说,在训练过程当中,科学家发现,计算量大概在10的22次方之后,模型能力会完成从量变到质变的飞跃,呈现出惊人的爆发式增长,通常也将其称之为“涌现能力”。
大型语言模型在达到百亿级规模后开始获得“涌现能力”,而涌现能力的背后,则进一步隐含着三个非常重要的技术:情景学习、思维链和指令学习,这也是ChatGPT得以在人工智能领域叱咤风云的关键原因。
ChatGPT的通用性放大了AI引爆未来的可能。邱锡鹏认为,以ChatGPT为代表的通用人工智能技术,可以引爆数字经济,充分发挥数据和算力效能,并催生出海量的新商业模式;可以赋能产业数字化,并通过人机协同的方式解决行业专家资源不足的问题;可以以数字人、个人助理、搜索引擎等形式对数字经济新业态、新模式提供发展动能;更将深刻改变教育、社会治理、司法等领域的生态,大幅提升行业水平。
但他同时也指出,目前的通用人工智能技术尚且存在很多不足,包括随机性、不可控、容易“一本正经地胡说八道”等等,不过,相信这些问题随着时间的推移,都将在未来通过各种方式逐步得到改进。
邱锡鹏表示,对于下一阶段的大型语言模型来讲,我们目前重点需要去做的事情就是让模型和现实世界以及人类的价值观进行“对齐”,成为一个真正的智能体,具有自身学习、跨模态学习、知识和工具利用等能力。毕竟如果AI的价值观和人的价值观背道而驰,那将会是非常危险的。
作者:唐玮婕
编辑:朱伟
责任编辑:戎兵
*文汇独家稿件,转载请注明出处。