近期,ChatGPT爆火出圈,引起各行各业广泛关注。

Google也在顺势而为,推出竞品Bard,却在昨天因回答失误导致市值大跌。

ChatGPT为何如此备受推崇,Bard真的就此败北了吗?

下面我们来看看领域资深专家、达观数据副总裁、《知识图谱:认知智能理论与实战》一书的作者王文广老师怎么说吧~~

01

ChatGPT爆火出圈始末

“虎越雄关踪影杳,兔临春境万家新。”

岁末年初,人工智能江湖掀起了江湖上的一场“血雨腥风”。

这场风雨的起因是屠龙刀——ChatGPT

可谓屠龙刀ChatGPT一现江湖,即引起所有江湖人士的关注。

不仅圈内人士津津乐道,纷纷赞叹自然语言处理(Natural Language Processing, NLP)大模型的魔力,探讨通用人工智能(Artificial general intelligence,AGI)的奇点来临,吃瓜群众更是纷至沓来,实在算是爆火出圈,拦都拦不住的那种:

《时代》记者把 ChatGPT 当人一样来采访[1],若非ChatGPT自己一直强调它是人工智能,是大语言模型,人们可能会认为与记者对话的是该领域的专家。

ChatGPT通过了沃顿商学院的工商管理硕士课程的期末考试并获得B档成绩,展现出了非凡的能力[2]。

ChatGPT已经成为了许多科学论文或出版书籍的共同作者,比如ChatGPT名列《Performance of ChatGPT on USMLE: Potential for AI-Assisted Medical Education Using Large Language Models》这篇文章的12个作者中的第3位,Gautier Marti则在其出版的书籍《From Data to Trade: A Machine Learning Approach to Quantitative Trading》中将ChatGPT列为共同作者。

由ChatGPT 的前身Codex大语言模型提供支撑的GitHub CoPilot为数千万的程序员提供效率工具。

北密歇根大学哲学教授安东尼·奥曼 (Antony Aumann)的“世界宗教课程(world religions course)”的全班最佳论文(the best paper in the class.)是该学生使用了 ChatGPT所写。[3]

以色列总统艾萨克·赫尔佐格 (Isaac Herzog)在周三发表了部分由 AI 创作的演讲后,成为第一个公开使用ChatGPT的世界领导人。[4]

同时,根据路透社的报道,ChatGPT发布仅两个月就有1亿用户参与狂欢,成为有史以来用户增长最快的产品[7]。

业内巨头公司也纷纷跟进:

微软联合创始人比尔·盖茨在 1 月 11 日的 Reddit AMA 的问答帖中对一些热门科技概念发表了看法,他表示自己不太看好 Web3 和元宇宙,但认为人工智能是“革命性”的,对 OpenAI 的 ChatGPT 印象深刻。微软也准备再向OpenAI投资 100 亿美元。更进一步,微软宣布包括 Office 全家桶、Team 会议系统、Azure产品、Bing 搜索等在内的全线产品都接入 ChatGPT。

而此前力推元宇宙的Meta的态度也有所改变,扎克伯格在2022年年度报告投资者电话会议上表示“我们的目标是成为生成式人工智能的领导者(Our Goal is to be Leader in Generative AI)”[16]。面对投资者对元宇宙是否被抛弃的疑问,扎克伯格的回答是“今天专注于人工智能,长期则是元宇宙(AI today and over the longer term the metaverse)”(想想经济学家凯恩斯那句名言“长期来看,我们都死了”吧)。

百度正计划在今年3月推出与OpenAI的ChatGPT类似的人工智能聊天机器人服务“文心一言(ERNIE Bot)”,最初版本将嵌入其搜索服务中。

02

ChatGPT出世,谁与争锋?

如今,屠龙刀ChatGPT爆火出圈,而江湖中流传的另一个巨头拥有一把倚天剑,它曾经在江湖中出现过,但人们已经忘记,直到屠龙刀的出现,人们纷纷想起:

武林至尊,宝刀屠龙;

号令天下,莫敢不从;

倚天不出,谁与争锋?

于是,拥有倚天剑的巨头Google开始被谈起。

2022年12月23日有报道称,面对ChatGPT,Google CEO Sundar Pichai在 Google内部发出Code Red[4][5],探讨如何要如何应对微软和OpenAI携屠龙刀掀起的血雨腥风。

2023年1月23日,福布斯的报道又近了一步,创始人 Larry Page(拉里·佩奇)和Sergey Brin(谢尔盖·布林)回归 Google支持全力开发AI,即使广告收入受到影响也在所不惜[6]。

看来,Google要让倚天剑出鞘了。

紧接着,Google 投资了原 OpenAI 员工创立的Anthropic公司4亿美元[8],该公司拥有类似OpenAI的产品,包括与ChatGPT 对标的Claude和与GPT-3对标的Anthropic-LM。

终于,在兔年元宵节后的第一个工作日(2023年2月6日),GoogleCEO Sundar Pichai发布了与ChatGPT对标的产品——Bard。[9]

这可谓人工智能江湖中的倚天剑。

然而,就在昨晚(2023年2月8日晚)美股开盘时,Google因Bard在一场发布会上对用户提出的问题给出错误回答,市值大跌,蒸发约1020亿美元(约6932.50亿元人民币)!

如今看来,“屠龙”“倚天”交锋的第一阶段暂以“屠龙”胜出告终!

然而,这也将是未来的终局吗?

03

Bard与ChatGPT的PK,出路在哪里?

我们先来了解一下Bard这把倚天剑是怎么造出来的!

事实上,倚天剑一直都存在,只不过之前是Google 的 LaMDA。

2022年6月,江湖上流传着一个沸沸扬扬的传说[12],谷歌工程师Blake Lemoine认为LaMDA产生了“自主情感”,是一个可爱的孩子,并向公司提供了 LaMDA 具有情感能力的证据。

但Google 公司并不认可,Blake Lemoine因此将整个故事,以及与 LaMDA 的聊天记录公之于众。而Blake Lemoine也因泄密而被停职。

如今,倚天剑 LaMDA 换了个剑鞘——改名为Bard——重出江湖。

知晓内幕的江湖人士都知道,倚天剑、屠龙刀都是黄蓉基于玄铁重剑配以西方精金铸成:“因此她聘得高手匠人,将杨过杨大侠赠送本派郭祖师的一柄玄铁重剑熔了,再加以西方精金,铸成了一柄屠龙刀、一柄倚天剑。”

刀剑同源,想来,Bard和 ChatGPT 也是一样,以大语言模型配以RLHF(Reinforcement Learning from Human Feedback,RLHF,人类反馈强化学习,宛如玄铁重剑配以西方精金。       

Bard 和 ChatGPT 都是用类似的技术来做的,而且许多技术都是同源的。

比如大模型(GPT3和 LaMDA)的基本网络架构,都来自Google于2017年发布的变换器网络(Transformer)的解码器

另外,目前未有消息详细介绍Bard是否用到了人类反馈强化学习(RLHF),想来应该也是要用的,而 RLHF 也是2017年 DeepMind 和 OpenAI 共同研究的成果《Deep reinforcement learning from human preferences》(https://arxiv.org/abs/1706.03741)。

恰巧的是,人工智能中的大语言模型也正如江湖中的玄铁重剑,所谓“重剑无锋,大巧不工”,哈哈哈,这不正是过去5年来预训练大语言模型的真实写照么?

回过头来,下面先着重聊聊倚天剑Bard。

之前Google CEO Pichai发表在博客上的文章提到Bard 是基于LaMDA 的轻量级版本,关注的三个关键目标是“质量、安全和凭据”。

可以看出,Google 相比与OpenAI 还是谨慎了很多,除了关心影响搜索广告的收入外,之前迟迟未推出 Bard,可能也会担心像如今负面舆论的影响,毕竟大家对大公司的要求更为严苛。

此外,也可以看到,Google 做对话模型的核心关注点之一是关注事实(factuality)。

这点和其他语言模型有所区别。

事实上,语言模型的胡说八道是业内所众所皆知的,很难避免。比如ChatGPT的经典例子“贾宝玉娶老婆”的故事(这个问题流传最广的回答是:贾母)。

图灵奖三巨头之一Yann LeCun就激烈批评大语言模型的问题“人们严厉批评大语言模型是因为它的胡说八道,ChatGPT 做了(与语言大模型)同样的事(People crucified it because it could generate nonsense.ChatGPT does the same thing.)”。

因此,Google非常关注知识图谱。

Google发表的论文曾披露LaMDA是一个自回归语言模型,使用了变换器网络的解码器,在文本语料上进行预测下一个词元的预训练,示意图如下图所示。

这点说明,LaMDA和GPT-3是非常类似的模型,几乎可以认为是一样的,细节差别可能无伤大雅。

训练LaMDA 的语料也非常庞大,称为 Infiniset,是公共对话数据和其他公共网络文档的结合。

下图展示了LaMDA是如何通过与外部信息检索系统的互动来处理凭据的。

从图中可以明显看到三元组的印记“<Eiffel Tower, Construction started, 28 January 1887>”和“<Eiffel Tower, date opened , 31 March 1889>”这说明 Google 有了强大的知识图谱的支持,对于提供事实是多么有利,且强大。

有关知识图谱可以参考权威书籍珠峰书《知识图谱:认知智能理论与实战》一书。

其实,可以看到,Bard在技术上并不比ChatGPT差,ChatGPT目前的回答也有很多错误百出的地方,比如:

因此,在纯靠语言模型而没有知识图谱支撑的情况下,ChatGPT其实现在也是出错不少,而Bard有知识图谱支撑,虽然目前有失误,但其实并不能说明就比ChatGPT差,只是可能因为大家对创业公司比较宽容,而对大公司比较苛刻,有一点错误就会被放大。

所以,虽然倚天剑Bard暂时因给出错误答案表面上稍逊一筹,但毕竟“倚天”“屠龙”的交锋刚刚开始,我们仍然可以拭目以待,时间自会给出答案。

04

番外

熟悉江湖的人们可能还会记得,在倚天剑屠龙刀之外,江湖上还有一个神器也同样由玄铁所铸,不惧屠龙刀,二者还在冰火岛中正面PK过。那就是江湖中另一个传说——圣火令。

今时,位于中土的另一个巨头,也是人工智能江湖中积累深厚的巨头传出消息说要推出“文心一言”,迎战屠龙刀ChatGPT。

为此,我认为“文心一言”可谓圣火令。待有更多消息后,另起一文为大家详细解析“圣火令”。

事实上,江湖故事多。倚天剑屠龙刀的来源是玄铁重剑——大语言模型,这是另一个长篇故事,未来咱们再聊。

江湖还流传着关于江湖自身的传说:

在人工智能发展过程中,每前进一步,人们就会兴奋一阵子,然后慢慢习惯了,就认为不智能了。

也就是说,智能,永远存在于未来,那些已经成为智能的部分都不算智能!

比如江湖早期(二十世纪六、七十年代),对话系统得到了发展, ELIZA(如下图) 就是早期闻名于世的利器,他可谓刀(ChatGPT)剑(Bard)的原型。

ELIZA是那时对话系统的集大成者,集成了关键词识别、最小上下文挖掘、模式匹配和脚本编辑等功能[13]。在当时,ELIZA就是智能,而如今,它连“人工智障”都不如!         

这,就是江湖!

参考文献:

[1]AI Chatbots Are Getting Better. But an Interview With ChatGPT Reveals Their Limits. TIME. https://time.com/6238781/chatbot-chatgpt-ai-interview/. 2023.

[2]ChatGPT passes MBA exam given by a Wharton professor. NBC News. https://www.nbcnews.com/tech/tech-news/chatgpt-passes-mba-exam-wharton-professor-rcna67036. 2023.

[3]Alarmed by A.I. Chatbots, Universities Start Revamping How They Teach. The New York Times. https://www.nytimes.com/2023/01/16/technology/chatgpt-artificial-intelligence-universities.html. 2023.

[4]Israels president became the first world leader to publicly use ChatGPT when he gave a speech partly written by the AI. Insider.   https://www.businessinsider.com/chatgpt-used-by-israeli-president-write-speech-at-cybersec-event-2023-2. 2023.

[5]ChatGPT将代替搜索引擎?谷歌内部发红色警报. 澎湃新闻. https://www.thepaper.cn/newsDetail_forward_21282873

[6]How ChatGPT Suddenly Became Google’s Code Red, Prompting Return Of Page And Brin. Forbes.   https://www.forbes.com/sites/davidphelan/2023/01/23/how-chatgpt-suddenly-became-googles-code-red-prompting-return-of-page-and-brin/. 2023.

[7]With Bing and ChatGPT, Google is about to face competition in search for the first time in 20 years. Insider.https://www.businessinsider.com/bing-chatgpt-google-faces-first-real-competition-in-20-years-2023-1

[8]ChatGPT sets record for fastest-growing user base – analyst note。Reuters. https://www.reuters.com/technology/chatgpt-sets-record-fastest-growing-user-base-analyst-note-2023-02-01/. 2023.

[9]Google Invests Almost $400 Million in ChatGPT Rival Anthropic. Bloomberg. https://www.bloomberg.com/news/articles/2023-02-03/google-invests-almost-400-million-in-ai-startup-anthropic. 2023.

[10]An important next step on our AI journey. Google Blog. https://blog.google/technology/ai/bard-google-ai-search-updates/. 2023.

[11]LaMDA: our breakthrough conversation technology. Google Blog. https://blog.google/technology/ai/lamda/. 2021.

[12]Romal Thoppilan, Daniel De Freitas, Jamie Hall et al. LaMDA: Language Models for Dialog Applications. arXiv:2201.08239. 2022.

[13]The Google engineer who thinks the company’s AI has come to life.  The Washington Post. https://www.washingtonpost.com/technology/2022/06/11/google-ai-lamda-blake-lemoine/. 2022

[14]Joseph Weizenbaum. ELIZA–A Computer Program for the Study of Natural Language Communication Between Man and Machine.[J]// Communications of the ACM. Vol9. P36–45.

[15]王文广. 知识图谱:认知智能理论与实战[M] //电子工业出版社, 2022

[16]比尔·盖茨看好 AI,而非 Web3 和元宇宙. 新浪网. http://vr.sina.com.cn/news/hot/2023-01-13/doc-imxzzfmr4911664.shtml. 2023

[17]Meta Platforms (NASDAQ: META) CEO Mark Zuckerberg: “Our Goal is to be Leader in Generative AI”. Wall Street Reporter. https://www.wallstreetreporter.com/2023/02/02/meta-platforms-nasdaq-meta-q4-2022-earnings-call/. 2023.

[18]Wolfram|Alpha as the Way to Bring Computational Knowledge Superpowers to ChatGPT. StephenWolfram. https://writings.stephenwolfram.com/2023/01/wolframalpha-as-the-way-to-bring-computational-knowledge-superpowers-to-chatgpt/. 2023.

[19]学习ChatGPT和扩散模型Diffusion的基础架构Transformer,看完这些论文就够了.走向未来.  https://mp.weixin.qq.com/s/3bOFfODR7rpnyzrpocHlfQ. 2023.    

作者著作

京东限时四六折优惠,快快扫码抢购吧!

发布:刘恩惠

审核:陈歆懿

如果喜欢本文欢迎 在看留言分享至朋友圈 三连

 热文推荐 

调查:React 仍然是使用最广泛的前端框架,TypeScript 是优先选项

现实中的量子计算机有望进化成《流浪地球2》中的MOSS吗?

书单 | 12月&1月新书速递!

两万字长文,史上最全 C++ 年度总结!

▼点击阅读原文,了解本书详情~