前 言
2021年11月30日,OpenAI推出人工智能聊天原型ChatGPT,赚足了眼球,在AI界引发了类似AIGC让艺术家失业的大讨论。
据报道,ChatGPT在开放试用的短短几天,就吸引了超过 100 万互联网注册用户。并且社交网络流传出各种询问或调戏ChatGPT的有趣对话。甚至有人将ChatGPT比喻为“搜索引擎+社交软件”的结合体,能够在实时互动的过程中获得问题的合理答案。
图1
01 ChatGPT是什么?
ChatGPT 是一种专注于对话生成的语言模型。它能够根据用户的文本输入,产生相应的智能回答。这个回答可以是简短的词语,也可以是长篇大论。其中GPT是Generative Pre-trained Transformer(生成型预训练变换模型)的缩写。
通过学习大量现成文本和对话集合,ChatGPT能够像人类那样即时对话,流畅的回答各种问题,当然速度会慢一些。ChatGPT无论是英文还是其他语言,都可以拿捏。它还能回答历史问题、写故事,甚至是撰写商业计划书和行业分析,“几乎”无所不能。
ChatGPT也可以与其他AIGC模型联合使用,获得更加炫酷实用的功能。这极大加强了AI应用与客户对话的能力,让我们看到了AI大规模落地的曙光。
02 ChatGPT的特点
ChatGPT 是基于GPT-3.5(Generative Pre-trained Transformer 3.5)架构开发的对话AI模型,是InstructGPT 的兄弟模型。ChatGPT很可能是OpenAI 在GPT-4 正式推出之前的演练,或用于收集大量对话数据。
OpenAI使用RLHF(Reinforcement Learning from Human Feedbac,人类反馈强化学习) 技术对 ChatGPT 进行了训练,且加入了更多人工监督进行微调。此外,ChatGPT 还具有以下特征:
1)可以主动承认自身错误。若用户指出其错误,模型会听取意见并优化答案。
2)ChatGPT 可以质疑不正确的问题。例如被询问 “哥伦布 2015 年来到美国的情景” 的问题时,机器人会说明哥伦布不属于这一时代并调整输出结果。
3)ChatGPT 可以承认自身的无知,承认对专业技术的不了解。
4)支持连续多轮对话。
与大家在生活中用到的各类智能音箱和“人工智障“不同,ChatGPT在对话过程中会记忆先前使用者的对话讯息,即上下文理解,以回答某些假设性的问题。ChatGPT还可以实现连续对话,极大的提升了对话交互模式下的用户体验。
图2:ChatGPT特点
对于准确翻译来说(尤其是中文与人名音译),ChatGPT离完美还有一段距离,不过在文字流畅度以及辨别特定人名来说,与其他网络翻译工具相近。
由于 ChatGPT是一个大型语言模型,目前还并不具备网络搜索功能,因此它只能基于2021年所拥有的数据集进行回答。例如它不知道2022年世界杯的情况,也不会像苹果的Siri那样回答今天天气如何、或帮你搜索信息。如果ChatGPT能上网自己寻找学习语料和搜索知识,估计又会有更大的突破。
即便学习的知识有限,ChatGPT 还是能回答脑洞大开的人类的许多奇葩问题。为了避免ChatGPT染上恶习, ChatGPT 通过算法屏蔽,减少有害和欺骗性的训练输入。查询通过适度 API 进行过滤,并驳回潜在的种族主义或性别歧视提示。
03 ChatGPT靠谱吗?
随着AIGC(利用人工智能技术生成内容)作为工具在工作生活中高效应用,大家肯定心里都会冒出一个问题:ChatGPT它真的靠谱吗?带着这个问题,我们来会会这位“全能网友”。
图3
图4
图5
04 ChatGPT对半导体的看法
关于国内未来半导体的发展,我问了ChatGPT,一起来看看它的回答。
图6:ChatGPT有关半导体的回复
05 ChatGPT背后的“英雄”
ChatGPT的问世离不开强大的算力支撑。
1)GPU可支撑强大算力需求。具体来说,从AI模型构建的角度:第一阶段是用超大算力和数据构建预训练模型;第二阶段是在预训练模型上进行针对性训练。而GPU由于具备并行计算能力,可兼容训练和推理,所以目前被广泛应用,ChatGPT训练模型中就已导入至少1万颗英伟达GPU(曾经风靡一时的AlphaGO也只需要8块GPU),推理部分使用微软的azure云服务,也需要GPU进行运作。所以,ChatGPT的火热兴起对GPU的需求可见一斑。
2)CPU+FPGA不可忽略。从深度学习的角度来看,虽然GPU是最适合深度学习应用的芯片,但CPU和FPGA也不可忽略。FPGA芯片作为可编程芯片,可以针对特定功能进行扩展,在AI模型构建第二阶段具有一定的发挥空间。而FPGA想要实现深度学习功能,需要与CPU结合,共同应用于深度学习模型,同样可以实现庞大的算力需求。
3)云计算依靠光模块实现设备互联。AI模型向以ChatGPT为首的大规模语言模型发展,驱动数据传输量和算力提升。伴随数据传输量的增长,光模块作为数据中心内设备互联的载体,需求量随之增长。此外,伴随算力提升能耗增长,厂商寻求降低能耗方案,推动低能耗的光模块发展。
在芯片领域,ChatGPT作为一种新兴的超智能对话AI产品,无论是从技术原理角度还是运行条件角度,ChatGPT都需要强大算力作为支撑,从而带动场景流量大幅增加,此外,ChatGPT对于高端芯片的需求增加也会拉动芯片均价,量价齐升导致芯片需求暴涨;面对指数级增长的算力和数据传输需求,可以进行提供的GPU或CPU+FPGA芯片厂商、光模块厂商即将迎来蓝海市场。
从芯片市场角度出发,芯片需求的快速增加会进一步拉高芯片均价。国内GPU的海光信息、景嘉微;CPU的龙芯中科、中国长城;FPGA的安陆科技、复旦微电、紫光;AI芯片的寒武纪、澜起科技;光模块的德科立、天孚通信、中际旭创可能都将迎来蓝海市场。
06 ChatGPT对其他公司的影响
ChatGPT的火热,也引起了其他公司的警觉。
微软公司于2023年2月8日凌晨发布了新版必应搜索引擎,集成了ChatGPT智能机器人技术应用。重新配置搜索结果,让用户得到更加好的体验,并允许用户直接和必应聊天机器人对话等。
在ChatGPT推出不到1个月后,谷歌CEO在公司内部发布了“红色警报”,并称全面调整2023年谷歌在AI领域的工作。随后,谷歌宣布公司名为Bard的新型对话式AI服务将面向可信任的测试人员开放,随后将在未来几周内公开发布。
苹果公司也做出了相应动作。据彭博社消息,在ChatGPT的影响下,苹果将于下周举行年度内部AI峰会,类似AI的WWDC,仅限于苹果员工。
国内也掀起了ChatGPT热潮。阿里巴巴、快手、小米、腾讯、京东也纷纷加入。
近日,阿里巴巴一名资深技术专家对外爆料,阿里达摩院正在研发类ChatGPT的对话机器人,目前已开放给公司内员工测试。从曝光截图来看,阿里巴巴可能将AI大模型技术与钉钉生产力工具深度结合。
图7:钉钉的“ChatGPT”
据百度方面的知情人士透露,该公司即将推出的类ChatGPT应用“文心一言”上线首站将直接接入百度搜索。英文名ERNIE Bot,三月份完成内测,面向公众开放。
京东也在布局AIGC,将出手打造“京东版”ChatGPT产品。
据澎湃新闻报道,目前快手正在开展大规模语言模型(LLM,Large Language Model)相关的研究,并启动了相应专项,覆盖LLM模型训练、文案自动创作与生成、对话系统开发等领域。
据澎湃新闻报道,小米在ChatGPT领域有丰富落地场景,包括小爱对话、机器人等,其中小爱拥有庞大数据支撑,会让小米在大模型方面进展更迅速。此前小米在AI大模型上已有多路并行尝试,未来将加大相关领域人力和资源投入。
腾讯也正有序推进ChatGPT和AIGC相关方向的专项研究。
07 ChatGPT的未来展望
最近火热的ChatGPT,是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列任务。这款AI语言模型,让撰写邮件、论文、脚本,制定商业提案,创作诗歌、故事,甚至敲代码、检查程序错误都变得易如反掌。
就目前来看,拥有ChatGPT,你就相当于有了半个私人秘书、助理,甚至是知识顾问。不仅如此,ChatGPT可能还将在教育、医疗、办公、人形机器人、电商等领域起到举足轻重的作用。
总 结
ChatGPT的一小步,AI的一大步。ChatGPT的问世引起了大家的广泛关注,上线仅仅2个月,ChatGPT的活跃用户就突破一亿。它让撰写邮件、论文、脚本,制定商业提案,创作诗歌、故事,甚至敲代码、检查程序错误都变得易如反掌。让人们对通用人工智能有了更多的期待。