一文理解ChatGPT_【云素材-原型】

ChatGPT是什么？

最近chatgpt很火，现在AI不但能下棋，能画画，还能流畅对话，写诗写代码，无所不能，重点是已经在非常多的方面胜过人类了。AlphaGo在围棋上战胜人类冠军，ChatGPT在美国高考SAT考试的得分：1020（总分1600分），作为打工人不知道哪一天就被彻底取代了，危机感进一步加重。

其实ChatGPT 就是「一款聊天机器人」，以对话的方式跟用户交互。但聊天机器人市面上很多，相信大家也被这类机器人折腾的够呛，总是所问非所答反而浪费时间。但是重要的是，这款聊天机器人的智能化远远超出了他的前辈们。随便看几个例子

感受一下，对话之流畅，回答之精准，创作之精彩，是不是很难区分到底背后是真人还是AI。而且还能多轮对话，不得不说确实比我强。也让测试过的人大感惊叹，对它今后的使用场景浮想联翩。

而且相较于其他的聊天机器人，对于未知的领域会拒绝回答而不会乱答一通，也能识别到违法的问题给与警告。国内外大厂包括谷歌百度也立马宣称即将推出模仿版。ChatGPT以一人之力带火AIGC（AI自动生成）整个领域，其实ChatGPT本质就是AIGC的分支。相信2023年将是AIGC大放异彩的一年。

ChatGPT目前的局限性

ChatGPT给出的答案虽然看似权威，但总的来说还是基于大量文献学习的内容，所以有时候给出的答案虽然看似合理，但缺乏事实性。而且对逻辑推理目前处理的还不尽如人意。这也就限制了ChatGPT的应用场景不可能替代现有的权威问答网站或者某个领域的权威人士

ChatGPT能干什么

那ChatGPT到底能干什么？有人说能替代google，有人说能替代人工客服，也可能替代码农写代码，但我觉得这些还为时尚早，毕竟也才刚展露头角，还有很长的路要走。但作为一个工具或者个人助手还是很有可能的

和siri、微信等集成的私人助理

ChatGPT强大的语言理解能力能完成与人的流畅对话，并且能准确理解人的意图，那把理解到的意图利用siri等语音助手转化成指令去执行，那体验应该可以更上一个台阶了

日常创作工作的辅助工具

写代码可以用它找bug，图文创作的可以让它写文章，科普可以快速让它找答案，总之，无论你做什么，只要你需要就可以用它提升你创作的效率，而且输出很自然准确率很高

ChatGPT是怎么这么强大的

ChatGPT如此惊艳的表现，让很多技术人员也对她的原理充满了兴趣。这里也可以通俗的介绍一下

其实ChatGPT在当前技术领域并没有本质的革新，它依然是一个大模型，参数的量级在1750亿个，代表了这个模型具有丰富的表达能力。但是这么大的模型需要的训练数据非常多，大概在十亿以上的规模。如果采用传统的监督学习的方式标注出这么大量级的数据是非常耗时耗力效果也未必好。

ChatGPT引入了基于人类反馈的强化学习方法，将训练数据样本数量进行了压缩，这样就可以在小规模的标注样本数据集上完成训练。具体方法分为三步

第一步：利用人类标注的数据进行监督训练一个模型，称之为sft模型

首先设计一个prompt的数据集，prompt可以理解为提示或者问题，然后人工对这些prompt给出正确的答案，用标注好的数据对sft模型进行训练

第二步：训练强化学习需要的奖励模型，称之为rm模型

用第一步训练好的模型去做预测，并对几个训练好的不同sft模型预测的结果集进行人工排序，基于排序好的数据对rm模型进行训练

第三步：用训练好的SFT模型和RM模型进行强化学习

这一步不需要人工标注数据了，强化学习的初始化参数为之前两步训练后sft模型和rm模型的参数，并且训练出的结果由第二步rm模型的打分作为奖惩依据来更新模型的参数。这里需要额外说明的就是强化学习的目标函数包含之前的sft模型和rm模型，也就意味着强化学习在自身学习的同时也在不断更写迭代sft模型和rm模型的参数。经过修正过的sft模型和rm模型又反过来作用强化学习模型。经过循环不断地训练、微调，最终收敛完成训练

最后，在训练的同时构建多轮对话能力和未知问题拒绝和违法问题识别的能力，chatgpt就诞生了。

当然，这只是对ChatGPT的实现简单的概括，真实世界会非常复杂，所以自论文提出到最终面向大众将近过了一年的时间，其中的复杂程度和调试难度可想而知。

未来

现在ChatGPT已经成功走向了商用，而且Twitter和stack overflow惧怕ChatGPT的威胁已经对ChatGPT生成的回答进行了封禁。但这也恰恰说明了ChatGPT的影响力，相信国内外有实力的公司会相继推出近似版本。总之人类自然语言理解又上了一个新台阶，在ChatGPT的影响下一定会涌现出非常多的商业化产品，希望这些商业化产品能让世界变得更加美好，以后工作更简单，就业也更难了

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。