图片来源 @视觉中国
文|王吉伟
生成式 AI 变革应用交互,UI 界面即将消失 RPA 的未来在哪里?
生成式 AI 等技术变革人机交互,UI 界面没有了还需要 RPA 吗?
AIGC 凶猛生成式 AI 要革掉 UI 自动化的老命?聊聊人工智能重塑的 RPA
构建人机交互自动化层搭载 AI 模型层,RPA 不会轻易被 AI 取代
基于 AI 构建的当代 RPA,在生成式 AI 影响下的生命周期还有多长?
生成式 AI 带来技术颠覆,连接系统的过渡性技术 RPA 何时消亡?
AIGC 背后的生成式 AI 火爆以后,AI 对各行业的冲击是显而易见的。
仅仅是一个 Midjourney,就能替代原画设计、摄影师、模特等多种职业,何况还有 Stable Diffusion、DALL-E 等开源模型,以及更多科技巨头推出的自有 AI 绘图模型。
现在,AI 绘画已经在设计、电商、艺术等领域掀起了滔天巨浪,关于效率、成本、优化、裁员等声音更是不绝于耳。
如果再加上可以生成多种形式内容的 ChatGPT,生成式 AI 为各行业带来的震撼难以用言语形容。
各行业喜欢探索的研究者们,更是把这两个最前沿的 AI 工具玩出了花样,各种 Prompt 输出、各种角色调教、各种喂资料之后的反哺,带来的是这两个工具在各行业各场景应用后的效果与效率的鲜明对比。
在体验了 ChatGPT 和 Midjourney 之后,企业大佬们的表情是丰富的,更多的是集震撼、惊喜、担忧等情绪于一体。仅仅两个 AI 工具,就让他们对生成式 AI 佩服得五体投地。
于是在一片 ” 啥也别说了,赶快用吧 ” 的声音中,”ChatGPT+Midjourney+ 相应插件 ” 的工具组合似乎成了企业对于前沿技术应用的 ” 新标配 “。
每月一百多美元付费订阅带来的是效率的翻倍增长与成本的急剧下降,由不得大家不去尝试。国内 SaaS 多少年没培养起来的用户订阅习惯,被这两个 AI 应用程序一下就搞定了。
尤其是在 ChatGPT 的插件商店推出以后,在官方插件和第三方插件的助力之下,ChatGPT 冲破了网络束缚并且能够直接生成各种应用程序,易用性和适应性得到全方位提升。全新的交互和更多的功能让一众开发者高呼,AI 技术重构系统和人机交互的时代已然来临。
自从 ChatGPT 推出以来,OpenAI 的每一个动作都会造成行业巨震。偏偏 OpenAI 又是那么激进,十八般兵器和奇特招数一样又一样的连环使出。以至于马斯克都与千名科技人士签署公开信,呼吁暂停训练比 GPT-4 更强大的 AI 系统。就连美国科技伦理组织 CAIDP,也要求禁止 OpenAI 发布新的商业版 GPT-4。
在应用端感受到 ChatGPT 等生成式 AI 带来巨变的同时,技术端也无时无刻不在讨论它对技术、架构、产品、生态等带来的一系列影响,甚至会导致一些技术与产品的快速消亡。
RPA 行业也是如此。对于这个基于抓取 UI 界面的 UI 自动化软件来说,如果未来生成式 AI 等技术所带来自然语言交互脱离了 UI 界面,RPA 又该何去何从?智能自动化以及超自动化又会受到什么影响?
本文,王吉伟频道就跟大家探讨这些。
UI 界面没有了还需要 RPA?
生成式 AI 的火爆,引起了全行业对人工智能的探讨。技术领域也不例外,如何用 AI 重构企业信息化架构和系统,包括各种软件未来的发展走向都是热门话题。
AI 对 RPA 的主要影响,落点于 API 自动化彻底取代 UI 自动化上。很简单的道理,以后基于自然语言的人机交互都不需要 UI 了,还需要用 RPA 去抓取吗?
在 API 接口与 UI 自动化的发展上,相当一部分人认为,当 API 接口的开发可以通过 AI 实现自动化后,API 接口的衔接自然也能通过 AI 自动化。
这就意味着,在接下来 AI 定义系统或者说大模型定义系统的时代,业态基础的逻辑改变了,就不再需要 RPA 这样的 Ui 自动化软件了。
简单地讲,接下来所有行业的企业数字化系统都面临着 AI 技术的架构重塑,目前的很多软件都要被新的基于 AI 技术及业务的逻辑所取代。
所以,微软宣布将 Copilot 引入到 Microsoft 365 后,在程序开发领域引起了巨大震动。
Microsoft 365 Copilot 相当于 OpenAI GPT 大语言模型 +Microsoft Graph+Microsoft 365。
Microsoft Graph 是 Microsoft 365 中通往数据和智能的网关 , 它提供统一的可编程模型,可用于访问 Microsoft 365、Windows 系统和企业移动性 + 安全性中的海量数据,利用 Microsoft Graph 中的大量数据针对与数百万名用户交互的组织和客户构建应用。
我们可以将 Microsoft Graph 看作 Microsoft 365 的 API 接口、数据存储传递窗口和云计算连接器,它可以实现 AI 大模型与办公应用的有效链接。
Microsoft 365 Copilot 对 RPA 的冲击是不言而喻的,我的朋友苏州邮储银行 RPA 创新实验室创始人、微软技术俱乐部(苏州)执行主席、AIGC 开放社区发起人潘淳认为:
微软在十年前开始布局的 Microsoft Graph,正是目前 Copilot 的核心之一,它与 GPT 形成了一种绝配。
从 Copilot 来看,以 Graph 为代表的 API+ 以 GPT 为代表的 AIGC+ 以 Power Fx(微软推出的类似 Excel 公式的低代码语言)为代表的 TOOLS,将会成为企业级应用软件的主要形态。
RPA 的核心逻辑是 action+ Designer,action 可以被 api/tools 替代,Designer 可以被 GPT 替代,这样基于 UI 抓取的 RPA 这种软件就没有存在的必要了。
从技术发展角度而言,王吉伟频道非常认同这个观点。毕竟 RPA 之所以会出现是因为大量组织无法使用 API 实现集成自动化,才会用 RPA 通过 UI 抓取实现更多的自动化。RPA 本身就是一种过渡性技术,对于已经存在 20 来年的纯 RPA 产品形态来说,这个时间已经足够长。
新技术的应用必然会淘汰旧技术,这个进程中有些产品因为过时而被抛弃。但另一方面,各种软件也会与时俱进。
以 RPA 来说,它在沉寂了十几年后重新焕发生命,正是因为融合了 AI 技术。RPA 厂商并不是一味的围绕 UI 自动化做文章,他们在用 AI 技术巩固 UI 抓取的同时,也在用低无代码等技术重构 RPA 产品架构与形态,并在 API 集成方面也下了很大功夫。
RPA 在 API 方面的进化
API(Application Program Interface)即应用程序接口,是为应用程序可用以与计算机操作系统交换信息和命令的标准集。它定义多个软件中介之间的交互,以及可以进行的调用(call)或请求(request)的种类,如何进行调用或发出请求,应使用的数据格式,应遵循的惯例等。
可以将 API 看作一种软件中介,允许多个应用程序相互通信。当你使用某 APP 发送即时消息或查看手机上的天气时,都在使用 API。
API 接口并不是新技术。2000 年左右开始,随着 ERP、CRM 等企业内部管理系统的普及,各类系统沉淀了海量的关联数据,基于早期的数据库和 http1.0 通信协议,API 开始在企业内部数据打通展露头角,系统集成进入 API 1.0 时代;2007 年前后随 web2.0 时代到来,进入 API 2.0 时代;2015 年后云服务主导了企业服务市场,进入了 API 3.0 时代。
现在,我们已经处于 API 3.0 的后时代。
过去只要提到 API,大部分人对它的基本印象就是价格高、难度大。曾经 Salesforce、SAP、Oracle 等厂商的 API 接口授权费用贵得吓人,一些老旧但不得不用的软件系统并没有 API,开发 API 更是个费钱费力费时但 ROI 不一定高的大型项目。
以前传统的集成自动化仅是现金流充沛的大型企业的专利,也逼迫着广大中小型企业不得不想其他办法替代基于 API 的自动化,能够实现 UI 自动化的 RPA 应需而生。
RPA 的主要功能是 UI 自动化,但 RPA 并不排斥 API 接口。比如 UiPath 在集成服务方面很早就推出的 integration service 功能,可以把很多套装软件的 API 集成进来,用户可以在同一个平台上既可以通过用户界面、也可以通过 API 去操控目标对象。
为了提升集成能力,UiPath 还在 2021 年就收购了 API 集成平台 Cloud Elements,这是一个可以拿来即用的套装成熟的软件,为 UiPath 带来了 200 个以上的常用的 connector(比如 Box、Gmail、Google Docs、Google Drive、Oracle NetSuite 等)。
UiPath 这个做法带动了一大批厂商探索 API 集成,而擅长 API 的厂商所打造的 RPA 产品优势便在于 API 自动化。
等到这几年超自动化(Hyerautomation)横空出世以后,很多厂商尤其是 RPA 厂商都引入了超自动化架构。超自动化是一个技术合集,用于为企业提供端到端的自动化服务。
正是因为它囊括几乎目前已知所有自动化相关的技术,才使得集成变得更加重要。API 能够提供更加稳定高效的自动化,但目前 UI 自动化也是不可或缺,所以超自动化平台更注重集成能力,或者说是同时集成 API 与 UI 的能力。
因此在 2022 年的魔力象限报告(MQ 报告)中,Gartner 预测到 2024 年,95% 的 RPA 供应商将通过 API 与 UI 集成提供自动化。包括集成供应商和大型软件供应商在内的更多 RPA 厂商,正在成功推广 API 优先的流程自动化方法。UI 抓取和 API 优先自动化,能够为客户提供更广泛的自动化能力。
这个数据,既让我们看到了 API 对于今后 RPA 产品的重要性,也体现了 API 与 UI 集成对于 RPA 的必要性。
2021 年开始,在大公司对于 API 的各种动作以及各种趋势报告的影响下,广大 RPA 厂商以及拥有 RPA 业务的相关厂商都在通过自研、收购以及生态合作等方式,积极布局各自的 UI 与 API 集成。
当然,之所以这样做是因为足够大的市场需求。
API 统一管理系统的进程
生成式 AI 对各行业的冲击很大,主要表现在其对业务流程的颠覆上。很多业务流程由原来的多个节点直接变为更少的节点,多种业务场景业务节点的减少,意味着原来的自动化流程也不需要了,RPA 等应用场景也会随着减少。
并且如前文所讲,以 ChatGPT 等为代表的生成式 AI 会在接下来重构企业技术架构,基于 AI 模型层的各种自动化应用会取代现有的 RPA,未来 AI 操作系统所带来的新型人机交互会替代现在所有的 UI 交互。
但这个进程不会那么快。企业基于 RPA、低代码、BI、iBPMS、BPA 等建立起来的复杂自动化流程不会轻易被生成式 AI 锁取代,并且短期内生成式 AI 还无法替代 ERP、CRM、HCM 等企业运营的核心数字化系统。
RPA 的兴起,很大程度在于它的连接功能与粘结特性上。企业经过多年构建起来的复杂、异构的业务与数据的管理系统,目前而言想要完全通过 API 来解决集成与自动化问题是很难的。通常一家中型企业内部的应用系统就有 100 多个,大型企业的应用甚至多达 1000 个以上,不可能所有应用都有 API 接口。
另一方面,企业更会衡量开发 API 以及投入一项技术的 ROI,他们会在运营需求、资金投入、开发周期、实施效果等多方面进行考量。如果 RPA 能够以更便宜的价格和更稳定运行解决这个问题,至少现在不用考虑开发 API 了。并且对于大部分中小型企业而言,一些 RPA 产品所提供的 API 服务已经足够满足需求。
而现在 RPA 厂商所提供的企业级端到端自动化解决方案,已经足够稳定。因此,在系统集成与自动化这件事上,目前大部分企业都是 API+UI 的融合解决方案。这也是为什么 Gartner 预测今后 RPA 厂商都会通过 API 与 UI 集成向用户提供自动化的原因,它来自于用户切实的需求。
这个需求所造就的市场有多大?可以看看下面的数据。
Gartner 预测,到 2022 年,全球 90% 的大型组织将以某种形式采用 RPA,他们希望通过弹性和可扩展性,对关键业务流程进行数字化赋能,同时重新分配人力资源保持充足的劳动力。到 2024 年,大型组织现有 RPA 产品组合的容量将增加两倍。
在另一份报告中,Gartner 预测,到 2024 年,组织通过超级自动化将降低 30% 的运营成本。到 2025 年,超级自动化市场规模将达到 8600 亿美元,年复合增长率为 12.3%。
这两组数据中,都能看到 RPA 的身影,同时也展示了未来几年 RPA 的市场情况。
因此,从应用市场来看,即便现在的 API 技术越来成熟,对于已经成型的超自动化大市场,想要彻底取代 UI 自动化或者 RPA 实现应用迭代也需要一段时间,往后看几年内实现的可能性并不大。
所以,王吉伟频道认为,在在未来至少 5 年或者更长的时间里,大部分企业的数字化系统都会是 UI 界面与基于 API 的自然语言交互并行的状态。
人机交互自动化层
从人机交互的角度而言,自从更简单的自动化技术出现后,原有的基于 API 的系统集成,在 RPA 等流程自动化的连接之下,人机之间已经多了一个基于自动化的人机交互层。
广大组织尤其是欧美企业已将 RPA、低代码、BPA、BPM 等软件应用通过 UI、API、iPaaS 以及更多云技术与各种企业管理软件的嵌入、集成、连接和融合,打造了一个存在于 PaaS 和 SaaS 之间包括业务中台的人机互动自动化操作层,现在超自动化技术架构的影响下可以称之为超自动化层。
在自动化优先思维的影响之下,现在欧美大部分企业的应用是基于自动化构建的,即让每个应用都具备自动化执行的能力以及自动化创建各种应用,自动化基因充斥于程序创建、应用与维护的全生命周期。就像微软、谷歌等推出的集成 RPA 工具的低代码平台,目的就是让自动化遍及业务流程从创建到执行的各个角落。
让自动化充斥于每个应用,显然对于业务流程自动化有着莫大的助力,更便于广大组织基于业务流程优化实现数字化转型。现在,国内更多的组织同样也已意识到自动化思维以及自动化层的重要性,正在通过引入超自动化、RPA 卓越中心等构建与巩固其自动化操作层。
看到这里,大家应该已经意识到,RPA 或者说智能自动化所做的连接的事情,目前而言生成式 AI 是无法替代的。而整个人机交互自动化层,也不是生成式 AI 都能实现的。至少在 API+UI 所构成的自动化层彻底被 API 取代之前,RPA 这个物种不会消失。
同时从投入产出而言,与正在兴起的生成式 AI 技术相比,更成熟的 RPA 技术仍旧是更简单且成本更低的业务流程自动化解决方案,更易于本地部署,也不需要微调 AI 模型,更适合于广大中小型企业。
此外,目前生成式 AI 所表现出的不稳定性以及无法解决的版权等问题,也使得更多企业还处在观望之中,不敢大举引入。
另一方面,RPA 也一直在与时俱进。
现在国外大部分 RPA 产品都已经集成了 GPT,有的厂商也已经推出基于其他大模型的插件,国内厂商也已经有官宣集成 GPT 以及文心一言的。这意味着,引入 RPA 技术就可以同时部署两种技术。
目前 RPA 与 ChatGPT 协同应用的场景之一,就是通过与 ChatGPT 交互调动自动化层的运作,这是一种将两者结合的直接有效的解决方案。
已经有很多案例证明,生成式 AI 与 RPA 协同是企业用于提升效率的最佳方案。融合生成式 AI 技术的 RPA,也能让广大企业能够以更简单的方式和成本去使用这些技术。
通过与各种人工智能技术的融合,现在的 RPA 也早已不是曾经的 UI 自动化工具。
技术成熟度曲线上的生命周期
从 Gartner 技术成熟度曲线,也能看出基于 RPA 的智能自动化未来发展的一些端倪。
下图是 2022 年人工智能技术成熟度曲线。我们可以看到,生成式 AI 已经进入曲线的第二阶段期望膨胀期,距离生产成熟期需要的时间是 2-5 年。
虽然这个曲线没有出现 RPA 以及超自动化,但我们可以从智能机器人(Smart Robot)、自然语言处理(natural langugge processing)、AI 云服务(AI clound services)、深度学习(deep learning)、智能应用程序(intelligent applications)等技术中看到它们的身影。其中智能机器人处于第二阶段,技术成熟期为 5-10 年,比生成式 AI 的技术成熟期还要长,说明这项技术仍然会有很多的技术融合以及变数在其中。
融合 AI 技术的 RPA 可以算是智能应用程度,同时它也是创造智能应用程度的平台。智能应用程序则处于第四阶段的稳步爬升恢复期,意味着它已经受住市场考验,确实是市场需要的技术。
至于其他几项技术,超自动化已经包含了它们。这些技术目前都处于第三阶段泡沫破裂低谷期,技术成熟期都是 2-5 年。通常而言,多次出现于曲线的技术越处于后面的阶段代表应用时间也越长,而期望值下降也是因为企业已经引入相关技术,大家对此早已司空见惯,但也意味着更大的市场渗透率。
人工智能技术成熟度曲线,反映出了与 AI 技术融合的 RPA、智能自动化、超自动化等更长的生命周期。这也意味着,API+ 生成式 AI+tools 可能不会在短短几年内取代基于 RPA 的自动化。
当然,还有一个重要的原因在于,在 AI 技术取得突破的这几年,RPA 的进化迭代速度也是无比的快。
人工智能重构的 RPA
Gartner 曾有一个预测数据,到 2022 年,部署机器人流程自动化的组织中有 65% 将引入人工智能,包括机器学习和自然语言处理算法。
现在看来,广大组织对于 AI 技术要热情得多。
王吉伟频道多次说过,近几年 RPA 之所以会火爆,是因为它融合了人工智能技术。当代的 RPA,其实已经不算是纯 UI 自动化工具,AI 技术的引入改变 RPA 的产品逻辑。
比如 NLP 和 OCR 的应用就让 RPA 的应用场景大大增加,而 IDP 的应用的则让 RPA 对文档的理解与提取能力翻了数倍。
尤其是人工智能技术起家的 AI 厂商,他们通过从 AI 技术角度考虑 RPA 产品的技术架构、产品形态以及未来走向,就会有一些创新且别致的 RPA 产品走出来。
以国内 RPA 厂商为例,比如有些厂商会在产品架构中都加入了一个 AI 能力产品,在来也科技这个产品叫作 UiBot Mage,在弘玑 Cyclone 这个产品叫 AI 技能引擎,很多厂商亦有同类产品。
这类产品一般是构建定制化 AI 能力的工作台,集数据处理、数据标注、模型开发、训练及发布于一体,用于联动 RPA 以让其更加智能。
有的厂商,已经用 AI 技术重塑 RPA 产品架构。比如实在智能推出的基于智能屏幕语义理解技术的实在 RPA 6.6.0 ,进一步实现了 RPA 的人人可用。
还有些 RPA 产品,开始构建产品时就是基于 AI 以及 API 技术去做的。比如容智信息的 0 代码 RPA 就是基于 AI 技术实现的,还有自然机器人所打造的 AutoPaaS 模式产品,也是在人工智能以及融合 API 技术的基础上实现的。
现在的 RPA 产品,基本都采用了超自动化架构,因此产品矩阵都会包含对话机器人、流程挖掘等产品。这两类产品同样都是 AI 技术的产物,没有 AI 就没有现在相对完备的产品形态。
超自动化作为包含 RPA、低代码开发、流程挖掘、OCR、NLP 等在内的技术合集,将多种技术与产品融合为一体服务用户。通过集成 API 和 UI,融合各种技术为用户提供更加稳定高效的端到端自动化,目前而言所包含的每一种产品都一定程度上应用了 AI 技术,或者本身就是在 AI 技术基础之上构建的。
超自动化是一个可以容纳任何与 RPA 相关联技术的技术合集,所以生成式 AI 火爆以后,RPA 厂商们都迅速引入了这项技术。
王吉伟频道(id:jiwei1122)之前有篇文章介绍了海外 RPA 产品引入 ChatGPT 的情况,就在前两周又有 6 家厂商引入的生成式 AI 技术。其中国内几家厂商,九科信息官宣了集成 ChatGPT,影刀则引入了文心一言,达观数据则正在研发自己的 AI 大模型 ” 曹植 ” 系统。
某种程度上,引入生成式 AI 或者自研 AI 大模型,RPA 也成了 AI 模型层上的产品。
生成式 AI 所带来的更直接的自动化和灵活性,正好可以弥补基于 RPA 自动化的不足,同时可以通过自然语言以及生成数据助力 RPA 更高效的优化业务流程,两者相辅相成,可以为广大组织提供更直接、高效、便利的流程自动化。
这些都在表明,当代 RPA 属于融合 AI 的自动化新物种,从发展开始 AI 就在不断对其进行重构、改变和优化。
后记:RPA 的未来在哪里?
RPA 与 AI 的技术融合,造就了今天的智能自动化与超自动化。在 AI 发展的同时,RPA 也在持续进化。
基于 RPA 的智能自动化已经成为企业系统软件之一,由超自动化所打造的人机交互自动化层将会成为组织运营的数字化主体,未来所有技术与软件都会在这个自动化层上衍生与发展,包括生成式 AI 技术,以及未来更多的新技术。
在更多 AI 技术的加持之下,RPA 会进化成什么样,现在来看仍是个未知数。经过这几年的发展,如今在主打超自动化厂商的身上,RPA 的标签已经逐渐淡化了。可能未来 5-10 年,RPA 会完成它的使命,而 RPA 厂商也将进化或者转型成为更加智能的自动化厂商抑或其他。
其实欢换个角度来看,RPA 也就是智能自动化或者超自动化的切入点,它仅是广大厂商进入自动化领域的一个入口罢了。相对于未来自动化的星辰大海,RPA 仅是自动化发展进程中的一颗微小星辰。
RPA 终究会消亡,但自动化将却是人类持续追逐的目标。
某种程度上,自动化寄生于懒惰,而懒惰正是人性七宗罪之一。所以,有人的地方就会有江湖,而有江湖的地方就不会缺少自动化。
未来 AI 无处不在的时代,现在流行的大部分技术和产品都会被贴上一个 ” 过渡性 ” 标签,都会因被取代而消亡。
唯自动化,永久长存。
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体 App