最近在UX行业新闻中,出现了一种趋势,利用ChatGPT来生成设计内容、进行用户研究和创建引人注目的文案等工作。虽然这些进展可以提高设计师的体验和生产力,但我们的主要关注点仍然是「用户」本身,确保ChatGPT或类似技术的任何实施都真正改善了用户体验,并使他们更接近他们所寻求的价值。
在书籍《Innovare con il Design: Il Caso del Settore dell’Illuminazione in Italia》(F. Zurlo等人,2002)中,“创新”被定义为:与现有类似产品相比的积极差异。这种差异主要基于解决用户的问题。我们可以说,「有用性」是定义产品、功能、技术是否创新的基本条件。显然,在纯研究领域中有许多创新,这些创新对用户没有直接影响,但是每一项进行的研究,最终都应该为某些人解决问题。否则,它的目的是什么?
因此,对于像ChatGPT这样的技术,我认为关键问题是:ChatGPT或类似技术如何(以及应用在哪里)可以改善用户体验,引入积极差异,使用户更接近他们所寻求的价值?
ChatGPT和界面
从用户界面的角度来看,这是UX专业人员最感兴趣的问题。问题是:与现有的界面类型相比,ChatGPT可以带来什么好处?在什么意义上可以将其定义为创新?
ChatGPT是一个很好的对话式界面的例子,对话式界面——“允许人们像与真人交互一样与软件、应用程序和机器人交互。使用自然语言输入或语音输入,他们可以轻松完成某些任务。”(《什么是对话式界面?》 By Jesse Martin,Zendesk Blog)
↑ Her的剧照
过去,对话式界面存在两种形式:
Chatbots 聊天机器人:这些利用预定义的答案和路径回答常见问题,通常用于故障排除和客户支持场景。
Voice Assistants 语音助手:它们允许用户通过自然语音与界面交互,从而执行常见的预定义任务。甚至在“Alexa”等受欢迎语音助手出现之前,早期的手机就具备启动电话的语音命令功能。如今,这种交互可能性已经集成到现代智能手表、车载信息娱乐系统和智能电视中。
尽管先前的对话式界面应用有些有限,并且常常令用户失望,但是像ChatGPT这样的技术现在承诺将这种交互方式提升到一个新的水平。事实上,与有限的脚本方法不同,ChatGPT可以基于领域知识生成响应,类似于真人的回应。
由于这种对话交互的重大进展,我们是否仍需要视觉界面?
在文章《AI是60年来第一个新UI范例(AI Is First New UI Paradigm in 60 Years)》中,Jakub Nielsen 本人将 ChatGPT 和类似的AI技术引入的交互定义为“基于意图的结果规范(intent-based outcome specification)”,这代表了新兴的交互模型。在这个模型中,用户向计算机传达期望的结果,而无需指定实现它的步骤。这种方法可以在整个数字应用程序的各个方面发挥极大的作用,包括电子邮件客户端、在线银行、信息网站、专业的基于云的软件、社交网络平台、互联网浏览器和搜索引擎。另一方面,视觉界面被归类为第二范式中的“基于命令的交互范式(command-based interaction paradigm)”。
那么,视觉界面是否仍将是操作这些系统的必要条件,还是一切会变得“对话式”?
用户界面是用户和机器之间的介质,界面越沉浸式,就越易于使用。沉浸式界面模仿人类的行为、手势、交互模式和心理模型,与人类自然行为相一致,需要很少或根本不需要学习。它们提供即时、以用户为中心、直观的体验。(它们之所以被定义为沉浸式,正是因为用户感觉与机器之间没有断层感。就像是在同一个环境中,用户感觉自己沉浸在系统中。最好的沉浸式示例是虚拟现实,但这个概念适用于描述每个感觉自然且减少用户感知系统“距离”的界面)。
界面与任务
如果我们思考一下,可以认为视觉界面是为了模仿人类交互而设计的不完美方式。我们可以将每个视觉界面想象为用户和系统之间的理想对话。系统要求用户提供特定的输入,同时提供指导和解释,说明这些输入是什么,如何正确格式化以便系统理解,它们可以在哪里找到,将用于什么等等。然后,系统向用户提供(希望)预期的输出。
现在,让我们考虑用户在数字系统中通常执行的三个任务:
1. 【Form 表单填写】例如,开设银行账户:
这个任务很复杂,需要用户了解银行网站的结构并找到开始过程所需的内容。系统需要简单的输入,如姓名、姓氏等,但也需要更复杂的信息,如身份证或其他文档中的数据需要上传。
这与在实体银行分行进行的对话并没有太大区别,其中客户或潜在客户想要开设银行账户,与知道程序和需要提供的信息的出纳员进行交互。最终颁发了有价值的输出(银行账户)。
UX设计专业人员现在通常使用称为“向导”或“指导路径”的东西来将复杂的任务分解为较小的任务,并逐步指导用户进行所需的输入。向导本质上是数字版的出纳员,在正确的顺序中要求客户提供信息和文档。
然而,想象一下如果我们可以利用ChatGPT或其他基于AI的对话式界面来完成这个任务。我们可以用简单的语言询问我们需要什么,并让系统引导我们。
对于这种复杂的任务,向导仍然是最有效的界面吗?虽然基于AI的交互(对话式界面)有时可能作为界面表现得更好,但是精心设计的向导(视觉界面)仍然具有它的优势。
2. 【Dashboard 仪表盘数据监测】例如,监控新开设账户的交易:
在这第二种情况中,我们想跟踪银行账户的余额趋势,我们存了多少钱,我们花了最多的天数、为什么花了这么多,以及总体的消费趋势。
ChatGPT是否会为这项任务提供更好的界面?可能不会。这些需要比较和理解大局的任务,最好使用视觉界面、图表和强大的表示方法,可以进行多重解释。
3. 【FTP 信息查看】例如,查看发车时间:
假设我们正在准备上班,想知道下一班公交车在我们的站点的时间,以便我们赶上它。目前,我们有几种方法可以获取这些信息,例如在公共交通网站上查看「时刻表」或使用Google地图等应用程序。同样,我们可以使用公共交通应用程序检索此信息。
ChatGPT是否比我们目前使用的界面表现更好?
在这种情况下,ChatGPT可能比常规界面提供更多的价值。它可以直接回答特定的问题,执行检索信息的任务,并提供精确的输出。
对话式与视觉式,何时使用何种,何时使用两种结合。
在这三个场景中,我们看到了不同类型的用户任务可能会或可能不会从与Chat GPT和其他AI系统对话式交互中受益。试图概括一下,我们可以说:
像设置、入职、配置和每当系统需要复杂和结构化的输入时,这些输入难以理解和消化,都受益于良好的对话式界面。
然而,需要解释复杂输出(例如观察图表以识别趋势并做出决策,检查电子邮件,监视社交媒体信息)的任务仍需要具有良好UX设计原则的视觉界面。
最终,需要精确和有限输出的任务,例如知道公交车的到达时间,检查明天是否会下雨,或通过搜索引擎搜索特定信息,当ChatGPT处理体验时效果更好,因为它可以模仿真实的人类并使用户达到所需信息的路径更短。
如果考虑解决任务所涉及的输入和输出数量,我们可以总结如下:
需要大量输入:对话式界面效果更好。
需要较少的输入(或非常清晰的顺序):视觉界面效果更好。
产生大量输出:视觉界面效果更好。
产生较少输出:对话式界面效果更好。
值得一提的是,对话式界面和视觉界面可以(并且应该)共存,以利用它们各自的优势来增强用户体验。
举个例子
Original Wireframe created with the software Figma and the library Wireframe Kit by André Moura. It can be utilised without authorisation, provided proper attribution is given to the source (this article and / or my name and link to my Linkedin profile).让我们再次考虑开设银行账户的情境:
与其在银行网站上搜索开户选项,直接通过对话式界面表明我们开户的意图可能更具沉浸感:
在选择最符合我们需求和预算的账户时,视觉界面比对话界面更好,因为它能够进行比较和分析。
一旦进程开始,向导式界面证明是最有效的,特别是用于收集简单输入:
然而,当事情变得更加复杂时,提供“拟人化”的助手可以极大地增强易用性:
当我们需要监控我们的财务状况时,通过视觉界面呈现的图表提供了完美的表示,再次允许快速比较和分析:
但是,当我们有特定问题时,没有什么比一个LLM人工智能(以对话式界面呈现)更好的了:
我可以直接问Ta,“我上个月花了多少钱?”
结论
完全了解ChatGPT和LLM的潜力仍为时尚早,因此开始实验和探索这些技术至关重要。希望本文能为UX和产品专业人员确定何时何地有效地利用这些技术进行用户界面设计,以为用户提供真正的价值。它应该有助于了解如何将这些技术与传统的视觉界面结合使用,并确定哪种方法最适合,基于任务类型和所需的输入和生成的输出。
再次引用J·尼尔森的话,“未来的AI系统可能会具有混合用户界面,结合了基于意图和基于命令的界面元素,同时仍保留许多GUI元素。”
最大的UX挑战现在在于了解如何正确设计这些混合体验。