自现象级 AI 应用 ChatGPT 落地至今,作为应用技术商业化大国的中国,在短短半年内,对于这项能照耀未来的技术的商业化探索,堪称气象万千。

对于中国技术公司而言,若无一个类似 ChatGPT 应用的对标产品,可能难以显示其技术色彩。因此,但凡能数得上号的中国技术公司,截至目前,基本上都发布了各自的类 ChatGPT 应用。

5 月 6 日,中国式 ChatGPT 再添新成员:科大讯飞发布星火认知大模型和多行业场景商业应用的 AI 能力。5 月 8 日,科大讯飞股价涨停,为 3 月 23 日以来首次。

推动中国经济繁荣的改革开放,秉持的实用主义原则,其影响也波及了中国科技公司对于新技术的主流态度:新技术能否创造出确定的应用商业价值。有此指导思想,故其对底层技术的热情很少像对新技术的商业应用那样高涨。

但这不等于,中国技术公司缺乏底层技术探索和积累。他们只是需要有人给出这些底层技术极具商业价值想象空间的路径,然后,其应用这种底层创新技术的商业探索落地速度之快,举世无双。

科大讯飞作为一家以 NLP 语音技术立足的技术公司,自然也不例外——任何技术公司或文化现象,无不受宏观行业环境和历史传统影响。

那么,讯飞星火认知大模型的技术探索是什么?AI 商业价值怎样落地?讯飞 GPT 技术能力如何与之业务匹配?强弱如何?未来这种能力怎样演进?

开放平台:如虎添翼?

5 月 6 日,科大讯飞董事长刘庆峰发布星火认知大模型,并同步发布讯飞 AI 学习机、讯飞听见、讯飞智能办公本、讯飞智慧驾舱、讯飞开放平台等 5 项应用成果。其中,讯飞开放平台是构成科大讯飞商业(技术和产业)护城河的关键要件。

科大讯飞 2022 年财报显示,讯飞开放平台的毛利率为 28.23%,同比提升 7.02 个百分点。在科大讯飞四大业务板块中毛利提升速度最快、升幅最大。

以 AI 技术为基石,通过 ” 平台 + 赛道 ” 市场战略,凭借 ” 算法和数据 ” 核心技术优势,科大讯飞在 C 端、B 端和 G 端的 AI 领域攻城略地。

据科大讯飞联合创始人、高级副总裁江涛解释,” 平台 + 赛道 “,这个 ” 平台 “,即讯飞开放平台:” 星火认知大模型对讯飞开放平台极具意义。”

2021 年 10 月 25 日,刘庆峰在合肥发布 ” 科大讯飞开放平台 2.0 战略 “。

与 1.0 相比,讯飞平台 2.0 战略新增 ” 行业龙头 “,构成新的 ” 讯飞 + 行业龙头 + 开发者 ” 三维结构,目的是通过讯飞开放技术平台和工具,结合行业特性和数据,形成数字底座,再通过开发者将数字底座与特定的软硬件环境做匹配,最终形成完整的行业 AI 数字解决方案。

在这个过程中,开发者数量决定整个开放平台的垂类应用丰富性,开放平台的底层技术能力,决定开发者能用具备怎样强悍能力的技术工具,去开发垂类应用;而行业龙头带动的行业合作伙伴,用 RPA(机器人流程自动化:Robotic Process Automation)等工具开发行业应用的易用性和有效性,也与开放平台的工具能力密切相关。

若对 ” 讯飞 + 行业龙头 + 开发者 ” 三维结构做个解构,即由科大讯飞提供 AI 技术、大数据平台和相关深度学习训练算法工具,行业龙头在此基础上提供场景、专家知识和各类业务模型。之后,由双方通过贯穿 AI 算法的业务模型形成数字基线底座。

有了基线底座,讯飞开放平台行业开发伙伴,可以做具体场景匹配软硬件环境的技术应用工具,完善和做各种流程开发,最终形成具体的可应用的行业解决方案。

因此,一旦讯飞星火认知大模型集成到开放平台,则平台工具能力之提升幅度,将难以想象。江涛说,” 大模型进一步集成到开放平台后会带来整个开放平台能力的跃升,我们会进一步地赋能这些开放平台的合作伙伴。”

刘庆峰在 5 月 6 日披露,讯飞开放平台实名认证的开发者数量,已经突破 400 万,行业合作伙伴突破 500 万大关。2021 年 10 月 25 日,实名注册开发者数量是 265 万。

讯飞星火认知大模型的底层能力,怎样赋能讯飞开放平台的行业伙伴?刘庆峰说,讯飞将开放插件。” 合作伙伴、开发者可分享这些插件,以深入至大模型。这样用星火大模型就可以直接用到这些插件能力。”

随着应用的深入,可集成越来越多的专业插件:对行业插件安全性有要求的 B 端用户,可用星火认知大模型做富有针对功能的插件,以供其内部使用或做平台共享。这是科大讯飞 To B 策略的体现:建立行业生态圈,共同繁荣整体行业。

刘庆峰透露,” 已有 36 个行业、超 3000 家企业跟我们达成了合作的明确意向。”

解构 “1+N” 的 AI 应用

美国 OpenAI 公司推出的 ChatGPT 应用,AI 技术名称是 GPT,而 “Chat” 则是应用手段或形式。通过 Transformer 架构做 AI 技术开发,应用终端的 AI 能力源自底层 AI 技术对语义大模型(LLM)的训练。

概括而言,OpenAI 的 ChatGPT-3.5(2022 年 12 月推出的初代版),就是用 Problem Models(问题模型)加上 1750 亿个参数 / 节点,以之为基础提供巨量、有监督的学习数据,借助 Transformer 架构,” 投喂 ” 给 AI 语义训练大模型(LLM),做出的 AI 应用效果。

科大讯飞星火认知大模型,作用相当于 OpenAI 训练语义大模型(LLM)做出的 AI 应用效果集成和问题模型的集合。这在 2022 年 12 月 15 日启动的科大讯飞认知大模型专项攻关中,属于 “1”,而这个 “1” 落地的行业垂直领域或场景,被概括为 “N”。

因此,科大讯飞的类 ChatGPT 应用,结构就是 “1+N”。”1″ 是指星火认知大模型(可认为是通用 AI 技术底座),”N” 即落地多场景。若将之从商业角度做个命名,则可称为 “1+N” 认知智能大模型技术及应用战略。

其中,通用认知 AI 技术底座包括七项能力:多层次跨语种语义理解、多风格多任务长文本生成、多模态输入和表达能力、多功能多语言代码能力、多题型可解析数学能力、情境式思维链逻辑推理和泛领域开放式知识问答。

从商业价值角度,通过通过 AI 技术底座,科大讯飞为各个行业设计行业技术工具,并且以之构建 AI 应用样板间,最终 1 和 N 形成飞轮效应,实现商业价值的正向循环。

科大讯飞主要业务分产品有四个类型:即教育产品和服务、开放平台、信息工程和运营商相关业务。

星火认知大模型除了集成至讯飞开放平台,另外重要的一极是使能讯飞软件和硬件产品,以提升或重构讯飞的业务竞争力。

这些软硬件产品所属场景即处于 “1+N” 中的 “N”。5 月 6 日,科大讯飞推出星火认知大模型的四大行业应用成果:教育、办公、汽车和数字员工。

其中,教育和办公方面,属于人机交互。讯飞主要落地形式是软硬件,如学习机、办公本或语音遥控器,以及讯飞听见(专业级语音转文字效率工具)。江涛说,” 我们相信大模型的智慧涌现一定会带来下一代人机交互的新的入口。”

科大讯飞 2022 年财报显示,教育产品毛利率是 49.39%,在科大讯飞营收中的占比 32.74%,均为最高。

与 To C 相比,市场更关注讯飞医疗中的 AI 辅助诊疗,这块属于 To B 场景。据江涛透露,科大讯飞的智医助理迄今为止已做了 5.8 亿人次的 AI 辅诊,中国 300 多个区县的基层医疗机构的医生正在使用。

一旦讯飞医疗大模型推出,将更好地帮助医生提高病历质检、辅助诊断、方案推荐和用药管理等方面的水平。这属于 B 端中的 C 端应用,比如也能做个人保健咨询、健康管理和疾病管理。

但在 5 月 6 日,讯飞医疗大模型没有推出。对此,刘庆峰表示,” 因为需要相关法规,所以我们应对医疗专业领域模型更加谨慎。下一步我们会跟医疗机构合作,通用大模型也会集成医疗专业知识。”

刘庆峰透露,科大讯飞将会在今年讯飞 1024 开发者大会上正式对外发布医疗大模型。

历史积累和未来目标

虽然科大讯飞的 “1+N” 认知大模型专项攻关于 2022 年 12 月 25 日启动,但讯飞在 AI 技术领域的技术积累已有十多年历史。

从 AI 技术发展路径看,ChatGPT 也不是最新的技术成果。在理论上,ChatGPT 没有更多创建——核心技术在 2017 年就已出现:由谷歌创建的 Transformer 神经网络架构,其革命性在于能让 AI” 听懂人话 “。

科大讯飞星火认知大模型的底层 AI 技术起始源点,始于 2011 年成立的语音及语言信息处理国家工程实验室。这比 ChatGPT 应用的底层 AI 核心技术 “Transformer 神经网络架构 ” 早了整整 6 年。

语音及语言信息处理在大模型中的作用是什么?刘庆峰说,” 讯飞星火认知大模型本质上是一次对话式通用智慧的涌现,语音和语言的核心能力是基础条件,科大讯飞是中国(该领域)的国家队。”

讯飞取得和谷歌一样的认识,也就是让 AI” 听懂 ” 人话的时间节点是 2014 年,也比谷歌早 3 年。

那年,科大讯飞推出讯飞超脑计划,明确提出要让机器像人一样,具备能理解会思考的能力。2022 年 1 月,刘庆峰在科大讯飞年度总结计划大会上,宣布讯飞超脑 2030 计划:要让懂知识、会学习、能进化的通用人工智能技术,以机器人的实体形态或虚拟形态,进入每个家庭。

坦率地说,在 OpenAI 推出 ChatGPT 应用前,科大讯飞在 AI 领域的技术探索和落地成果相对 ” 碎片 ” ——这也是中国技术公司的 ” 共性 ” ——缺乏像 ChatGPT 这样的 AI 能力验证应用体系。ChatGPT 不仅仅是个 AI 应用,也是一个商业化体系应用的象征性标杆。

因此,OpenAI 实际上起的是验证 AI 技术商业价值的作用,以及引领 AI 应用方向。一旦方向确立,大模型的海量场景应用验证得以点亮,素有积累但找不到大规模有效价值应用明确方向的中国技术公司,其类 ChatGPT 技术开发和场景应用激情,就如脱缰野马,不可遏制。

在 2017 年这个关键节点,科大讯飞的 AI 技术积累到什么程度?他们让机器在全球首次通过国家执业医师资格考试综合笔试测试,测试成绩超过 96.3% 参加考试的医生。

两年后 2019 年,在斯坦福大学发起的国际著名的 SQUAD 机器阅读理解比赛中,科大讯飞让机器在英文阅读理解中首次超过人类平均水平;2022 年,在艾伦研究院组织的 Open Book QA 知识推理比赛中,讯飞机器单模型首次超过人类平均水平。

或许意识到体系对于 AI” 听懂人话 ” 技术目标达成的重要性,科大讯飞在 5 月 6 日也推出了 AI 应用体系,主要用于评测 AI 技术能力。目前,这项体系已覆盖 7 大类、481 个细分任务类型的通用认知大模型评测。

比如,AI 技术到底发展到什么程度?下一个发展应该往哪里走?技术距离实用是不是已经达标?还有哪些工作要做?

据刘庆峰介绍,目前讯飞星火大模型在文本生成、知识问答、数学能力三项能力已超越 ChatGPT,” 英文如果满分以 5 分计算,Chat GPT 现在是 4.48 分,我们已达到 4.29 分。” 据刘庆峰透露,” 当前讯飞星火认知大模型的文本生成、知识问答和数学能力,已超过 ChatGPT。”

根据既定计划,到今年 10 月底,讯飞星火认知大模型目标中文能力超过 Chat GPT 的水平,英文能力相当。