站长之家(ChinaZ.com) 6月5日消息:继百度的「文心一言」、商汤的「日日新 SenseNova」大模型体系,以及阿里巴巴的「通义千问」等之后,华为也加入 AI 大模型的行列。
据钛媒体从华为内部获悉,华为公司将发布一款直接对标 ChatGPT 的多模态千亿级大模型产品,名为「盘古 Chat」。预计华为盘古 Chat 将于今年 7 月 7 日举行的华为云开发者大会(HDC.Cloud 2023)上对外发布以及内测,产品主要面向 To B/G 政企端客户。
在 2020 年 11 月,盘古大模型在华为云内部立项成功,也完成了与合作伙伴、高校的合作搭建。在开始打造盘古大模型的时候,团队确立了三项最关键的核心设计原则:一是模型要大,可以吸收海量数据;二是网络结构要强,能够真正发挥出模型的性能;三是要具有优秀的泛化能力,可以真正落地到各行各业的工作场景。
根据华为公布的一份论文数据显示,华为盘古 PanGu-Σ大模型参数最多为 1.085 万亿,基于华为自研 AI 计算框架 MindSpore 开发。消息指出整体而言,PanGu-Σ大模型在对话方面可能已接近 GPT-3.5 的水平。
华为云官网显示,盘古大模型由自然语言处理(NLP)大模型、计算机视觉(CV)大模型、多模态大模型、科学计算大模型等多项构成,通过模型泛化,解决传统 AI 作坊式开发模式下不能解决的 AI 规模化、产业化难题,可以支持多种自然语言处理任务,包括文本生成、文本分类、问答系统等。
(举报)
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。