今天分享的是人工智能AI传媒行业深度研究:《AIGC最新应用与场景研究》。(报告出品方:华金证券)
精选报告来源公众:【幻影视界】
AIGC发展过程:AI自行生成内容
AIGC指的是人工智能系统生成的内容,通常是文字、图像、音频或视频。这类内容可以通过自然语言处理,机器学习和计算机视觉等技术生成,即生成式AI。AI最初设立的目的是让机器像人类一样思考解决问题。目前AI的总体目的是通过各种算法解决问题提高生产效率。
AIGC多样化的内容生成能力使其覆盖各类内容形式,各类应用场景正随技术进步逐渐落地。AIGC不仅可覆盖文本、音频、图像、视频等基本内容模态,还可综合图像、视频、文本进行跨模态生成,并应用于各类细分行业成为具体的生产力要素,例如游戏行业中的AI、NPC、虚拟人的视频制作与生成等。
AIGC发展过程:GPT助力,进入黄金期
ChatGPT的发展带动了文字类AI生成,或将在2023年进入黄金时期,图片类AI生成黄金时期将在2025年左右抵达,3D和视频类AI生成在2023年可能正处于草稿阶段,进入黄金时期或许在2030年。
AIGC产业应用,如在制造业、建筑业等巨型垂直实体领域中,AIGC的C/Content内容将不仅停留在图片和文字的领域,而是进入信息更为丰富的领域。
AIGC发展过程:ChatGPT插件拓宽应用场景
OpenAI邀请第三方公司进行插件测试并计划逐步扩大访问权限(对于插件开发人员、ChatGPT用户以及经过alpha测试期之后希望将插件集成到其产品中的API用户)建立一个社区,来塑造人类与人工智能交互范式的未来。
受邀请进入等待名单的插件开发人员可以使用文档为ChatGPT构建插件,将启用的插件列在显示给语言模型的提示中,并提供说明文档以指导模型如何使用每个插件。第一批插件由Expedia、FiscalNote、Instacart、KAYAK、Klarna、Milo、OpenTable、Shopify、Slack、Speak、Wolfram和Zapier创建。
OpenAI本身具备开发插件:OpenAI自主开源了两个插件分别是网络浏览器和代码解释器。
网络浏览器:帮助OpenAI接入了互联网,成功弥补了之前数据存在时效性的问题。将ChatGPT插件接入网络后,原有的计算机软件生态和数据库相互结合,赋予其使用工具、联网和运行计算的功能。
代码解释器:代码解释器则能够执行数学问题、数据分析、可视化和文件格式转换等任务,使ChatGPT能够使用Python并在沙盒环境中处理上传和下载任务。此外,代码解释器可以使初级程序员工作流程变得更加高效。
AIGC发展过程:ChatGPT已接入终端
5月19日ChatGPT官方应用在IOS平台上线。发布时间不久已经成为AppStore免费应用热搜榜第二名,目前只在美国地区进行推广。安卓版本将在未来推出。
自身特点:软件下载应用免费,同时可以同步网页端的聊天记录。并完成语音输入,反应速度较快。目前没有广告植入,可以通过AppStore直接订阅。
目前IOS版本只有GPT-3.5和GPT-4两种模式,但对于GPT-4的使用次数仍有限制。同时没有使用联网插件,预训练数据集停留在2021年9月。
AIGC软件应用:AI技术提升效率
AIGC软件应用:文字类-NotionAI使用场景
AIGC软件应用:图像-Midjourney介绍
Midjourney是一款2022年3月面世的AI绘画工具,它是由Midjourney研究实验室开发的人工智能程序,可根据文本生成图像,使用者可通过Discord的机器人指令进行操作,可以创作出的图像作品。5月15日推出了中文版官方内测已经开放,新用户可通过腾讯QQ频道免费试用。
功能介绍:
在创作过程中可以自动识别和纠正绘画中的错误,生成更加真实自然的图像。应用领域非常广泛,包括美术设计、游戏开发、虚拟人物创作等。通过API接口集成到各种应用中,为用户提供更加便捷的服务。AIGC软件应用:音频类-AmperMusic介绍
AmperMusic是一个基于云算法的平台,帮助简化电影和视频游戏的音轨制作过程。在这个过程中,它会生成AI生成的算法,帮助用户创作各种音乐流派的音乐。它允许用户为其内容创建和自定义原创音乐,是全球首家人工智能编曲、表演和制作公司,使用户能够即时创作和定制原创音乐。
目前AmperMuisc已经加入Shutterstock。在Shutterstock可以直接使用由AmperMuisc预生成的歌曲。
功能介绍:最容易使用的AI音乐生成器之一,AI音乐生成器列表中名列前茅,目的打造成为音乐人心中最好的AI生成音乐产品。
从预先录制的样本中制作音乐。这些随后被转换成实际的音频,可以改变音乐键、速度、特定乐器和其他因素。例如,可以调整全部乐器以适应想要创造的音调或感觉。因此,无需透彻了解音乐理论或作曲即可使用它。
AIGC软件应用:代码类-GithubCopilot介绍
GitHubCopilot,是GitHub和OpenAI合作开发的一个人工智能工具,用户在使用VisualStudioCode、MicrosoftVisualStudio、Vim或JetBrains集成开发环境时可以通过GitHubCopilot自动补全代码。
功能描述:Copilot可以支持十几种语言,与Python、JavaScript、TypeScript、Ruby和Go等主流语言配合效果更佳。GitHubCopilot还可以将注释转换为代码。只需要描述需求逻辑,GitHubCopilot能自动“理解”并写出相应功能的代码,也能自动填充重复代码。GitHub官方表示,Copilot的功能能够帮助程序员减省阅读软件文档的时间,快速浏览不熟悉的编码框架和语言。
AIGC软件应用:视频类-D-ID介绍
D-ID推出了其新的视频化照片产品。该产品可以使用其新的技术创造一个能够表达各种情感的多语言电视主播、为客户支持互动创建虚拟聊天机器人角色、开发用于专业发展的培训课程、并创建交互式对话视频广告。
基本原理:D-ID的原理在于人脸识别,不仅是改变脸部和动画生成,同时可以根据少量信息生成逼真的人物视频或从单个静止图像生成动态人物。脸识别技术分为4步:人脸检测、人脸对齐、人脸编码、人脸匹配。
ChatD-ID为首个使用ChatGPT实现人与虚拟人面对面对话的应用程序,整合了ChatGPT与D-ID生成式技术。它使用实时人脸动画和先进的文本到语音来营造一种身临其境的感觉。
AIGC软件应用:视频类-Runway介绍
改变视频风格:Runway的Gen1系统可以根据用户需求改变视频风格或在视频上添加更多细节。
文本生成内容:Runway发布Gen2系统,该系统可以根据用户提示生成短视频。使用该系统,用户可以输入简短的视频描述,例如“一只行走在雨中的猫”,Gen2根据语义生成大约3秒钟的视频
AIGC软件应用:视频类-AdobeFirefly
Adobe与英伟达联合推出Firefly(萤火虫)。Firefly在3月推出的早期版本与Midjourney功能近似,但整体呈现效果相对较弱。
原因:1、提示语已经在MidJourney中进行了大量优化,Firefly仍有提升空间。2、Firely宣城它仅在Adobe Stock和完全许可的图像上接受过训练。
新版的Firefly可以让任何人轻松地编辑视频,通过几个字让AI自动进行颜色分级,添加背景音乐和声音效果,创建带有动画的字体、图形和徽标。Firefly承诺会自动将导演脚本转换为故事板和预可视化动画——直接从草图生成动画。
一键剪辑:通过分析视频中的文本,萤火虫可以自动选择视频中相匹配的其他画面,自动选择适当的时间轴位置,完成剪辑。
一键分析剧本:生成分镜。只要输入剧本可以自动添加特效字幕。甚至可制作分镜画。
AIGC软件应用:跨模态生成-NewBing与ChatGPT对比
NewBing回答简要直接,而ChatGPT回答详细全面。
用户可以与ChatGPT进行深度互动,获取丰富的信息和建议,而NewBing智能性和灵活性欠佳
工业革命历程:人工智能引发第四次科技变革
每一次工业革命的到来,背后都有一个通用目的技术,例如第一次工业革命背后有蒸汽机,第二次工业革命背后有电,后面有了计算机、互联网。而每一个通用技术都会赋能千行百业,创造很多的商业机会,推动产业的变革发展。
人类历史上已经发生了三次科学革命、技术革命和工(产)业革命,第四次科学革命、技术革命和工业革命即将到来,并有希望在本世纪内完成。
第四次工业革命将对全球经济产生深远的影响,GDP、投资、消费、就业、贸易、通货膨胀等宏观变量几乎都会受其影响。
生产效率方面:当前世界技术和创新正处于拐点,第四次工业革命将很快推动生产效率的大幅上升,加速经济增长。
对就业的影响:一方面,技术对就业是有破坏效应的,因为技术带来的颠覆和自动化会让资本取代人工,从而导致工人失业,或者把他们的技能用到其他地方;另一方面,这样的破坏效应也伴随着资本化效应:对新商品和新服务需求的增加,会催生全新职业、业务,甚至是全新行业。
AIGC应用场景:内容创作行业边际成本趋于零
内容创作行业主要指以内容创作生产为主业,包括新闻信息、出版、影视、演艺、数字内容、创意设计、工艺美术等领域的文化企业。
内容生产范式的变革:
AIGC将重塑互联网内容生产和用户交互方式,成为WEB3.0发展中的重要里程碑。
加速进化,让创作者不再过多焦虑创作难度,做到充分发挥自己的想象力和创意。
自动提取和整理视频素材,进行视频内容的归纳总结,让用户可以在社区内更高效便捷地互动,减少重复劳动和生产时间。内容个性化推荐也能够提高用户的社区黏性等。这些机遇将为知识型社区或平台带来更好的商业发展和社会影响。
通过AI技术的应用,视频创作者可以大大降低生产门槛,减少工序性的人工消耗,减小工具和技术层面的差异,从而获得更多的创作权力和自由。
内容质量好、专业程度高、优质创作者聚集的内容平台或社区,显然有望成为AIGC时代的重要受益者。
《中国AIGC产业全景报告》报告中,预计2030年,我国AIGC市场规模达到万亿级别;2025年和2027年预计成为两次规模爆发点,年复合增长率有质变提升。
AIGC应用场景:办公应用-Office系列全面升级
AIGC应用场景:办公应用-WPSAI对标微软Copilot
4月18日,金山办公正式发布具备大语言模型能力的生成式人工智能应用,暂定代号“WPSAI”,这也是国内协同办公赛道首个类ChatGPT式应用。「WPSAI」最初搭载在金山办公新一代在线内容协作编辑工具轻文档(airPage,kdocs.cn)
5月16日,推出了文字、表格、PPT、PDF组件搭载的AI大模型能力,支持PC及移动设备,整体呈现与微软Copilt近似。
WPSAI未来发展将锚定三个战略方向:
1.AIGC,主要是辅助编辑、改写、润色,帮助用户生产更优质的文章。
2.阅读理解和问答,基于已储备的语料做问答式的交互,辅助阅读和知识检索。
3.人机交互,基于大语言模型技术去做下一代基于自然语言的人机交互,用自然人类语言给软件下命令、提要求。
AIGC应用场景:协同办公-钉钉深耕工作场景
4月18日,钉钉总裁叶军宣布,钉钉正式接入阿里巴巴“通义千问”大模型,钉钉将全面启动智能化战略,升级为智能协同办公平台、智能应用开发平台。
叶军和钉钉团队发布现场演示了斜杠“/”功能的四个高频应用场景:群聊、文档、视频会议和低代码应用开发。无论是文档的内容生成能力,群聊、会议的摘要提取总结,还是对话或者拍照就能自动生成一个可直接使用的小程序,钉钉AI能力全被收进这一道斜杠“/”里。
钉钉对未来展望:人和软件的交互将变得非常简单,产品会走向极简。以前大家用Word、Office,找菜单、有按钮、有一个函数,或者改一个表格。以后用户的习惯。可能就是通过一条斜杠来唤起所有想要功能。
AIGC应用场景:设计行业-多环节辅助
设计业务简单分为7个流程:设计调研、设计脑暴&提案、拍摄素材、包装设计、工业造型设计、商品团设计、IP设计。从可行性和推广性的角度出发,详细介绍AIGC在商品、品牌、营销和体验等多个领域的应用与探索。提升了提案效率,辅助拍摄,提供了丰富素材
1.设计调研:调研设计师需要输入大量的分析资料。ChatGPT主要提供辅助功能
2.设计脑暴&提案:
设计师可以使用AI快速模拟用于提案的概念创意方案,并根据需求目标迭代,快速响应业务需要。
前期设计团队通过洞察需求,产品定义,以及如何可信三个维度对ChatGPT进行提问。
3.拍摄素材:AI辅助拍摄和生产高清材质,提升内容所需拍摄的多样性素材并降低照片素材采购成本。主要采用Midjourney生成所需图像。
4.包装设计:AI帮助设计师提供容器造型,平面设计和背景等方面的创意效果
5.工业造型设计:AI帮助设计师快速验证创意效果
6.商品图案设计:AI帮助设计师生成图案并应用到商品上,可以快速产出图案创意方向及场景图
7.IP设计:设计师将前期的风格调性&内容作为相应的prompt描述,Midjourney中生产大量的素材,提升效率。
AIGC应用场景:设计行业-网页制作提升效率
产品网页可通过语言描述快速生成。RelumeIpsum通过一段文字调整网页设计。选定设计模版,然后在文本框中输入描述,譬如希望生成的网站实现什么功能、呈现何种样式,点击「生成Generate」,RelumeIpsum就能根据描述,把内容填充到模版中。
AIGC应用场景:UI设计领域-特定优化AI工具出现
3月 28 日,一款面向 UI 设计的生成式 AI 产品,能够让 AI 生成可编辑 UI 设计稿的即时 AI开放内测申请,迅速获 得了业内人群的关注。UI 中国发布的盘点报告,目前全球有三款产品可以实现「AI 生成可编辑 UI」的功能,分别是即 时 AI、Galileo AI 以及 Uizard。其中国外的两款产品仍停留在小范围内测阶段。目前,「即时 AI」是全球首款可以大规模让用户体验到「AI 生成可编辑 UI 设计稿」功能的产品。
即时 AI基于在线协作设计平台即时设计,利用大语言模型,让人们在网页端就可以通过自然语言描述,实现可编辑 UI 设计稿的快速生成。使用即时 AI,只用简单的一句话描述,AI 就可以自动帮你生成出一个 UI 界面样板。
AIGC应用场景:广告行业-AI模特
AI模特已应用于品牌服装展示。Levi Strauss & Co.是一家著名的牛仔服装品牌,近日宣布与数字时尚工作室Lalaland.ai 合作,利用其先进的人工智能技术,创建各种身材、年龄、尺码和肤色的AI生成的模特,以展示其服装系列。
Lalaland.ai是一家成立于2019年的阿姆斯特丹公司,通过AI技术让时尚品牌和零售商能够创建超逼真的模特,满足不同的 消费者需求。该公司认为,通过这些包容性的虚拟形象,可以为时尚品牌、零售商和消费者提供更加个性化、包容性和可持 续性的购物体验。
AIGC应用场景:电商平台-全面赋能
从3G时代到5G时代,互联网历经PC互联网、移动互联 网,当前迈入AIGC新业态探索期,电商行业从PC网页 (以文字、图片静态内容为主)到传统货架电商再到直 播电商(以音视频流媒体动态内容为主),不断升级迭代。
市面上的AI模特,主要由Stable Diffusion、Novel AI、Midjourney三种应用生成,以Midjourney举例, 想要生成一张AI模特图片,主要有以下三种方式:
第一,文字描述的生成方式。创作者将所需图片 的主题内容、环境背景、构图镜头、参考方向、图 像设定,以文字的形式描述出来,就可以得到一张 AI图片。
第二,文字描述加参考图片的方式,这也是AI模 特生成的最多方式。先在Midjourney上,上传一 张服装图片,再右键复制图片地址,然后输入关于 AI模特的文字描述,就能让这件服装,成功穿到模 特的身上。
第三,参考图片加参考图片的方式,这种方式最 为简洁,但也最容易出错。对此,操作者分别上 传两张图片,一张是服装图片,要求背景最好是干 净的,另一张是最终效果图片,然后将两张照片进 行合成,最终呈现服装上身的效果。
AIGC应用场景:电商平台-虚拟主播、数字人客服
AIGC虚拟数字人扮演直播、客服等角色,促进电商平台降本增效:
对虚拟主播来说,“24小时全天候、不间断直播”这一点可以轻松完成。微软天猫官方旗舰店曾推出“24小时全 智能虚拟IP”带货,通过对后台知识库的不断学习,虚拟主播可以在直播期自动介绍商品信息,并自主回答用 户问题,与用户互动。
市场调查显示,人们每周平均要花10到20分钟在电话上等待客服。如果按照正常人70岁的寿命计算,把这些时间 都加起来,足足占去了一个人43天的时间。虚拟客服可以24*7全天候快速识并回答大部分常见的客户查询,并 快速、高效地给出准确的答复,极大的节省了用户的时间,可以给用户带来加良好的体验。
AIGC应用场景:电商独立站-平台建立
Shopify主营业务为SaaS订阅解决方案和商家解决方案旗下产品Shop成为第一批受邀公司,其CEO表示“我们更新了Shop 应用程序,将ChatGPT集成在内,买家可以向ChatGPT提出问题,就像个人助理一样。”当买家搜索产品时,AI就会根据 买家的要求进行个性化的推荐,通过扫描数百万种产品来简化买家的购物流程,帮助用户快速找到自己想要的东西。
同时Shoify自身提供提供平台商品评论数据分析、标题及关键词优化、营销文案撰写、网站智能化开发编程等多项功能, 有效改善卖家运营效率及消费者体验。
AIGC应用场景:动画行业-提升制作效率
《剪刀、石头、布》动画时长有7分21秒,而该动画的制作团队仅有三人。幕后视频揭晓后,该动画引起了业内的广泛关 注,短时间内其幕后视频和动画本身均超过百万播放量。
AIGC应用场景:游戏行业-业内广泛应用
在2022年末才正式崛起的AIGC技术,已在游戏行业蛰 伏多年。在游戏厂商探索工业化开发管线的进程中, 相关的AIGC技术亦在如影随形发展。以美国游戏厂商 Rockstar(以下简称“R星”)为例,在旗下游戏 《侠盗猎车手5》和《荒野大镖客2》中的NPC交互、 人物建模、环境渲染等方面均用到了AIGC技术进行辅 助开发。
AIGC应用场景:游戏行业-虚拟NPC提升用户游戏体验感
AI虚拟NPC与用户实时交互,提升用户游戏体验感:
高级 NPC 行为和对话的开发平台Inworld AI调查了美国1,000多名16-50岁的游戏玩 家发现,这些受访者中的大多数人认为, 人工智能的最新进展可能会改变游戏的面 貌,并开创一个沉浸式体验和与具有个性 的 NPC 互动的新时代,并且能够在类似 ChatGPT 的语言模型的帮助下进行无脚本 的语音到语音对话以及多模态行为和感知系统。
报告称:81% 的人愿意为具有改进 AI 的 NPC 的游戏支付更多费用;84% 的游戏玩家同意当前 的 NPC 对游戏玩法产生了积极的影响;超过一 半 (52%) 不喜欢重复的 NPC 对话;76% 的 人希望看到具有更好态势感知能力的 NPC;78% 的人会花更多时间与高级AI NPC一起玩游戏。
AIGC应用场景:教育行业-虚拟导师
虚拟导师将成为GPT在教育行业的主要表现形式之一。在第一批受邀与OpenAI合作的公司中包含多邻国(Duolingo)与可汗学院(Academy)两家教育类公司。
多邻国Duolingo 拥有简单的用户界面和有趣但竞争激烈的排行榜,支持 40 种语言的 100 多门课程。学习者通过在手机上点击和滑动,从简单的词汇练习到复杂的句子结构。如果学习者想要超越基本的熟练程度,理解语法规则会很有帮助。但真正精通一门语言需要交谈,最好是与母语人士交谈,但并非每个人都能接触到。
多邻国与OpenAI合作基于GPT-4,在Duolingo Max中添加推出两个新功能:角色扮演(AI对话伙伴)添加了回答反馈功能
AIGC应用场景:金融行业-涵盖金融机构前中后台
在场景应用上 AI 技术与 AI 应用核心应用场景可归纳为智能营销、智能风控与合规、客服与渠道、安防与身份认证、 智能运营以及保险与投研投顾等六大应用领域基本涵盖金融机构前中后台中的市场营销、产品设计、风控与合规、客户 服务、运营管理等。主要由数据智能、自然语言处理、计算机视觉、知识图谱和智能语音等五大技术支撑实现,互相之 间的支撑关系。
AIGC应用场景:XR行业-有望迎来新一轮增长
AIGC推动元宇宙发展。AIGC 为元宇宙内 容生成提供解决方案。基于生成式AI自 身优势,更高效的生成3D场景,提高用户 体验。
元宇宙的发展使AR/VR等设备需求增多。 AI技术一直是支持AR产业发展的基石,众 多AR公司采用AR+AI的发展模式
AIGC的发展也降低了虚拟场景内容生成成 本。制作成本过高为VR等虚拟电影制作主 要问题,早前Oculus制作的一部5分钟的 VR电影《LOST》,平均每分钟的成本就要 100万美元,而一部普通电影的平均每分 钟成本大约是10万美元,IDC预测,2023年全球AR/VR设备出货量将 同比增长31.5%。未来数年AR/VR设备将保持30%以上的增长,2026年出货量将达到 3510万台。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
精选报告来源公众:【幻影视界】