摘要:在华为云ModelArts上, 无需考虑计算资源、环境的搭建,就算不懂代码,也能按照教程案例,通过Stable Diffusion成为艺术大师。
本文分享自华为云社区《跟着华为云ModelArts,一键上手时下最火AI作画工具》,作者:华为云社区精选 。
AI作画为什么最近特别火,AI作画现在已经进化到什么程度了?
你相信下面的画作是AI作画吗?
前段时间,在美国科罗拉多州的一个博览会上,有人用下面这幅名为《空间歌剧院》的作品拿到了博览会数字绘画的金奖,但获奖者却表示这幅画是用AI生成的。 该奖项引起了很大的争议,有人觉得AI学会作画会取代画师们的工作,也有人感叹AI绘画可以把这个世界上没有的东西展现出来,但凭借AI获奖的作品不能证明你就是艺术家。
一石激起千层浪,随后不少网友尝试用AI模型生成图像,效果相当惊艳,如今国内外的AI作画平台也呈现出一种百家争鸣的态势。今天将带大家了解 通过华为云ModelArts的 Stable Diffusion 文字生成图片案例实现AI作画, 揭开AI作画神秘的面纱。
Stable Diffusion 是一个“文本到图片的人工智能模型。 近日,Stable AI 公司向公众开放了它的预训练模型权重。 当输入一个文字描述时,Stable Diffusion 可以生成512×512 像素的图像,这些图像如相片般真实,可以反映文字描述的场景。在华为云ModelArts上, 无需考虑计算资源、环境的搭建,就算不懂代码,也能按照教程案例,通过Stable Diffusion成为艺术大师。
Run in ModelArts,三步“画”出艺术大片
点击链接进入到AI Gallery的“文字生成图片Stable Diffusion”案例页面,点击Run in ModelArts,即可进入ModelArts Jupyter运行环境,此处最好选用GPU的规格,模型生成图像所用的时间会更短。
注:以下步骤所涉及的代码都已经写好,直接点击代码前面的箭头,让其自动运行即可。
步骤一:安装需要的运行环境。
步骤二:访问HuggingFace Hub,下载AI模型预训练权重文件。
在下载或使用权重之前,需要访问它的token,必须是Hugging Face Hub 中的注册用户才可以获取到token,本案例已经提供好了一个token,直接运行代码即可。
步骤三: 填prompt提示词,也就是输入一段文字描述你想要的图片,生成单张图像。
这里需要注意的是:
1.先用中文描述提示词,描述的越精准越好。
2.再使用翻译软件将中文翻译成英文。然后将英文内容填入prompt= “…”中,点击保存运行代码就可以根据你的描述,生成专属艺术大作了。
当然,这个案例也提供多张图像生成,同步骤三一样修改Prompt,运行代码即可。
四个方法,让AI做图更优秀
在Stable Diffusion中,最关键的就是文字的描述,即Prompt, 它是生成图片的提示词,可以是一个主题也可以是一段抽象的文字的表达。
比如:数字哑光幻想梦幻般的山景黑暗色调雪,照片现实主义,柔软,风暴,8K由Alex灰色。 不同的 Prompt 对于生成的图像质量影响非常大,所以如果要生成一幅优秀的图画,就要掌握写 Prompt 的一些经验性技巧。
Prompt的描述可以从这四个方面入手:图片的风格,内容主体,详细的描述,再加上画家的风格。
Prompt 框架: [图片的风格]+[内容主题]+[细节描述]+[绘画风格或者艺术家风格]
1、图片的风格
按照这个框架,简单构造一个图片风格,比如:可以是一幅美丽的画,或者是一幅美丽的山水画。
2、内容的主体+详细描述
主体可以是各种各样的选择。推荐一些可以激发大家灵感的事物,如山水,人物,建筑房屋,动物等等,尽可能细致刻画这些实体事物。
如果是简单的输入“大海”两个字,模型不知道我们想要的风景是什么样子的,一段作品的相对准确的描述,比如:梦幻的大海,白沙滩岸边铺满了粉色的玫瑰花,月光轻柔的人洒在海面上,绿色发光的海浪, 我们要去尽量用详细的语言,用细节清楚的描述我们幻想的场景。比如:云中的Skyrim风格的山,有一个照明螺栓击中尖端导致雪崩,山区风景。
对于详细的描述,我们可以拆分【形容词】+【视角】+【时间】+【颜色】+【其他】
形容词可以是梦幻,神秘,浪漫或者写实 ……
视角可以是:超广角,俯视和仰视 ……
时间:秋天,清晨,黄昏,夜晚 ……
颜色可以是 红黄绿蓝橙紫……
其他可以包含图片的尺寸,4k,8k ,HD,光效,高细节等
3、绘画风格和艺术家风格
如果想让生成的图片更加的艺术化、风格化,可以考虑在 Prompt 中添加绘画风格和艺术家。艺术绘画风格可以是一些美术风格:梵高风格,油画,水彩,古风,CG感,动漫,少女,赛博朋克,卡通画,中国画,黄昏等等,艺术家风格包含:现实主义,印象派,野兽派,新艺术,表现主义,立体主义,未来主义等等
提示词:这是一幅美丽的画作,描绘了夜晚一大片空旷的沙漠沙丘,中间有许多棵神秘的巨大发光的蓝色树,树的蓝色光芒照亮了周围的环境,天空中的星星,由特德·纳史密斯和托马斯·金卡德创作。
4、其他参考建议
在使用关键词的时候,也多去使用一些明确的定义,避免使用“不是xxx”这样的描述。“不是xxx”,可选择的范围就太大了,生成出来的结果可能就和你想要的相去甚远。
如果你是个新手,需要一些关于关键词的引导,那你可以去 https://lexica.art/这个网站看一看。它收集了很多关键词,并且一步一步、分门别类地为你整理好了。
你只需要根据网站给出的步骤,从它的关键词库里选择你想要的效果,然后把这串关键词直接复制到prompt里就好。把“填空题”变成“选择题”,非常方便。
在熟悉了 Prompt 的原理之后,就可以尽情的发挥脑洞修改它的写法,点击链接,快来Happy Prompting吧!
使用ModelArts实现AI作画过程中的常见问题
Q:要如何进入Stable Diffusion文字生成图片的案例?
A:直接浏览器打开链接:
https://developer.huaweicloud.com/develop/aigallery/notebook/detail?id=03aab198-dc21-4974-ab33-352e9f56939c,注册并登陆华为云账号,点击Run in ModelArts即可。Q:华为云ModelArts 的文字生成图片案例是软件吗?需要安装吗?
A:不用,Stable Diffusion并不是软件,也不用安装,它是一个发布在华为云AI Gallery社区的一个指导案例,使用云端ModelArts环境运行。
Q:可以直接输入中文提示词吗?不同语言有影响吗?
A:目前开源的Stable Diffusion模型只支持英文,暂时不支持中文,你可以借助翻译软件翻译成英文填写,可以参考这个翻译网站:https://www.deepl.com/translator。
看了上述教程,还有什么方法能更快填写提示词生成自己想要的图画,可以下方留言讨论。