对话西乔：关于绘画人们关心的几件事

2022-08-03 11:24 来源：读者提供作者：网友发布浏览：0

核心提示图片来源@视觉中国文｜互联网指北上个月，当我在文章中提及AI绘画工具Disco Diffusion时，它还仅被我当做一个例证，用来证明AI从事创意性内容的局限，因为它直接用来生成人脸、动物还存在缺陷，需要人力加工。但AI绘画工具的迭代和升级

来源@视觉中国

文|互联网指北

上个月我在文章中提到AI绘画工具Disco Diffuse的时候，它只是被我作为一个例子来证明AI在创作内容上的局限性，因为它是直接用来生成人脸和动物的，它还是有缺陷的，需要人类处理。但是AI画图工具的迭代和升级远远超出我的想象。DDv5.6新更新的人像生成器模块，大大提升了人脸生成效果。虽然有些角度还是会变形，或者看起来像“玻尿酸”，但是越来越像“人”了。

虽然在AI发展的时间线中，设置AI的绘画并不是什么新鲜事。早在2015年，谷歌就推出了DeepDream，首次尝试了AI的“艺术创造能力”。但2022年，以DD为代表的最新一批AI绘画工具出圈，不仅是因为技术层面的突破，更是因为其画图生成带来的视觉冲击。

人们越来越认真地讨论AI绘画是否会对艺术行业产生影响——即使它可能不会真正取代人类艺术家，但它目前的生产力足以有效地辅助人类创作，成为手稿、材料和灵感。

AI绘画除了是设计师和插画师的工具，还把画布普及到普通人，不需要美术基础。通过对比教程，写描述，调整参数，可以用文字的想象力交换图像结果。并且有一些“平易近人”的应用，比如和菜头就用它来画微信官方账号的封面。两个月的时间，封面的来源已经从某画廊/版权变成了“和菜头的小鲜肉手”。

鉴于业内有科普技术原理的专业文章，本文介绍各种AI绘画工具和教程。我更好奇AI绘画正在给人们带来什么变化，人们会在变化中如何行动。

带着这些疑问，我找到了Sijo。她是一名设计师，也是漫画《神秘程序员》的创作者。从今年5月开始，她几乎全身心投入到AI绘画的尝试中。除了每天跑图，她还看论文，写科普。她对AI绘画抱有很大期待，认为“AI对艺术和插画的影响相当于又一次‘照相机的发明’，艺术史又可以分卷了。”

如果你想找到“什么是AI绘画工具？”，建议多看一些专业系统的文章，比如Sijo微信官方账号的教程。但如果你对“AI画画和我有什么关系”、“我能用它做什么”、“它会带来什么”感到好奇，请继续阅读。

为什么AI画画突然就不在圈里了？

中国网络关于AI绘画的讨论集中在今年4月。随着美术圈、节目圈从业者的使用和交流，AI绘画工具DD逐渐被更多人所知。这是一个GitHub开源项目，目前还没有打包，在Google Colab中以代码的形式呈现。它的绘制过程可以简单概括为输入关键字生成图像。相对于早期AI画风死板，缺乏整体美感，完成度差，DD在构图、色彩、氛围上都有了很大的突破。

与此同时，OpenAI结合扩散模型、今年4月CLIP提出的DALL E 2、DD作者Somnai的公司推出的Midjourney等工具也开始进入人们的讨论和使用。设计师和插画师开始制作“从零开始学习ai绘画”的教程，比如@JZ_比如在哔哩哔哩发布教学视频，@西蒙_高加文在微博不断更新AI绘画素材，或者有人在知乎讨论“像迪厅扩散的AI绘画会对艺术行业产生什么影响？”

和大多数职业画家一样，乔之所以被艾的绘画击中要害，是因为“可能性”。这种“可能”可以像PS、3D辅助软件等工具带来的创作过程的改变，以及内容的解放。“它可以帮助我创造一些我以前不会甚至不敢创造的风格。”

但比起将艾视为“创造者”，乔认为更恰当的表述是，艾是她画布上的另一只手。有时候可以“放手”，交给AI去跑，会带来很多意想不到的惊喜。例如，在艾的"西藏往事"系列中，她将一台塔式起重机放在一座雪山的山顶上。

除了提示式的设计和无止境的参数分析机调整，还有另一种高度可控的玩法。当绘制者对生成地图的结果有预期目标时，可以通过设计底图和设置底图的跳过步骤来手动引导。或者获取生成过程中的中间步骤，修改中间步骤放回AI继续生成。还可以调整参数根据同一线索输出多组结果，手动选择更符合创作者预期的部分进行合成甚至后期重绘进行二次创作。

两只手画画，带给她的是创作的解放，探索学习新知识的乐趣，一种接近打开盲盒的快乐。“晚上写队列和早上起来取图只花了点电，收获的快乐是一样的。”而且相对于盲盒的有限选择，AI绘画所能完成的组合理论上是无限的。

依靠专业爱好者编写的中文资料、保姆教程、打包程序、支持中文描述符的AI绘画工具，AI绘画逐渐“出圈”，进入大众讨论语境。比如，和菜头从今年5月开始就多次发关于AI绘画的微博。

技术的向后兼容，让AI绘画为更多普通人打开了绘画的可能。毕竟对于大多数人来说，绘画要么是一扇从未打开过的门，要么是门槛很高。但是通过AI，一些从来没有尝试过绘画的人，不需要依靠多年的学习和经验，也能创作出图像。

“人创造图像的直觉是与生俱来的。你会发现很多人画画的巅峰其实是在年轻的时候。随着他们的成长，接受越来越多现有的视觉绘画模式，后天的输入覆盖了这种直觉。”

当图像创作与生俱来的直觉受到现实的规训，“大多数人试图创作的，并不是凭直觉画出自己心目中的东西，而是让自己画出的东西尽可能符合现有的绘画，比如模仿照片、模仿别人的画、涂色书等。，而当他们慢慢发现自己在模仿方面落后太多的时候，就放弃画画了。”

当“画画”可以像“自拍”一样用于分享和满足成就感的时候，AI绘画工具或许可以帮助普通人找回自己被偷走的自由，享受创作的快乐。为此，一些AI绘画平台也在利用这一价值实现商业回报，比如提供将AI生成的画作打印成挂画的服务，供用户购买实物。

AI绘画工具是如何“理解”的

DD这个通过文字生成图像的AI绘画工具，绕不开一个叫“CLIP”的模型，这是AI如何“理解”人类语义的关键。CLIP是OpenAI去年1月发布的基于比较的图文学习跨模态预训练模型。同时发布了原DALL E图像生成模型。

DD使用CLIP来“理解”用户输入的文本，然后使用扩散模型生成图像。这个过程可以理解为:向AI输入文本关键词，AI基于训练数据集的学习，从一堆噪音中推导出这个图像，不断进行文本和图像的匹配，检查搜索结果是否符合文本描述，然后逐渐消除噪音，添加细节，最后生成一个图像。

“宇航员骑马”和“骑宇航员”是解释AI对语义理解的常见例子。AI有能力描述前者，但由于后者的“逆经验”，实现起来就没那么容易了。

AI能够生成风格化的图像，也来源于大量训练数据集灌输的画家风格。以DD为例，提示是影响生成图形的重要组成因素，包括作品的媒介、描绘的对象或主题、各种风格和质感的修饰物、参考艺术家等。

根据乔的实验和理解，人工智能将提炼艺术家绘画的特征，如整体创作的主题和对象，笔触，纹理，亮度，调色板等。他们的学习成绩也受到一些画家作品的受欢迎程度和题材多样性的影响。比如艾所理解的塞尚、雷诺阿这样的画家，可能从他们所有的作品来看都有他们的特征，但是如果有的画家有特别著名的作品，这幅画的特征权重就会比较高。

比如乔用DD生成了一幅蓝色的海洋风景画，设定画师为Caspar David Friedrich，发现生成的作品很多都有黑色的背面。她推断这个元素来自弗里德里希的《雾海航海家》。

除了研究艺术作品，画家的国籍和文化背景也会影响对艾的理解。比如中国的艺术家如果用来画建筑，看起来会很像中国风。如果用画得越来越多的艺术家来输出人像，人物很可能会有锥子脸，眼睛会比正常人大。

了解AI是如何“思考”从而调整描述性文字的写法和技巧，也是为了AI更好地“理解”创作者的意图。

它给绘画行业带来了什么？

从业内现有的应用来看，AI绘画工具将系统性地改变“绘画”——在创作过程中作为制作工具提供新的技能；成为艺术作品的新变量，影响艺术作品的风格和价值；以NFT和拍卖画作的形式直接参与艺术市场交易。

在AI绘画工具辅助创作的维度上，可以用来生成底图，供画师进行二次创作，也可以直接作为远图使用。

画家也可以通过简单的色块勾选手稿，交给AI生成“幻想生物”作为灵感素材。

随着AI绘画工具的介入，工具链将可能面临重新整合。它会从AI生成的十几个结果中挑选出来，作为插画创作中的局部素材，再由PS或其他鼠标绘画工具使用，进行调光、配色、边缘处理、纹理融合等。

另一方面，AI也正在成为影响艺术评价的新变量。

“判断艺术品价值的标准是很主观的，这种评价不是一成不变的。在一种新体裁、新媒体诞生之初，必然有一个接受和过渡的时期。”人们对AI画的评判，目前肯定面临很多争议。

但是，随着AI绘画的普及，人们是否按照现有的评价体系来看AI绘画，或者是否会有一套适用于AI绘画的评判标准，现在还很难说。乔认为，这可能会成为未来几年艺术史研究和艺术评论家的话题。学者会找到一套他的评价体系，大众会选择自己的标准。

在她看来，虽然AI绘画工具正在展现出良好的生产力，但在实际应用场景中仍有较大差异。比如AI特别擅长制作场景的概念图。这一特性将使其在游戏、动画、设计等领域表现出色，被用于辅助创作。但如果用于工业设计、产品生成或服装设计，还没有表现出足够的应用能力。

另外，一项技术投入商业使用需要考虑两个因素，第一是是否满足需求，第二是如何衡量投入产出比。目前AI输出图片的尺寸还是比较小的。由于切片算法和模型的限制，DD在生成边缘比1280宽的图片时，布局会不尽如人意。，中途最大，DALL E 2。如果要做一个可以打印的尺寸，需要以后放大或者重新生成。

至于AI生成的画作被直接用于销售，已经有了行业先例。2018年，巴黎艺术集团Obvious使用GAN完成的一幅肖像以43.25万美元的价格售出。

也有AI绘画平台和创作者将生成的绘画作品投射到NFT，但这种销售也面临很大的不确定性。对艾来说，挑战画廊的生意可能比通过NFT赚很多钱更现实。

可能的负面影响

随着AI画图工具的普及，部分功能可能被挪用，产生负面影响。比如，通过添加“蒙版”，可以重画图像的一部分，把一只大大象的背面改成大象的正面，或者在空里自然地在空茶几上放一个苹果。

工具是开放给每个人想象的，这意味着它不仅可以用于艺术创作和表达，还可以被别有用心的人用作伪造形象、制造假新闻的“杀人武器”。

前车之鉴是“Deepfakes”，可以替代视频中的视听内容。用于伪造名人色情视频、诈骗勒索、假新闻等内容，使用受到限制。2019年，在国内一夜爆红的AI换脸应用“ZAO”，也因用户隐私、信息安全等问题受到质疑。

然而，除了用户使用导致的可见的“垃圾内容”，人类认知中的性别、职业、种族等刻板印象和偏见也不可避免地被吸收到AI的图像学习过程中，并潜移默化地反映在AI绘画的生成结果中。

为了应对上述可能出现的负面影响，AI画图工具的开发者采取了谨慎开放、较长内测周期、调试图像描述符的滤镜、控制等方法。

国内某开发者设计的AI画图工具迪亚马特向用户解释了为何内测周期长，并写道，“AI生成艺术是一个敏感而全新的领域，它的不可控性、合规性和用户体验需要我们多次迭代，包括云部署、模型调整等等。我们也希望TIA能尽快和大家见面，但客观上技术不允许。”

OpenAI的订阅邮件显示，在最近的更新中，DALL E“减少了对种族的偏见，更准确地反映了世界人口的多样性。”未来会根据用户反馈和标签进一步优化。

至于开发者对滤镜的调试，目前还处于探索阶段。从乔的个人经历来看，她多次被过滤器“绊倒”。

AI绘画另一个为人诟病的问题是“侵权界限”，这是目前的一个灰色地带，目前还没有行业定论。

以DD为例，该工具遵循MIT开源协议，理论上生成的图可以免费商业化。但在实际使用中也会存在，因为使用描述性词语导致的画风雷同，容易引发抄袭纠纷。此外，“如果把别人的作品‘垫’成底图，然后把skip设高，最后的结果将很难界定是否构成对作品的侵权。”

实际上，真正的画家是否抄袭，是否构成侵权，存在着各种复杂的争议。可能还需要足够的经验和案例，才能在AI绘画侵权问题上形成行业认知。

最后，乔还补充道，AI绘画也存在“负反馈”的可能性，即人们使用AI绘画工具生成的图像被进一步用于AI的优化和训练。“AI模型可能会呈现出类似于放大器的效果，最后会怎么样，现在大家都不知道。”

标签

乔喜欢把“相机”比作人工智能绘画。“相机刚诞生的时候，成像很慢，洗暗房很麻烦。设备携带和使用不方便，成像效果也不一定好。”当时的人像画家对于用相机拍摄人像有很多批评和嘲讽。

“但我们知道，几十年后，画家在绘画时几乎都会以相机拍摄的照片作为参考。因为光线在一天中变化非常快，你的模型不愿意在那里坐几个小时。”

不仅仅是肖像，风景，基于照片的数码绘画等。，也或多或少因为相机的应用，带来了艺术形式的变化。

在社会层面，“摄影”也从特定阶层所背靠的特定生活方式进入了公民阶层，记录社会变迁和普通人的日常生活。这种技术力量的解放和扩散，尤其是智能手机发展到今天，让普通人更容易掌握相机的摄影能力，成本更低，使用更方便。

可以预见的是，AI绘画工具的技术迭代不会像“相机”的发展那样需要几十年、上百年。除了上面提到的工具，比如DD，DALL E 2，Midjourney等。，互联网巨头也纷纷入场，如谷歌的Imagen/Parti，meta的Make a scene，微软的女娲等。国内开发商也致力于与人工智能艺术的全球浪潮接壤，如迪亚马特正在举办“千人创造-人工智能艺术创作大赛”。

人们对AI画的使用和认知还比较短，其影响力更多的还是存在于美术圈和节目圈。但在未来，AI绘画能否像“相机”一样，跨越阶层和圈子，渗透到普通人的生活中，是一件引起足够想象的事情。