使用AI生成的艺术品设计贴纸

在过去的几周里,我一直在探索迅速扩张的人工智能生成艺术品的世界。OpenAI的DALLE -2 “人工智能系统”是无可争议的领导者,可生成令人惊叹的图像。也许最好的例子是Ben Barry 的《1111101000 Robots》 。这是一项令人惊叹的研究,涉及 1,000 张图像,包括机器人、花朵(通常是从它们的脑袋里长出来的)、彩虹和一个没有人类的世界。这里有一些,几乎是随机选择的,因为整个系列真的很棒。

DALL-E 2 和其他AI工具改变了数字创作者与计算机之间的关系。

传统上,创作者会使用 Photoshop 等工具或其他生产力工具在屏幕上移动像素。他们可能会提供更先进的算法,例如滤镜,可以对图像应用各种效果,从简单的(例如更改对比度)到更复杂的(例如添加油画效果)。最近,AI-lite 工具已经悄然渗透到我们的工作流程中,例如相机应用程序中的美化滤镜。

新一波的工具彻底改变了这一点。数字艺术家现在负责精心设计自然语言句子,并让人工智能将其解释为图像。例如上图的提示是:

a dramatically lit brightly colored detailed painting of a robot relaxing in a field of flowers on a sunny afternoon in the background

一幅色彩鲜艳、色彩鲜艳的详细画作,背景是一个阳光明媚的下午,在花丛中放松的机器人

当然,存在一定程度的随机性,DALLE-2 会生成许多选项。本·巴里 (Ben Barry) 将AI视为艺术家,并将用户列为提示者和领导人。

关于AI生成艺术的繁荣已经写了数十篇文章,所以我不会说太多,只是表达我对这些算法产生的碳排放量的惊讶。《财富》杂志于2021 年 4 月报道,DALL-E 2 的前身 GPT-3 产生了 550 吨二氧化碳用于训练(大约一年可驾驶 120 辆客车)。麻省理工学院新闻报道称,训练的计算时间成本超过 460 万美元。数据可能是新的石油,但AI可能是新的煤炭。

 

上个周末我偶然发现了Night Cafe,它把自己描述为AI艺术生成器。可悲的是,对于我的待办事项清单来说,它不得不退居二线,与人山人海共同出游国庆…

DALLE-2 可以产生优质的图像,我发现了有一个用户Arachnix使用以下提示创建了这个“ Wizards Treehouse ”:

 

“A Beautiful, Mythical and Magical Painting of a Fantasy Treehouse by Daarken, Dan Mumford and Clint Clearley” — weight: 1

“A Beautifully composed painting of a fantasy treehouse by Caspar David Friedrich” — weight: 1

“deep colours, amazing, a masterpiece, magic, spells, incantations, rich colours, fantasy” — weight: 0.4

“beautiful, colorful, amazing lighting” — weight: 0.5

“#film 4K 64 megapixels 8K resolution detailed painting trending on Artstation Unreal Engine” — weight: 0.9

“well lit” — weight: 0.3

“cel-shaded, depth, particles” — weight: 0.1

“blur, blurry, bokeh, dirty, eyes, face, figure, hair, human, man, noisy, oversharpened, paint flecks, people, person, scratches, skin, text, too dark, too sharp, unclear, underexposed, undeveloped, watermark, woman” — weight: -1

正面提示试图影响AI产生提示中描述的内容,而负面提示则试图避免某些特征。Arachnix 建议图像应该是卡斯帕·大卫·弗里德里希(Caspar David Freidrich) 绘画风格的树屋,但应避免模糊嘈杂过度锐化等。

这些人工智能图像生成器通常使用来自网络的图像/标题对进行训练(例如,LAION 数据集包含超过 4 亿个图像/标题对)。我可以想象这个数据集中的图像可能被描述为模糊,提示器要求更多的魔法咒语咒语以及更少的过度锐化曝光不足的图像作为最终输出的灵感。

Night Cafe探索源和 Discord 服务器给人的感觉就像是在 Github 或 Scratch 上分叉一个项目和一个社区的混合体,这些社区的人可能不具备执行其想法的技术技能,但对探索各种可能性和磨练自己的提示技能以及充满好奇心的人组成的社区来说,这他们能更稳定地制作出高质量的图像。

 

如果您只是来阅读此博客来了解有关 AI 艺术的贴纸,我对标题表示歉意。在过去 48 小时里我提出了很多很多想法,我注意到 Night Cafe 算法生成的图像往往包含很多细节。我想知道是否有可能走另一条路,即拍摄一张详细的图像并提取其本质。

 

我的第一个实验是将以下图像转换为我想要粘贴在笔记本电脑上的图像
 
我还没有完全知道怎么使用,所以以下是我遵循的过程尝试。第一步是去除背景。我在 灵图设计在线编辑器 中使用了一键抠图工具
 

灵图设计编辑器的一键抠图

 
然后我把它加载到 Night Cafe 中。这里会有两个选项:样式转换和文本到图像/视频。风格转移将风格从一张图像转换到另一张图像,而提示是我之前描述的更熟悉的技术。

Night Cafe的两种算法类型

 

我一开始认为风格转移是正确的选择。造型方面,我选择了这款可爱的DALL-E 2生产的机器人。
 
 
但是我的结果很糟糕
 
我的下一次尝试是使用文本到图像/视频算法
 
提示很简单:
 
Sticker. Vector image. Simple lines. Subtle shading.
该算法运行给定的迭代次数。我选择了默认值 200。Night Cafe 以不同的时间间隔拍摄快照。如果您更喜欢中间图像而不是最终图像,这可以帮助您选择中间图像
 
 
有趣的是可以看到从原始图像到越来越抽象的表示的转变
 

200次迭代后的最终输出。它看起来不再像大象了

 

我选择了第 40 次迭代生成的图像

 

我挺喜欢它的。它已经完全没有了蒸汽朋克类似的风格,而且一眼可以看出是大象的贴纸。在实际用作艺术品之前,您可能需要修复视角。现在它看起来就像躺在桌子上。纠偏工具应该可以纠正它。还有一些模糊的部分需要解决。我认为在像 Inkscape 这样的矢量编辑工具中追踪它并稍微修改一下可能相当容易做到。

以下是一些更有趣的结果:

大象枪?

 

 

这个已经快看不出是大象了

 

绝对是大象。不确定它是否可以被视为蒸汽朋克,但可能是最接近的

 

好吧,最后我没有印刷贴纸,因为拼夕夕商家告诉我 500个起印

但这只是一个概念验证,看看它是否可行。

我觉得是这样的。

类似的想法可以用来简化图像,使其可以用作纹身。

 

谢谢来看我的文章 

给TA打赏
共{{data.count}}人
人已打赏
AI新闻AI科普

OpenAI“泄露”的 GPT2 模型让所有人震惊

2024-5-16 17:58:53

AI绘画

如何使用 AI 创建 GIF

2023-10-12 13:57:27

2 条回复 A文章作者 M管理员
  1. 灵图智能—小云

    看完后发现和他们接吻的另外的一男一女在他们走后都不约而同的露出伤心的表情,唉

  2. 可以可以

今日签到
有新私信 私信列表
搜索