在过去的几周里,我一直在探索迅速扩张的人工智能生成艺术品的世界。OpenAI的DALLE -2 “人工智能系统”是无可争议的领导者,可生成令人惊叹的图像。也许最好的例子是Ben Barry 的《1111101000 Robots》 。这是一项令人惊叹的研究,涉及 1,000 张图像,包括机器人、花朵(通常是从它们的脑袋里长出来的)、彩虹和一个没有人类的世界。这里有一些,几乎是随机选择的,因为整个系列真的很棒。
DALL-E 2 和其他AI工具改变了数字创作者与计算机之间的关系。
传统上,创作者会使用 Photoshop 等工具或其他生产力工具在屏幕上移动像素。他们可能会提供更先进的算法,例如滤镜,可以对图像应用各种效果,从简单的(例如更改对比度)到更复杂的(例如添加油画效果)。最近,AI-lite 工具已经悄然渗透到我们的工作流程中,例如相机应用程序中的美化滤镜。
新一波的工具彻底改变了这一点。数字艺术家现在负责精心设计自然语言句子,并让人工智能将其解释为图像。例如上图的提示是:
a dramatically lit brightly colored detailed painting of a robot relaxing in a field of flowers on a sunny afternoon in the background
一幅色彩鲜艳、色彩鲜艳的详细画作,背景是一个阳光明媚的下午,在花丛中放松的机器人
当然,存在一定程度的随机性,DALLE-2 会生成许多选项。本·巴里 (Ben Barry) 将AI视为艺术家,并将用户列为提示者和领导人。
关于AI生成艺术的繁荣已经写了数十篇文章,所以我不会说太多,只是表达我对这些算法产生的碳排放量的惊讶。《财富》杂志于2021 年 4 月报道,DALL-E 2 的前身 GPT-3 产生了 550 吨二氧化碳用于训练(大约一年可驾驶 120 辆客车)。麻省理工学院新闻报道称,训练的计算时间成本超过 460 万美元。数据可能是新的石油,但AI可能是新的煤炭。
上个周末我偶然发现了Night Cafe,它把自己描述为AI艺术生成器。可悲的是,对于我的待办事项清单来说,它不得不退居二线,与人山人海共同出游国庆…
DALLE-2 可以产生优质的图像,我发现了有一个用户Arachnix使用以下提示创建了这个“ Wizards Treehouse ”:
“A Beautiful, Mythical and Magical Painting of a Fantasy Treehouse by Daarken, Dan Mumford and Clint Clearley” — weight: 1
“A Beautifully composed painting of a fantasy treehouse by Caspar David Friedrich” — weight: 1
“deep colours, amazing, a masterpiece, magic, spells, incantations, rich colours, fantasy” — weight: 0.4
“beautiful, colorful, amazing lighting” — weight: 0.5
“#film 4K 64 megapixels 8K resolution detailed painting trending on Artstation Unreal Engine” — weight: 0.9
“well lit” — weight: 0.3
“cel-shaded, depth, particles” — weight: 0.1
“blur, blurry, bokeh, dirty, eyes, face, figure, hair, human, man, noisy, oversharpened, paint flecks, people, person, scratches, skin, text, too dark, too sharp, unclear, underexposed, undeveloped, watermark, woman” — weight: -1
正面提示试图影响AI产生提示中描述的内容,而负面提示则试图避免某些特征。Arachnix 建议图像应该是卡斯帕·大卫·弗里德里希(Caspar David Freidrich) 绘画风格的树屋,但应避免模糊、嘈杂、过度锐化等。
这些人工智能图像生成器通常使用来自网络的图像/标题对进行训练(例如,LAION 数据集包含超过 4 亿个图像/标题对)。我可以想象这个数据集中的图像可能被描述为模糊,提示器要求更多的魔法、咒语和咒语以及更少的过度锐化或曝光不足的图像作为最终输出的灵感。
Night Cafe探索源和 Discord 服务器给人的感觉就像是在 Github 或 Scratch 上分叉一个项目和一个社区的混合体,这些社区的人可能不具备执行其想法的技术技能,但对探索各种可能性和磨练自己的提示技能以及充满好奇心的人组成的社区来说,这他们能更稳定地制作出高质量的图像。
如果您只是来阅读此博客来了解有关 AI 艺术的贴纸,我对标题表示歉意。在过去 48 小时里我提出了很多很多想法,我注意到 Night Cafe 算法生成的图像往往包含很多细节。我想知道是否有可能走另一条路,即拍摄一张详细的图像并提取其本质。
Sticker. Vector image. Simple lines. Subtle shading.
我选择了第 40 次迭代生成的图像
我挺喜欢它的。它已经完全没有了蒸汽朋克类似的风格,而且一眼可以看出是大象的贴纸。在实际用作艺术品之前,您可能需要修复视角。现在它看起来就像躺在桌子上。纠偏工具应该可以纠正它。还有一些模糊的部分需要解决。我认为在像 Inkscape 这样的矢量编辑工具中追踪它并稍微修改一下可能相当容易做到。
以下是一些更有趣的结果:
好吧,最后我没有印刷贴纸,因为拼夕夕商家告诉我 500个起印
但这只是一个概念验证,看看它是否可行。
我觉得是这样的。
类似的想法可以用来简化图像,使其可以用作纹身。
谢谢来看我的文章
看完后发现和他们接吻的另外的一男一女在他们走后都不约而同的露出伤心的表情,唉
可以可以