什么是生成式AI?你需要知道的一切

生成式人工智能是一种人工智能技术,可以产生各种类型的内容,包括文本、图像、音频和视频综合数据。最近围绕生成式人工智能的讨论一直受到新用户界面的简单性的推动,这些用户界面可以在几秒钟内创建高质量的文本、图形和视频。

应该注意的是,这项技术并不是全新的。生殖人工智能于20世纪60年代在聊天机器人中推出。但是直到2014年,随着生成对抗网络,或GANs——一种机器学习算法——生成式人工智能可以创建真实人物的令人信服的真实图像、视频和音频。

一方面,这一新发现的能力带来了机遇,包括更好的电影配音和丰富的教育内容。这也引发了人们对deepfakes-数字伪造的图像或视频-以及对企业的有害网络安全攻击,包括逼真模仿员工老板的邪恶请求。

下面将详细讨论的另外两项最新进展在生成式人工智能成为主流方面发挥了关键作用:变形金刚和它们实现的突破性语言模型。变形金刚(电影名)是一种机器学习,使研究人员可以训练越来越大的模型,而不必提前标记所有数据。因此,新模型可以在数十亿页的文本上进行训练,从而得到更有深度的答案。此外,变形金刚开启了一个新的概念,叫做注意力这使得模型能够跨页面、章节和书籍跟踪单词之间的联系,而不仅仅是单个句子。不仅仅是文字:变形金刚还可以利用它们追踪连接的能力来分析代码、蛋白质、化学物质和DNA。

所谓的快速发展大型语言模型 (LLMs)——即拥有数十亿甚至数万亿参数的模型——开启了一个新时代,在这个时代,生成式人工智能模型可以编写引人入胜的文本,绘制照片般逼真的图像,甚至在飞行中创作有点娱乐性的情景喜剧。此外,以下方面的创新多模态人工智能使团队能够跨多种类型的媒体生成内容,包括文本、图形和视频。这是Dall-E等工具的基础,这些工具可以根据文本描述自动创建图像,或者根据图像生成文本标题。

尽管有这些突破,我们仍然处于使用生成式人工智能来创建可读文本和照片般逼真的风格化图形的早期。早期的实现在准确性和偏差方面存在问题容易产生幻觉还吐口水奇怪的答案。尽管如此,迄今为止的进展表明,这种类型的人工智能可能会从根本上改变商业。展望未来,这项技术可以帮助编写代码、设计新药、开发产品、重新设计业务流程和改造供应链。

生成式AI是如何工作的?

生成式人工智能从一个提示开始,可以是文本、图像、视频、设计、音符或人工智能系统可以处理的任何输入。然后,各种人工智能算法会根据提示返回新的内容。内容可以包括论文、问题的解决方案或逼真的赝品从一个人的图片或音频创建。

早期版本的生成式人工智能需要通过API或其他复杂的过程提交数据。开发人员必须熟悉特殊工具,并使用Python等语言编写应用程序。

现在,生成式人工智能的先驱们正在开发更好的用户体验,让你用简单的语言描述一个请求。在最初的响应之后,您还可以使用关于您希望生成的内容反映的风格、语气和其他元素的反馈来自定义结果。

生成人工智能模型

生成人工智能模型结合各种AI算法来表示和处理内容。例如,为了生成文本,各种自然语言处理技术将原始字符(例如,字母、标点符号和单词)转换成句子、词性、实体和动作,这些使用多种编码技术表示为向量。类似地,图像被转换成各种视觉元素,也表示为向量。一个警告是,这些技术也可能对训练数据中包含的偏见、种族主义、欺骗和吹嘘进行编码。

一旦开发人员确定了一种表现世界的方式,他们就应用一种特定的神经网络来生成新的内容,以响应查询或提示。技术,如GANs和变分自动编码器(VAEs)——带有解码器和编码器的神经网络——适用于生成逼真的人脸、人工智能训练的合成数据,甚至是特定人类的复制品。

变压器的最新进展,如谷歌的双向编码器表示从变压器(伯特),OpenAI的通用终端和谷歌AlphaFold也产生了神经网络,不仅可以对语言、图像和蛋白质进行编码,还可以生成新的内容。

神经网络如何改变生成人工智能

自人工智能早期以来,研究人员一直在创造人工智能和其他以编程方式生成内容的工具。最早的方法被称为基于规则的系统,后来被称为“专家系统”,使用明确制定的规则来生成响应或数据集。

神经网络构成了今天许多人工智能和机器学习应用的基础,它扭转了这个问题。神经网络旨在模仿人脑的工作方式,通过在现有数据集中寻找模式来“学习”规则。开发于20世纪50年代和60年代的第一批神经网络受到计算能力不足和小数据集的限制。直到2000年代中期大数据的出现和计算机硬件的改进,神经网络才开始用于生成内容。

当研究人员找到一种方法,让神经网络在计算机游戏行业用于渲染视频游戏的图形处理单元(GPU)之间并行运行时,该领域加速发展。过去十年中开发的新机器学习技术,包括前面提到的生成对抗网络和变形金刚,为最近人工智能生成内容的显著进步奠定了基础。

Dall-E,ChatGPT,Bard是什么?

ChatGPT、Dall-E和Bard是流行的生成式AI接口。

达尔伊。在图像及其相关文本描述的大数据集上训练,达尔-埃是一个多模态人工智能应用程序的例子,它可以识别多种媒体之间的连接,如视觉、文本和音频。在这种情况下,它将单词的含义与视觉元素联系起来。它是用OpenAI公司GPT在2021年实施。Dall-E 2是第二个更强大的版本,于2022年发布。它使用户能够根据用户提示生成多种风格的图像。

ChatGPT。2022年11月风靡全球的人工智能聊天机器人建立在OpenAI的GPT 3.5实现之上。OpenAI提供了一种通过带有交互式反馈的聊天界面进行交互和微调文本响应的方式。早期版本的GPT只能通过API访问。GPT-4于2023年3月14日发布。ChatGPT聊天机器人将与用户对话的历史记录整合到搜索结果中,模拟真实的对话。在新的GPT界面大受欢迎之后,微软宣布了一个重要的新投资OpenAI并将GPT的一个版本整合到必应搜索引擎中。

下面是ChatGPT和Bard之间的区别。

吟游诗人。谷歌是另一个在处理语言、蛋白质和其他类型内容的transformer AI技术方面的早期领导者。它为研究人员开源了其中的一些模型。然而,它从未为这些模型发布公共接口。微软在必应中实现GPT的决定促使谷歌急于推出面向公众的聊天机器人,谷歌诗人,建立在其LaMDA系列大型语言模型的轻量级版本上。在语言模型错误地称韦伯望远镜是第一个发现外太阳系行星的望远镜后,巴德匆忙首次亮相,谷歌股价遭受重大损失。与此同时,由于不准确的结果和不稳定的行为,Microsoft和ChatGPT在早期的发布中也丢了脸。Google随后发布了基于其最先进的LLM的新版Bard,掌上电脑2,这使得Bard在回应用户查询时更加高效和直观。

生成式人工智能有哪些用例?

生成式人工智能可以应用于各种用例中,以生成几乎任何类型的内容。得益于尖端技术,这种技术正变得越来越容易被各类用户使用像GPT这样的突破可以针对不同的应用进行调整。一些生成式人工智能的用例包括以下内容:

  • 为客户服务和技术支持实施聊天机器人。
  • 部署deepfakes来模仿人甚至特定的个人。
  • 改进不同语言的电影和教育内容的配音。
  • 写邮件回复,约会简介,简历和学期论文。
  • 以一种特殊的风格创造照片般真实的艺术。
  • 改进产品演示视频。
  • 建议测试新的药物化合物。
  • 设计物理产品和建筑。
  • 优化新的芯片设计。
  • 以特定的风格或音调创作音乐。

生成式AI有什么好处?

生殖人工智能可以广泛应用于商业的许多领域。它可以更容易地解释和理解现有的内容,并自动创建新的内容。开发人员正在探索生成式人工智能改善现有工作流程的方法,着眼于完全适应工作流程,以利用该技术。一些潜力实现生成式人工智能的好处包括以下内容:

  • 自动化编写内容的手动过程。
  • 减少回复邮件的工作量。
  • 改善对特定技术问题的回应。
  • 创造真实的人物形象。
  • 将复杂的信息总结成连贯的叙述。
  • 简化以特定风格创建内容的过程。

生成式AI有哪些局限性?

生成式人工智能的早期实现生动地说明了它的许多局限性。一些生成人工智能带来的挑战来自用于实现特定用例的特定方法。例如,一个复杂主题的摘要比包含支持关键点的各种来源的解释更容易阅读。然而,概要的可读性是以用户能够检查信息来自哪里为代价的。

以下是实现或使用创成式人工智能应用时需要考虑的一些限制:

  • 它并不总是识别内容的来源。
  • 评估原始来源的偏差可能具有挑战性。
  • 听起来真实的内容使得识别不准确的信息更加困难。
  • 很难理解如何适应新的环境。
  • 结果可以掩盖偏见、成见和仇恨。

注意力是你所需要的:变形金刚带来新的能力

2017年,谷歌报道了一项新型神经网络结构这极大地提高了自然语言处理等任务的效率和准确性。突破性的方法,叫做变形金刚是基于注意力的概念。

在高层次上,注意力指的是事物(如单词)如何相互联系、互补和修饰的数学描述。研究人员在他们的开创性论文中描述了这种架构,”你需要的只是关注,展示了transformer神经网络如何能够更准确地在英语和法语之间进行翻译,并且仅用了其他神经网络四分之一的训练时间。突破性的技术也可以发现关系或隐藏的顺序,隐藏在数据中的其他事物之间,人类可能没有意识到,因为它们太复杂,无法表达或辨别。

变压器架构自推出以来发展迅速,产生了LLM,如GPT-3以及更好的预训练技术,比如谷歌的BERT。

围绕生成式人工智能有哪些担忧?

崛起的生成式AI也引发了各种担忧。这些与结果的质量、误用和滥用的可能性以及破坏现有商业模式的可能性有关。以下是目前人工智能的发展状况所引发的一些特定类型的问题:

  • 它可以提供不准确和误导性的信息。
  • 在不知道信息来源和出处的情况下,更难信任。
  • 它可以促进新类型的剽窃,这种剽窃忽视了原创内容的创作者和艺术家的权利。
  • 它可能会破坏围绕搜索引擎优化和广告建立的现有商业模式。
  • 更容易产生假新闻。
  • 这使得人们更容易声称,不法行为的真实照片证据只是人工智能生成的赝品。
  • 它可以模仿人类进行更有效的社会工程网络攻击。
实现生成式人工智能不仅仅是技术。企业还必须考虑其对人员和流程的影响。

有哪些生成式AI工具的例子?

生成性人工智能工具存在于各种形式,如文本、图像、音乐、代码和语音。一些流行的人工智能内容生成器探索包括以下内容:

  • 文本生成工具包括GPT,贾斯珀,人工智能作家和莱克斯。
  • 图像生成工具包括Dall-E 2、Midjourney和Stable Diffusion。
  • 音乐生成工具包括Amper、Dadabots和MuseNet。
  • 代码生成工具包括CodeStarter、Codex、GitHub副驾驶还有塔布妮。
  • 语音合成工具有Descript、Listnr和Podcast.ai。
  • 人工智能芯片设计工具公司包括新思科技、Cadence、谷歌和英伟达。

按行业划分的生成性人工智能用例

新的生成性人工智能技术有时被描述为类似于蒸汽动力、电力和计算的通用技术,因为它们可以深刻影响许多行业和用例。需要记住的是,像以前的通用技术一样,人们通常需要几十年的时间才能找到组织工作流的最佳方式来利用新方法,而不是加快现有工作流的一小部分。以下是一些方法生成式人工智能应用可能会影响不同的行业:

  • 财务部门可以在个人历史背景下观察交易,以建立更好的欺诈检测系统。
  • 律师事务所可以使用生成式人工智能来设计和解释合同,分析证据并提出论点。
  • 制造商可以使用生成式人工智能结合来自相机、X射线和其他指标的数据,更准确、更经济地识别缺陷零件和根本原因。
  • 电影和媒体公司可以使用生成式人工智能更经济地制作内容,并用演员自己的声音将其翻译成其他语言。
  • 医疗行业可以使用生殖人工智能更有效地识别有前途的候选药物。
  • 建筑公司可以使用生成式人工智能更快地设计和改造原型。
  • 游戏公司可以使用生成式AI来设计游戏内容和关卡。

GPT加入了通用技术的行列

人工智能研究和部署公司OpenAI采用变形金刚背后的核心思想来训练其版本,称为生成性预训练变形金刚,或GPT。观察家们注意到,GPT是用来描述通用技术,如蒸汽机、电力和计算机的缩写。大多数人都会同意,随着研究人员发现将它们应用于工业、科学、商业、建筑和医学的方法,GPT和其他变压器的实现已经名副其实了。

生成人工智能中的伦理和偏见

尽管有这些承诺,新的生成性人工智能工具在准确性、可信度,偏见、幻觉和抄袭——伦理问题这可能需要数年时间来解决。这些问题对人工智能来说都不是什么新鲜事。例如,微软在2016年首次涉足聊天机器人,名为Tay,在Twitter上开始发表煽动性言论后,不得不关闭。

什么新的是,最新一批生成性人工智能应用表面上听起来更连贯。但这种类似人类的语言和连贯性的结合并不等同于人类智能,目前关于生成性人工智能模型是否可以被训练成具有推理能力存在很大的争论。一名谷歌工程师甚至在公开宣布该公司的生成性人工智能应用程序“对话应用程序语言模型”(LaMDA)有感知能力后被解雇。

生成性人工智能内容令人信服的现实主义引入了一系列新的人工智能风险。这让我们更难检测人工智能生成的内容更重要的是,当事情出错时,更难察觉。当我们依赖生成性人工智能结果来编写代码或提供医疗建议时,这可能是一个大问题。生殖人工智能的许多结果是不透明的,因此很难确定,例如,它们是否侵犯了版权,或者它们得出结果的原始来源是否有问题。如果你不知道人工智能是如何得出结论的,你就不能推理为什么它可能是错的。

生成人工智能与人工智能

生成性人工智能产生新的内容、聊天反应、设计、合成数据或深度伪造。另一方面,传统人工智能一直专注于检测模式、做出决策、完善分析、对数据进行分类和检测欺诈。

如上所述,生成式人工智能经常使用神经网络技术,如变压器、GANs和VAEs。不同的是,其他种类的人工智能使用技术包括卷积神经网络、递归神经网络和强化学习.

生成式人工智能通常以一个提示开始,让用户或数据源提交一个开始查询或数据集来指导内容生成。这可能是一个探索内容变化的迭代过程。传统的人工智能算法处理新数据,返回一个简单的结果。

生成人工智能历史

约瑟夫·韦森鲍姆在20世纪60年代创造的伊莱扎聊天机器人就是其中之一生成人工智能的最早例子。这些早期的实现使用基于规则的方法,由于词汇有限、缺乏上下文和过度依赖模式等缺点,这种方法很容易崩溃。早期的聊天机器人也很难定制和扩展。

2010年,随着神经网络和深度学习的进步,该领域出现了复兴,使该技术能够自动学习解析现有文本,对图像元素进行分类,并转录音频。

Ian Goodfellow在2014年介绍了GANs。这种深度学习技术为组织竞争的神经网络提供了一种新的方法,以生成内容变化并对其进行评级。这些可以生成真实的人、声音、音乐和文本。这激发了人们对如何使用生成性人工智能来创建逼真的深度假货的兴趣和担忧,这些假货可以模仿视频中的声音和人物。

从那时起,其他神经网络技术和架构的进展帮助扩展了生成性人工智能的能力。技术包括VAEs,长短期记忆,变压器,扩散模型和神经辐射场.

使用生成式人工智能的最佳实践

使用创成式人工智能的最佳实践将因设备、工作流程和预期目标而异。也就是说,在使用生成式人工智能时,考虑准确性、透明度和易用性等基本因素是很重要的。以下实践有助于实现这些因素:

  • 为用户和消费者明确标注所有生成性AI内容。
  • 在适用的情况下,使用主要来源审查生成内容的准确性。
  • 考虑偏见是如何被编织到人工智能结果中的。
  • 使用其他工具仔细检查人工智能生成的代码和内容的质量。
  • 了解每个生成性人工智能工具的优势和局限性。
  • 熟悉结果中的常见故障模式,并解决这些问题。

生成式人工智能的未来

ChatGPT令人难以置信的深度和易用性为生成式人工智能的广泛采用展示了巨大的前景。平心而论,它也展示了安全和负责任地推广这项技术的一些困难。但是这些早期的实现问题激发了对检测人工智能生成的文本、图像和视频的更好工具的研究。行业和社会也将建立更好的工具来跟踪信息的来源,以创造更值得信赖的人工智能。

此外,人工智能开发平台的改进将有助于加速未来更好的人工智能能力用于文本、图像、视频、3D内容、药品、供应链、物流和业务流程。尽管这些新的一次性工具很好,但生成式人工智能最重要的影响将来自于将这些功能直接嵌入到我们已经使用的工具版本中。

语法检查会越来越好。设计工具将更有用的建议直接无缝嵌入到工作流程中。培训工具将能够自动识别组织中某个部门的最佳实践,以帮助更有效地培训其他部门。这些只是生成式人工智能将改变我们工作方式的一小部分。

生殖人工智能将在许多商业功能中找到出路。

生成式人工智能常见问题

以下是人们对生成式人工智能的一些常见问题。

谁创造了生成式AI?

Joseph Weizenbaum在20世纪60年代创建了第一个生成性人工智能,作为Eliza聊天机器人的一部分。

Ian Goodfellow在2014年展示了生成性对抗网络,用于生成看起来和听起来都很真实的人。

来自Open AI和Google的对LLM的后续研究点燃了最近的热情,这种热情已经演变成了ChatGPT、Google Bard和Dall-E等工具。

生成式人工智能如何取代乔布斯?

生殖人工智能有可能取代各种工作,包括以下工作:

  • 写产品描述。
  • 创建营销文案。
  • 生成基本的web内容。
  • 发起交互式销售推广。
  • 回答客户问题。
  • 为网页制作图形。

一些公司将寻找机会在可能的情况下取代人类,而另一些公司将使用生殖人工智能来扩大和增强他们现有的劳动力。

你如何建立一个生成式人工智能模型?

生成式人工智能模型从有效地编码你想要生成的东西的表示开始。例如,文本的生成式人工智能模型可能会首先找到一种方法,将单词表示为向量,这些向量表征了同一句子中经常使用的单词之间的相似性,或者表示相似事物的单词。

LLM研究的最新进展已经帮助该行业实现了相同的过程来表示在图像、声音、蛋白质、DNA、药物和3D设计中发现的模式。这种生成式人工智能模型提供了一种有效的方式来表示所需类型的内容,并有效地迭代有用的变化。

你如何训练一个生成式AI模型?

生成式人工智能模型需要针对特定的用例进行训练。LLMs的最新进展为定制不同用例的应用程序提供了一个理想的起点。例如,OpenAI开发的流行的GPT模型已被用于编写文本、生成代码和基于书面描述创建图像。

训练包括为不同的用例调整模型的参数,然后在给定的一组训练数据上微调结果。例如,呼叫中心可以针对服务代理从各种类型的客户那里得到的问题以及服务代理给出的回复来训练聊天机器人。与文本不同,图像生成应用程序可能会从描述图像内容和风格的标签开始,以训练模型生成新图像。

生成式人工智能是如何改变创造性工作的?

生成人工智能承诺帮助创造性工作者探索各种想法。艺术家可能会从一个基本的设计概念开始,然后探索变化。工业设计师可以探索产品的变化。建筑师可以探索不同的建筑布局,并将其作为进一步完善的起点。

这也有助于创造性工作的某些方面民主化。例如,业务用户可以使用文本描述来探索产品营销图像。他们可以使用简单的命令或建议进一步改进这些结果。

生成式人工智能的下一步是什么?

ChatGPT生成类似人类文本的能力引发了人们对生成性人工智能潜力的广泛好奇。它还揭示了未来的许多问题和挑战。

在短期内,工作将专注于使用生成式人工智能工具改善用户体验和工作流程。建立对人工智能生成结果的信任也至关重要。

许多公司还会在自己的数据上定制生成式AI,以帮助改善品牌推广和沟通。编程团队将使用生成式人工智能来实施公司特定的最佳实践,以编写和格式化更具可读性和一致性的代码。

供应商将把生成性人工智能功能集成到他们的附加工具中,以简化内容生成工作流。这将推动这些新功能如何提高生产率的创新。

作为增强分析工作流的一部分,生成式人工智能还可以在数据处理、转换、标记和审查的各个方面发挥作用。语义万维网应用程序可以使用生成式人工智能来自动将描述工作技能的内部分类法映射到技能培训和招聘网站上的不同分类法。同样,业务团队将使用这些模型来转换和标记第三方数据,以实现更复杂的风险评估和机会分析功能。

未来,生成式人工智能模型将扩展到支持3D建模、产品设计、药物开发、数字双胞胎、供应链和业务流程。这将更容易产生新的产品创意,尝试不同的组织模式,探索各种商业创意。

定义了最新的生成人工智能技术

AI艺术(人工智能艺术)
人工智能艺术是用人工智能工具创建或增强的任何形式的数字艺术。阅读更多

Auto-GPT
Auto-GPT是一个实验性的开源自主人工智能代理,基于GPT 4语言模型,自动将任务链接在一起,以实现用户设定的大目标。阅读更多

谷歌搜索生成体验
谷歌搜索生成体验(SGE)是一套搜索和界面功能,将人工智能生成的结果集成到谷歌搜索引擎查询响应中。

Q-learning
Q-learning是一种机器学习方法,通过采取正确的行动,使模型能够随着时间的推移迭代学习和改进。

谷歌搜索实验室(GSE)
GSE是Alphabet谷歌部门的一项倡议,旨在以预览格式为谷歌搜索提供新的功能和实验,然后再公开发布。

初始得分
初始分数(IS)是一种数学算法,用于测量或确定由生成式人工智能通过生成式对抗网络(GAN)创建的图像的质量。“盗梦空间”一词指的是传统上由人类经历的创造性的火花或思想或行动的最初开始。

人类反馈强化学习(RLHF)
RLHF是一种机器学习方法,它将强化学习技术(如奖励和比较)与人类指导相结合,以训练人工智能代理。

可变自动编码器(VAE)
变分自动编码器是一种生成式人工智能算法,它使用深度学习来生成新内容,检测异常并消除噪声。

自然语言处理有哪些生成模型?

自然语言处理的一些生成模型包括:

  • 卡内基梅隆大学的XLNet
  • OpenAI的GPT(预训练生成变压器)
  • 谷歌的艾伯特(“A Lite”BERT)
  • Google Bard
  • 谷歌LaMDA

AI会获得意识吗?

一些人工智能的支持者认为,生成性人工智能是迈向通用人工智能甚至意识的重要一步。谷歌LaMDA聊天机器人的一名早期测试者甚至在公开宣称它有感知能力时引起了轰动。后来他被公司解雇了。

1993年,美国科幻小说作家兼计算机科学家Vernor Vinge提出,30年后,我们将拥有创造“超人智能”的技术能力,这是一种比人类更聪明的人工智能,此后人类时代将结束。人工智能先驱雷·库兹韦尔预测到2045年会出现这样的“奇点”。

许多其他人工智能专家认为可能会更远。机器人先驱罗德尼·布鲁克斯预测人工智能在有生之年不会获得6岁儿童的感知能力,但到了2048年可能会像狗一样聪明和专注。

给TA打赏
共{{data.count}}人
人已打赏
定义

机器学习

2023-8-14 17:11:25

定义

算法

2023-8-14 17:44:11

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
今日签到
有新私信 私信列表
搜索