什么是生成式人工智能?

生成式人工智能(gen AI)是一种人工智能(AI),它可以创建新的内容和想法(例如图像和视频),也可以重复使用已知知识来解决新问题。

什么是 Gen AI?

生成式人工智能(也称为生成式 AI 或 gen AI)是一种可以创建新的内容和想法(包括对话、故事、图像、视频和音乐)的 AI。它可以学习人类语言、编程语言、艺术、化学、生物学或任何复杂的主题,也可以重复利用已知知识来解决新问题。

例如,学习英语词汇并根据其处理的字词创作一首诗。

您的组织可以将生成式人工智能用于各种用途,例如聊天机器人、媒体创作以及产品开发和设计。

年轻的业务人员合作开发新项目

生成式人工智能示例

生成式人工智能在各个行业都有许多使用案例

金融服务

金融服务公司可以利用生成式人工智能工具,在降低成本的同时更好地为客户提供服务:

  • 金融机构使用聊天机器人生成产品推荐并回复客户查询,从而改善整体客户服务
  • 贷款机构加快金融服务不足的市场(特别是在发展中国家)的贷款审批
  • 银行快速检测到索赔、信用卡和贷款中的欺诈行为
  • 投资公司利用生成式人工智能的强大功能,以低成本为其客户提供个性化的金融建议

阅读有关 AWS 上适用于金融服务行业的生成式人工智能的更多信息

金融饼图

医护及生命科学

生成式人工智能最有前景的使用案例之一是加速药物发现和研究。生成式人工智能可以创建具有特定特性的新型蛋白质序列,以此设计抗体、酶、疫苗和基因疗法。

医疗保健和生命科学公司使用生成式人工智能工具设计合成基因序列,为合成生物学和代谢工程应用程序设计合成基因序列。例如,这些公司可以创建新的生物合成途径或优化用于生物制造的基因表达。

生成式人工智能工具还可以创建合成的患者和医疗保健数据。这些数据对于在不访问大型现实数据集的情况下训练 AI 模型、模拟临床试验或研究罕见疾病非常有用。

阅读有关 AWS 上适用于医疗保健与生命科学行业的生成式人工智能的更多信息

双手环抱地球

汽车和制造业

汽车公司将生成式人工智能技术用于从工程到车内体验和客户服务的多种用途。例如,这些公司可以优化机械零件的设计,以减少车辆设计中的阻力或调整辅助系统的设计。

汽车公司使用生成式人工智能,通过快速回答最常见的客户问题来优化客户服务。生成式人工智能可以创建新的材料、芯片和零件设计,以优化制造流程并降低成本。

另一个生成式人工智能使用案例是合成数据以测试应用程序。这对于通常未包含在测试数据集中的数据(例如缺陷或边缘情况)特别有用。

阅读有关 AWS 上适用于汽车行业的生成式人工智能的更多信息

阅读有关 AWS 上适用于制造行业的生成式人工智能的更多信息

汽车和制造业

远程通信

电信领域的生成式人工智能使用案例专注于重塑由订阅用户在客户旅程的各个接触点上的累积互动定义的客户体验:

例如,电信组织可以应用生成式人工智能,通过类似人类的实时对话代理来改善客户服务。这些组织可以通过个性化的一对一销售助手来重塑客户关系。他们还可以通过分析网络数据来推荐修复方法,从而优化网络性能。 

阅读有关 AWS 上适用于电信行业的生成式人工智能的更多信息

远程通信

媒体和娱乐

从动画和脚本到完整的电影,生成式人工智能模型只需花费相当于传统生产一小部分的成本和时间,即可制作出新颖的内容。

业内其他生成式人工智能使用案例包括:

  • 艺术家可以通过人工智能生成的音乐来补充和增强他们的专辑,从而创作出全新的体验。
  • 媒体组织使用生成式人工智能,通过提供个性化内容和广告来改善受众体验,从而增加收入。
  • 游戏公司使用生成式人工智能来创建新游戏并允许玩家构建头像。
媒体和娱乐

生成式人工智能的优点

高盛表示,生成式人工智能可推动全球国内生产总值(GDP)增长 7%(或近 7 万亿美元),并在十年内将生产率增长提高 1.5 个百分点。接下来,我们将介绍生成式人工智能的更多优点。
生成式人工智能算法可以用新的方式探索和分析复杂的数据,使研究人员能够发现原本可能不明显的新趋势和模式。这些算法可以汇总内容,概述多种解决方案路径,集思广益,并根据研究笔记创建详细的文档。这就是生成式人工智能可极大地增强研究和创新的原因所在。例如,制药行业正在使用生成式人工智能系统来生成和优化蛋白质序列,并显著加快推进药物发现。
生成式人工智能可以自然地响应人类对话,并可用作客户服务和客户工作流程个性化的工具。例如,可以使用人工智能驱动的聊天机器人、语音机器人和虚拟助手,它们可以更准确地响应客户,从而可在首次联系时解决问题。它们可以通过以个性化的方式展示精心策划的服务和沟通内容来提高客户参与度。

借助生成式人工智能,企业可以在所有业务领域利用机器学习(ML)和 AI 应用程序来优化业务流程。可以将此技术应用于所有业务领域,包括工程、营销、客户服务、财务和销售。

例如,以下是生成式人工智能可以执行的优化:

  • 从任何来源提取和汇总数据,将其用于知识搜索功能。
  • 评估和优化营销、广告、财务和物流等领域的不同成本降低方案。
  • 生成合成数据,为有监督学习和其他机器学习过程创建标注数据。

生成式人工智能模型可以增强员工的工作流程,并且充当组织中每个人的高效助手。它们可以采用类似人类的方式完成从搜索到创建的所有任务。生成式人工智能可以提高不同类型员工的工作效率:

     
  • 根据特定的输入和约束条件生成多个原型,从而支持创意任务。该技术还可以根据人工反馈和指定约束条件优化现有设计。
  • 针对应用程序开发任务生成新的软件代码建议
  • 通过生成报告、摘要和预测来支持管理。
  • 为营销团队生成新的销售脚本、电子邮件内容和博客。

可以节省时间、降低成本并提高整个组织的效率。

生成式人工智能技术如何演变?

过去几十年来,统计学中一直使用基本生成模型来帮助进行数值数据分析。神经网络和深度学习是现代生成式人工智能的最新先驱技术。2013 年开发而成的变分自动编码器是第一个可以生成逼真图像和语音的深度生成模型。

VAE

VAE(变分自动编码器)引入了创建多种数据类型的创新变体的功能。该功能推动其他生成式人工智能模型的迅速出现,例如生成式对抗网络和扩散模型。这些创新侧重于让生成的数据日益类似于真实数据,尽管这些数据是人为创建的。

生成式人工智能模型

转换器

2017 年,随着转换器的推出,人工智能研究发生进一步的转变。转换器将编码器和解码器架构与注意力机制无缝集成。转换器以卓越的效率和多功能性简化语言模型的训练过程。像 GPT 这样的著名模型已成为基础模型,它们能够在广泛的原始文本语料库上进行预训练,并针对不同的任务进行微调。

转换器变革自然语言处理可能实现的功能。它们为从翻译、摘要到回答问题等任务提供了生成式功能。

生成式人工智能方块

未来

许多生成式人工智能模型持续取得长足进步,并且已经形成跨行业应用。最近的创新侧重于完善模型以使用专有数据。研究人员还希望创建越来越类似人类行为的文本、图像、视频和语音。

生成式人工智能的未来

生成式人工智能如何运作?

像所有人工智能一样,生成式人工智能的运作方式是使用机器学习模型,机器学习模型是根据大量数据进行预训练的超大型模型。

基础模型

基础模型(FM)是在广泛的广义和未标记数据上训练的机器学习模型。这些模型能够执行各种各样的一般任务。

FM 是这项已经发展了数十年的技术的最新进展结果。通常,FM 使用学习的模式和关系来预测序列中的下一个项目。

例如,在生成图像时,模型会分析图像并创建更清晰、更明确定义的图像版本。同样,对于文本,模型会根据之前的单词及其上下文预测文本字符串中的下一个单词。然后,模型使用概率分布技术选择下一个单词。

大型语言模型

大型语言模型(LLM)就是一类基础模型。例如,OpenAI 的生成式预训练转换器(GPT)模型是 LLM。LLM 专门处理基于语言的任务,例如摘要、文本生成、分类、开放式对话和信息提取。

了解 GPT »

LLM 的与众不同在于它们能够执行多项任务。实现此功能的原因是 LLM 包含许多参数,使其能够学习高级概念。

像 GPT-3 这样的 LLM 可以考虑数十亿个参数,并且能够根据很少量的输入生成内容。通过在预训练中接触各种形式和多种模式的互联网规模数据,LLM 学会了在各种环境中应用它们的知识。

生成式人工智能模型如何运作?

传统的机器学习模型具有辨别性,或者侧重于对数据点进行分类。它们尝试确定已知因素和未知因素之间的关系。例如,这些模型查看图像,即像素排列、线条、颜色和形状等已知数据,然后将它们映射到字词,即未知因素。从数学上讲,这些模型的工作原理是识别可以用数值方式将未知和已知因素映射为 x 和 y 变量的方程。生成式模型在此基础上更进一步。这些模型不是在给定某些特征的情况下预测标签,而是在给定具体标签的情况下尝试预测特征。从数学上讲,生成式建模计算 x 和 y 同时出现的概率。该模型学习不同数据特征的分布及其关系。例如,生成式模型分析动物图像以记录变量,例如不同的耳朵形状、眼睛形状、尾巴特征和皮肤图案。这些模型学习特征及其关系,以了解不同动物的总体外观。然后,它们可以重新创建训练集中没有的新动物图像。接下来,我们给出几大类生成式人工智能模型。

扩散模型

扩散模型通过对初始数据样本进行迭代性的受控随机更改来创建新数据。这些模型以原始数据为起点,然后加入细微的变化(噪点),逐渐使其与原始数据不那么相似。这种噪点经过仔细控制,以确保生成的数据保持一致性和真实性。

在多次迭代中添加噪点之后,扩散模型反转该过程。反向去噪会逐渐消除噪点,从而产生与原始数据样本相似的新数据样本。

扩散模型

生成对抗网络

生成式对抗网络(GAN)是另一种基于扩散模型概念构建的生成式人工智能模型。

GAN 的工作原理是以竞争方式训练两个神经网络。第一个网络称为生成者,通过添加随机噪点来生成虚假的数据样本。第二个网络称为辨别者,其尝试区分真实数据和生成者产生的虚假数据。 

在训练过程中,生成者不断提高其创建逼真数据的能力,而辨别者日益加强区分真假数据的能力。这种对抗过程一直持续到生成者产生的数据令人信服,以至于辨别者无法将其与真实数据区分。

GAN 广泛用于生成逼真的图像、风格转换和数据增强任务。

生成对抗网络

变分自动编码器

变分自动编码器 (VAE) 学习一种称为潜在空间的紧凑数据表示形式。潜在空间是数据的数学表示形式。可以将潜在空间视为唯一的代码,根据数据的所有属性来表示数据。例如,如果研究面部,则潜在空间包含代表眼睛形状、鼻子形状、颧骨和耳朵的数字。

VAE 使用两个神经网络,即编码器和解码器。编码器神经网络将输入数据映射为潜在空间每个维度的均值和方差。该神经网络从高斯(正态)分布中生成随机样本。此样本是潜在空间中的一个点,表示输入数据的压缩简化版本。

解码器神经网络从潜在空间中获取此取样点,然后将其重新构造回与原始输入相似的数据。使用数学函数衡量重新构造的数据与原始数据的匹配程度。

变分自动编码器

基于转换器的模型

基于转换器的生成式人工智能模型建立在 VAE 的编码器和解码器概念之上。基于转换器的模型为编码器添加更多层,以提高理解、翻译和创意写作等文本式任务的处理性能。

基于转换器的模型使用自注意力机制。在处理序列中的每个元素时,这些模型权衡输入序列中不同部分的重要性。

另一个关键功能是这些人工智能模型实现上下文嵌入。序列元素的编码不仅取决于元素本身,还取决于其在序列中的上下文。

基于转换器的模型的运作方式

要理解基于转换器的模型如何运作,可以将语句想象成单词序列。

自注意力可以帮助模型在处理每个单词时将注意力集中在相关的单词上。为获取单词之间不同类型的关系,基于转换器的生成式模型采用称为注意力头的多个编码器层。每个头都关注输入序列的不同部分,从而使模型能够同时考虑数据的各个方面。

每一层还优化了上下文嵌入,使嵌入的信息更丰富,同时可获取从语法句法到复杂语义的所有内容。

基于转换器的模型

面向初学者的生成式人工智能培训

生成式人工智能培训从理解基础机器学习概念开始。学员还必须探索神经网络和 AI 架构。使用 TensorFlow 或 PyTorch 等 Python 库的实际经验对于实施和试验不同的模型至关重要。您还必须学习模型评估、微调和提示工程技能。

人工智能或机器学习学位可提供深入的培训。考虑参加在线短期课程和认证以促进专业发展。AWS 上的生成式人工智能培训包括 AWS 专家就以下主题提供的认证:

 

面向初学者的生成式人工智能培训

生成式人工智能有哪些限制?

尽管生成式人工智能系统有所进步,但这些系统有时会生成不准确或误导性的信息。它们依赖于训练所依据的模式和数据,可以反映出这些数据中的固有偏差或误差。与训练数据相关的其他问题包括

安全性

如果使用专有数据自定义生成式人工智能模型,则会出现数据隐私和安全问题。必须努力确保生成式人工智能工具生成能够限制未经授权访问专有数据的响应。如果人工智能模型的决策缺乏问责性和透明度,也会出现安全问题。
了解使用 AWS 实现生成式人工智能的安全方法

创造力

尽管生成式人工智能可以生成富有创意的内容,但它往往缺乏真正的独创性。人工智能的创造力受其训练所依据的数据的限制,所输出的内容可能会有重复性或衍生性。人类的创造力涉及更深层次的理解和情感共鸣,对于人工智能而言,要完全复制这些特质,仍具挑战性。

考试价格

训练和运行生成式人工智能模型需要使用大量的计算资源。与尝试从头开始构建新模型相比,基于云的生成式人工智能模型更易于访问且更经济实惠。

可解释性

由于其复杂性和不透明性,生成式人工智能模型通常被视为黑匣子。了解这些模型如何产生特定的输出具有挑战性。改善可解释性和透明度对于增进信任和提高采用率至关重要。

生成式人工智能的采用有哪些最佳实践?

如果组织想要实施生成式人工智能解决方案,请考虑采用以下最佳实践来强化工作。
最好从内部应用程序开发开始采用生成式人工智能,重点关注流程优化和员工生产效率提升。可以获得更加可控的环境来测试结果,同时培养技能和理解相关技术。可以广泛测试模型,甚至可以在内部知识源上自定义模型。这样,在最终将这些模型用于外部应用程序时,客户将获得更理想的体验。
就所有生成式人工智能应用程序和输出进行清晰的沟通,这样用户就可知道他们正在与人工智能而非人类进行交互。例如,AI 可以自我介绍为人工智能,或者可以标记和突出显示基于人工智能的搜索结果。这样,用户就可以在与内容互动时自行做出判断。他们还可以更主动地处理底层模型可能存在的任何不准确或隐藏的偏差(由于训练数据的局限性)。
实施防护机制,从而生成式人工智能应用程序不会允许无意中未经授权访问敏感数据。让安全团队从一开始参与进来,这样就可在启动时考虑所有方面。例如,在根据内部数据训练任何模型之前,您可能必须掩蔽数据并移除个人身份信息(PII)。
开发自动和手动测试流程来验证结果,以及测试生成式人工智能系统可能遇到的所有类型场景。让不同的测试版测试人员组以不同的方式试用应用程序并记录结果。该模型还将通过测试不断改进,并且您可以更全面地控制预期结果和响应。

常见问题

基础模型是在广泛的文本和图像数据上训练的大型生成式人工智能模型。它们能够执行各种常规任务,例如回答问题、撰写论文和为图像添加字幕。
生成式人工智能于 2010 年代末出现,当时,深度学习,特别是生成式对抗网络(GAN)和 Transformer 等模型,取得了进展。自 2022 年以来,云计算的发展使生成式人工智能在商业上可行并可用。
人工智能是更广泛的概念,旨在让机器更加接近人类。人工智能的涵盖范围非常广,例如 Alexa 这样的智能助手、聊天机器人、图像生成器,以及机器人吸尘器和自动驾驶汽车。生成式人工智能则是人工智能的一个子集,专注于以有意义且智能的方式生成新内容。