人工智能 |自然语言生成


人工智能 |自然语言生成

人工智能,定义为机器表现出的智能,在当今社会有许多应用。它应用最广泛的应用之一是自然语言生成。

什么是自然语言生成 (NLG)?

自然语言生成 (NLG) 简单地意味着从计算机数据生成文本。它充当翻译并将计算机化数据转换为自然语言表示。在这种情况下,根据收集的数据和用户提供的输入生成结论或文本。它是从机器表示系统生成自然语言的自然语言处理任务。自然语言生成在某种程度上与自然语言理解相反。在自然语言理解中,系统需要消除输入句子的歧义以产生机器表示语言,而在自然语言生成中,系统需要决定如何将概念转化为文字。

生成文本的过程可以像保留复制和粘贴的现成文本列表一样简单。在简单的应用程序中,例如星座运势机或个性化商业信函的生成器,后果可能是令人满意的。但是,需要一个复杂的 NLG 系统来包括规划和合并信息的各个阶段,以生成看起来自然且不会变得重复的文本。

简单 NLG 系统的一个例子是 Pollen Forecast for Scotland 系统,它本质上可以是一个模板。NLG 系统以六个数字作为输入,这些数字预测苏格兰不同地区的花粉水平。根据这些数字,系统生成花粉水平的简短文本摘要作为其输出。

例如,使用 2005 年 7 月 1 日的历史数据,该软件生成了星期五的草花粉水平已从昨天的中等水平增加到高水平,该国大部分地区的值约为 6 到 7。然而,在北部地区,花粉水平将是中等的,值为 4。相比之下,由人类气象学家根据这些数据撰写的实际预测是,预计苏格兰大部分地区的花粉计数将保持在 6 级的高水平,甚至在东南部也将保持在 7 级。唯一的缓解是在北部群岛和苏格兰大陆的远东北部,花粉计数中等水平。

NLG 的工作原理是什么?

自然语言生成 (NLG) 是 AI 的一个分支,专注于从数据中自动生成类似人类的语言。NLG 系统将结构化数据作为输入,并将其转换为连贯的、上下文相关的人类可读文本。目标是使生成的文本听起来像是由人类编写的。

以下是自然语言生成工作原理的高级概述:

数据输入:结构化数据是 NLG 系统使用的第一个输入。此信息可能来自多个来源,包括电子表格、数据库和其他有序格式。

内容规划:根据对输入数据的分析,系统决定生成的文本中要包含哪些详细信息。需要对内容、安排和一般结构的选择做出选择。

文本规划:NLG 系统在决定内容后安排内容的自然语言表达。它为生成的文本选择正确的措辞、语气和样式。

句子生成:使用计划的内容作为指导,系统生成单个句子。为此,选择正确的单词、短语和句法结构是必要的。虽然一些 NLG 系统使用预定义的模板生成文本,但其他 NLG 系统可能会使用更高级的技术,例如机器学习。

连贯性和一致性:NLG 系统生成的文本应保持一致且连贯。这需要确保生成的句子遵循语法和文体惯例并自然流畅。它还可能需要继续制作与早期作品一致的内容。

细化:为了提高生成文本的口径,可以使用细化程序。这可能需要为自然性、清晰度和语法做额外的校对。

自然语言生成的阶段

  • 内容确定:决定句子中要表示的主要内容或文本中要提及的信息。例如,在上面的花粉示例中,决定是否明确提及东南部的花粉水平为 7。
  • 文档结构:决定所传达信息的结构或组织。例如,决定首先描述花粉水平高的区域,而不是花粉水平低的区域。
  • 聚合:将相似的句子放在一起以提高理解和可读性。例如,将周五的草花粉水平已从昨天的中等水平增加到高水平,全国大部分地区的草花粉水平将在 6 到 7 左右合并到一个句子中,周五的草花粉水平已从昨天的中等水平增加到高水平,全国大部分地区的值约为 6 到 7。
  • 词汇选择:使用适当的词语,清楚地传达含义。例如,在描述花粉水平 4 时,决定应使用 medium 还是 medium。
  • 引用表达式生成:创建此类引用表达式,以帮助识别特定对象和区域。例如,决定在 Northern Isles 和 Far northeast of Continental Scotland 中使用来指代苏格兰的某个地区。此任务还包括对代词和其他类型的 anaphora 做出决定。
  • 实现:根据语法规则创建和优化应该正确的文本。例如,使用 will be 表示将来时 to be。

评估 NLG 系统的技术

  1. 基于任务的评估: 它包括基于人工的评估,他们评估它对他执行任务的帮助程度。例如,可以通过将这些摘要提供给医生并评估这些摘要是否有助于医生做出更好的决策来评估生成医疗数据摘要的系统。
  2. 人工评分: 它根据一个人对文本的质量和有用性的评分来评估生成的文本。
  3. 指标: 它将生成的文本与专业人士撰写的文本进行比较。

交互式使用自然语言生成的一个示例是 WYSIWYM 框架,它代表所见即所得”它允许用户查看和作底层正式语言文档(NLG 输入)的连续呈现视图(NLG 输出),从而在不学习正式语言的情况下编辑正式语言。

另一个例子包括协助人类作家并使写作过程更加高效和有效的内容生成系统。已经构建了一个基于使用搜索引擎 API 的 Web 挖掘的内容生成工具。该工具模拟剪切和粘贴写作场景,其中作者从各种搜索结果中形成其内容。

到目前为止,最成功的 NLG 应用程序是 Data-to-Text 系统,它生成数据库和数据集的文本摘要;这些系统通常执行数据分析和文本生成。特别是,已经构建了几个系统,可以从天气数据生成文本天气预报。

自然语言生成的应用

自然语言生成 (NLG) 在一系列领域中有许多重要用途。以下是 NLG 广泛使用的一些值得注意的领域

智能自动化和报告:

  • NLG 用于将分析和复杂数据转换为人类可以理解的报告和摘要。这使得利益相关者特别容易理解商业智能中的见解并采取行动。

营销和内容创作:

  • NLG 用于为博客、网站和广告宣传材料创建内容。它可以大规模制作书面材料,包括商品描述和促销内容。

虚拟助手和聊天机器人:

  • 通过允许聊天机器人和虚拟助手以自然语言进行响应,自然语言生成 (NLG) 提高了他们的对话技能。确保用户体验既有吸引力又像人一样是势在必行的。

金融和投资分析:

  • 使用数字数据和趋势,自然语言生成 (NGL) 在金融行业中用于自动生成财务报告、投资摘要和市场评论。

病案:

  • NLG 用于从电子健康记录 (EHR) 生成医疗报告、文档和患者摘要。在医疗环境中,它可以简化记录程序。

教育内容和电子学习:

  • NLG 有助于为学生创建教学材料、评估和个性化反馈。它有助于创建适应性强的学习平台。

NLP、NLG 和 NLU 之间的差异

自然语言处理 (NLP)、自然语言生成 (NLG) 和自然语言理解 (NLU) 是自然语言处理的三个不同但相互关联的领域。以下是它们之间差异的简要概述:

自然语言处理

自然语言生成

自然语言理解

定义

自然语言处理 (NLP) 是一个研究人类语言和计算机如何交互的大型科学领域。它包括有关口语的理解、解释和生产的所有活动。

NLG 是 NLP 的一个子集,专注于计算机生成的类似于人类的语言。它需要将信息或结构化数据转换为以自然语言编写的文本。

NLU 是 NLP 的一个子集,主要关注计算机如何理解和解释人类语言。它需要从文本信息中获得意义。

目标

自然语言处理 (NLP) 的目标是使计算机能够理解、解释和生成有意义的、与上下文相关的人类语言。

自然语言生成 (NLG) 的目标是生成合乎逻辑、适合上下文且听起来像人类语音的文本。目标是生成人类可读的报告、摘要或内容的应用程序经常使用它。

NLU 旨在赋予机器理解人类语言的含义、上下文和意图的能力。这包括情感分析、语言理解和实体识别等任务。

应用

自然语言处理 (NLP) 应用于多个领域,例如语音识别、机器翻译、情感分析和信息检索。

自然语言生成 (NLG) 用于聊天机器人、内容制作、自动报告生成以及需要将结构化数据转换为自然语言文本的任何其他情况。

自然语言理解 (NLU) 对于需要从文本数据中提取见解和信息的系统(例如聊天机器人和虚拟助手)至关重要。

常见问题 (FAQ)

Q.“自然语言生成”是什么意思?

使用人工智能将数据转换为自然语言的过程称为自然语言生成或 NLG。NLG 软件通过使用由机器学习和深度学习驱动的人工智能模型将数字转换为人类可读的自然语言文本或语音来实现这一目标。

Q.NLG 与 NLP 和 NLU 有什么区别?

自然语言处理 (NLP) 是一个更通用的领域,研究计算机和人类语言如何交互。NLU (Natural Language Understanding) 关注理解语言并从语言中获取意义,而 NLG 则专注于文本生成。

Q.NLG 的关键组成部分是什么?

句子创建、优化、内容规划和文本规划都是常见的 NLG 任务。通过采取这些预防措施,可以保证生成的文本在语法上正确、上下文相关且合规。

Q.是什么让 NLG 如此重要?

自然语言生成包含在许多商业智能 (BI) 工具中,因为它在需要从业务数据生成基于文本的叙述或口语内容的情况下非常有用。NLG 最流行的用途是作为自助分析的实际补充。

登录后免费查看全文
立即登录
App下载
技术邻APP
工程师必备
  • 项目客服
  • 培训客服
  • 平台客服

TOP