上QQ阅读APP看书,第一时间看更新
2.1 本章概览
本章首先简要回顾什么是自然语言处理,以及它可以提供什么服务。然后讨论自然语言处理的两个应用:词性标注和命名实体识别。之后解释这两种算法的功能、必要性和目的。此外,还有用来执行词性标注和命名实体识别的练习与活动,并构建和开发这些算法。
自然语言处理包括帮助机器理解人类的自然语言,以便与它们有效地交流并自动化大量任务。第1章讨论了自然语言处理的应用,以及现实生活中使用这些技术可以简化人类生活的例子。本章将具体探讨其中两种算法及其实际应用。
自然语言处理的每一个方面都可以被视为遵循了教学语言的相同类比。在第1章中,我们看到了如何告知机器要注意语料库的哪些部分,以及哪些部分是不相关和不重要的。它们需要接受训练,去除停止词和嘈杂的元素,并专注于关键词,将同一单词的各种形式简化为单词的词根形式,以便更容易搜索和解释。以类似的方式,本章中讨论的两种算法也像我们人类被教导的那样,教导机器关于语言的特定知识。