上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
2.2.3 查找表字段
具有lookup键表明当前的对象是用来存储查找表的。在实体识别和意图识别的时候,如果开发者能给这些组件一些额外的特征,那么将提高这些组件的准确度。其中一种方式就是提供一个特征词列表,这个特征词列表就是查找表。
下面是一个查找表的示例。
当特征表中的数据和文本匹配时,查找表就会把相应位置的特征值设置为1,没有匹配上的设置为0,如图2-1所示。
图2-1 查找表特征工作原理示意图
在图2-2中,如果车站列表中存在“上海虹桥站”和“北京南站”,语句“订一张上海虹桥站到北京南站的车票”就会有查找表特征:[0001111101111000]。合法的车站名是可以穷举的,因此可以做成一个查找表。有了查找表特征的支持,模型就拥有了更多的知识来进行预测。模型会重点考虑这些查找表特征所标记的词句,因此,即使推理时出现训练数据中没有出现的车站名,模型也能在查找表特征的帮助下,正确地提取出车站名。