Python自然语言处理(微课版)
上QQ阅读APP看书,第一时间看更新

1.5.2 分类

语料库的划分一直是标准各异,其中,冯志伟教授的语料库划分比较有影响力且在学术界认可度较高。其划分类型如下。

(1)按语料选取的时间划分,可分为历时语料库和共时语料库。

(2)按语料的加工深度划分,可分为标注语料库和非标注语料库。

(3)按语料库的用途划分,可分为通用语料库和专用语料库。

(4)按语料库的表达形式划分,可分为口语语料库和文本语料库。