双字母组
双字母组 或称 二元语法(英语:bigrams,或称digrams),作为统计分析文本使用非常广泛;它是由两个字母,或者两个音节,或者两个词构成的双字母组。这种组被用在最成功的一种 语音识别 的 语言模型 中。 它们是N字母组的一种特例。
Gappy bigrams 或称 skipping bigrams 是允许有跳空的词对组(也许想避免把词连接起来,或者想允许某种模拟的依赖,如 dependency grammar)。
Head word bigrams 是具有明确依赖关系的 gappy bigrams。