预示分析法

自然语言自动处理的一种方法。采用这种方法,在计算机从左到右按照一个方向分析句子的过程中,对于每一个词,都要给出其预示信息,以预示这个词之后可能出现什么样的语言成分。如果下面一个词满足这个预示信息,分析就可继续下去,反之,分析就停止。预示分析要采用后进先出栈来存贮有关预示信息。如果后进先出栈变空,则分析结束(见自动机理论)。

例如,如果要分析The scholars study mathematical linguistics (学者们研究数理语言学)这个句子,首先,针对这个句子,提出若干条规则:

(1)S→Art+NP+VP+NP1

(2)NP1→Adj+NP

(3)NP→Noun

(4)VP→Verb

其中, S表示句子,Art表示冠词,Adj表示形容词,Noun表示名词,Verb表示动词,NP表示名词词组,VP表示动词词组, NP1表示带有形容词修饰语的名词词组。

规则①表示S可由一个Art,一个NP,一个VP及一个NP1顺次组成,在这个规则中,Art这个信息可以预示NP-VP-NP1这个符号串的出现。

规则②表示NP1可由一个 Adj及一个NP组成,Adj这个信息可预示NP这个符号的出现。

规则③表示NP可由一个Noun组成,Noun这个信息不能预示什么。

规则④表示VP可由一个Verb组成,Verb这个信息也不能预示什么。

所要分析的句子输入后,就记上有关的词类符号:

The scholars study mathematical linguistics.

Art  Noun  Verd   Adj    Noun

然后,根据上述规则,利用后进先出栈来进行分析。

先执行规则①,右端的第1个符号Art与输入句子中的第 1个符号相配,故把Art的预示信息NP—VP—NP1顺次存入后进先出栈中,此时,后进先出栈中的情况见(图1)。

图1 图2

接着扫描输入句子的第 2个符号Noun,这一符号与规则③?a href='http://www.b15k.com/baike/222/320239.html' target='_blank' style='color:#136ec2'>杏叶说牡谝桓龇臢oun相配,而Noun这个符号不预示什么,所以,在后进先出栈中抹去栈顶的预示信息NP,这时栈中的情况见(图2)。

再接着扫描输入句子的第 3个符号Verb,这一符号与规则④右端的符号Verb相配,而Verb这个符号不预示什么,所以,在后进先出栈中抹去栈顶的预示信息VP,这时栈中的情况见(图3)。

然后,扫描输入句子的第4个符号Adj,这一符号与规则②右端的第一个符号Adj相配,而Adj这个符号的预示信息是 NP,故在后进先出栈中抹去栈顶符号NP1,然后存入Adj的预示信息NP,这时栈中的情况见(图4)。

图3 图4

最后,扫描输入句子中的第五个符号Noun,这一符号与规则③右端的符号Noun相配,由于Noun这个符号没有任何的预示信息,故在后进先出栈中抹去栈顶符号NP,这时,后进先出栈变空,而输入句子也扫描完毕,说明这个输入句子是合乎英语语法的,分析结束。

为了提高预示分析法的效率,可以给每个预示信息加一个“紧急数”,“紧急数”按其重要性的大小从高到低加以编号,在分析过程中,当预示信息实现其预示作用后,就将这个预示信息抹掉。

有的学者还提出了多路预示分析法。这种分析法能够对句子中全部可能的情况作出语法分析,在分析过程中,可以放弃那些与所分析的问题关系不大的线路,而着重分析那些与所分析的问题关系密切的线路,从而解决句法歧义等问题。

参考书目
  1. A.G.Oettinger, Automɑtic Syntɑctic Anɑlys ɑnd the Pushdown Store , in Proceedings of 12th
  2. Sym-posium of Applied Mathematics, American
  3. Mathema-tical Society, Providence, 1961.
热门点击
最近更新