1、“封”组成多种与分封制有关的二字词、多字词。
2、根据汉语中二字词较多的特点,提出了一种新的分词词典机制。
3、实验结果表明,汉字关联度优于二字词词频、互信息、t检验等统计量。
4、根据汉语中二字词较多的特点,给出一种改进的自动分词词典机制,该机制在词典数据结构中增加二字词检测位图表。
5、此方法对孤立字和二字词同样有效,并可应用于汉语连续语音。
6、实验结果表明,基于二字词检测位图表的分词词典机制有效地提高了汉语自动分词的速度和效率。
7、实验结果表明:在相同条件下,基于二字词检测位图表的最大匹配分词算法较原算法分词速度更快。