%A 肖天久, 刘颖 %T 《红楼梦》词和N元文法分析 %0 Journal Article %D 2015 %J 数据分析与知识发现 %R 10.11925/infotech.1003-3513.2015.04.07 %P 50-57 %V 31 %N 4 %U {https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/abstract/article_4040.shtml} %8 2015-04-25 %X

[目的]研究《红楼梦》前八十回与后四十回的关系, 从而判定《红楼梦》是否为一人所写。[方法]定量统计和定性分析相结合, 比较前、中、后四十回的独有词; 利用虚词、词及词类的N元文法模型、实词以及词长进行聚类; 计算三个部分的相似度。[结果]证明前八十回与后四十回有差异。前八十回用词连贯性较高, 更重视细节描写, 长词较少, 可读性更强; 后四十回更重视动作和场景化描写, 长词较多, 可读性稍弱。[局限]仅限于词和N元文法, 未能进一步考察语义、语篇等方面的特征。[结论]从词、词类、短语串和词类串等方面分析, 前八十回与后四十回很可能并非一人所作。