颜色词“黑”、“白”、“红”的组配特征及其信息处理对策
本文以信息处理为目标,以具颜色义词“黑”、“白”、“红”为研究对象,在考察大规模语料的基础上,研究“黑”、“白”、“红”的词义、词性,分析组合成词及词间、词内搭配特征以及自动识别过程中可能遇到的问题。全文共分为三个部分: 第一部分是绪论。确定研究对象,阐述选题的目的和意义,综述颜色词“黑”、“白”、“红”的国内外研究现状,以及信息处理的现状,介绍本文的研究思路与拟采用的理论方法,最后交代语料来源。 第二部分是正文。包括第一章至第六章。 第一章是具颜色义词的义项考察。本章依据颜色词的定义及《现代汉语词典》(第六版)将其分为颜色义、非颜色义两大类,逐一考察它们的语义,并进行词频统计,为下文提取算法规则服务。 第二章是“黑”的组配特征分析。本章重点考察“黑”为颜色义及非颜色义时的情况,针对切分情况,研究未能正确切分的词的搭配情况。 第三章是“白”的组配特征分析。本章重点考察“白”为颜色义及非颜色义时的情况,针对切分情况,研究未能正确切分的词的搭配情况。 第四章是“红”的组配特征分析。本章重点考察“红”为颜色义及非颜色义时的情况,针对切分情况,研究未能正确切分的词的搭配情况。 第五章是词表与规则库构建。本章在前四章的基础上,建立“黑”、“白”、“红”自动识别时所需的词表,总结提取相应的规则,并对规则进行形式化表述。 第六章是算法设计与实现。本章在第五章的基础上,进行算法设计,并编写程序代码,进行编程测试,然后报告测试结果。 第三部分是结语(即第七章)。本章总结全文研究成果和研究意义,分析存在的不足和尚需解决的问题,并展望后续研究努力的方向。
现代汉语;颜色词;组配特征;信息处理
上海师范大学
硕士
语言学及应用语言学
任海波
2018
中文
H146
106
2018-12-19(万方平台首次上网日期,不代表论文的发表时间)