学位专题

目录>
<
DOI:10.7666/d.Y1794397

基于语料库的3-6岁汉语儿童词汇研究

张廷香
山东大学
引用
本研究运用语料库语言学的方法,通过建立3-6岁儿童抽样语料库,并对语料文本进行分词、词性标注等加工和词频统计,从而获得该年龄段儿童日常用词语的定量分析数据,进一步从“正-反”两方面对儿童话语“偏误”进行分析,揭示其中所反映出来的儿童语言能力和语言知识情况,从一个侧面对乔姆斯基“语言能力遗传”假说提出我们的看法。   全文共包括以下五章。   第一章引言,概括介绍了本选题的研究现状,说明了本研究的内容、重点和难点,指导理论等。针对以往儿童语言研究的特点,根据儿童发展语言学和乔姆斯基假说给儿童语言学研究提出的新课题,提出了从儿童话语“偏误”入手探讨儿童语言能力的发展和语言知识掌握程度的可行性和具体做法。   第二章介绍了自建儿童抽样语料库的过程。包括数据采集的抽样原则和具体方法。按每年龄段抽样10名(男女各半)共40名3-6岁儿童,分别用录像方式采集他们与成人的1个小时会话活动实况,总计40小时。然后对录像内容进行人工转写和校对,得到约55万字的文本语料,其中儿童语料10余万字。在此基础上用分词软件ICTCLAS将语料分词并标注词性,对自动分词加工后的语料进行人工校对后,建立了儿童语言发展的分类数据库,其中包括:各类词的词汇量、使用频度、词类分布、词长以及平均句长等基本数据。   第三章介绍了基本实词的定量分析结果,包括:按年龄和词类的统计、高频词的分布统计等。通过统计分析发现,3-6岁儿童实词词汇量随着年龄增长而增加,名词、动词、形容词、量词、副词等增加的速度十分明显。从儿童高频使用的词类分布看,单音节词高于双音节词。   第四章介绍了介词、连词、助词和语气词四类虚词的统计结果,发现儿童使用的虚词词种虽然数量很少,但平均使用频度远远高于实词,而且高频虚词的使用情况相对集中,并随年龄增长而稳定在高频区。此外还发现在儿童使用的各类虚词中有许多兼类情况,如“把”(介、量、名、动)、“给”(动、介、助)、“在”(介、动、副)等。   第五章重点进行了3-6岁儿童话语“偏误”分析。通过对造词“偏误”的分析发现,3.6岁儿童具有十分聪明、巧妙的造词能力,有许多例子甚至是成年人都创造不出来的(例如“用脚摸脸”、“薄鱼”、“胖味儿”)等,这充分说明儿童语言能力的发展不是单纯“学”得的,而是来自心理认知能力,而心理认知能力则与遗传因素有关。这从一个侧面为乔姆斯基“语言能力遗传”假说提供了事实依据。   通过对用词“偏误”的分析,发现3-6岁儿童已经掌握了基本的词法、句法、短语搭配等用词造句的知识,这些知识被作为“原型”泛化到其他的词法或句法的习得和应用上,从而出现了大量用词“偏误”,这恰恰反映出儿童对语言结构知识的掌握程度。   本研究的创新点主要体现在以下几点:   第一、抽样采集了40个3-6岁儿童言语活动录像资源库,文本转写总字数约55万字,其中儿童语料10余万字。建立了具有说话人、性别、年龄、词类、词频等属性标注的分类数据库。   第二、在经过加工的附码语料库基础上进行了3-6岁儿童语词的定量定性描写和分析,统计类型包括词种、词次、使用频度、累计频度、平均句长等。   第三、研究发现3-6岁儿童的造词“偏误”反映出儿童的语言能力发展与认知能力有关;而因原型泛化和简单类推导致的用词“偏误”反映出儿童语言知识的习得也与认知能力有关。这从一个侧面证明,应从认知的角度去理解乔姆斯基语言能力假说的合理性。

山东大学

博士

语言学及应用语言学

盛玉麒

2010

中文

H193.1;H136.1

110

2011-02-15(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅