- 汉语二语者书面语体习得研究
- 汲传波
- 2244字
- 2025-03-28 11:49:13
1.2
研究目标与研究内容
1.2.1 研究目标
通过对不同语体语料库的量化分析,确定能够区分非正式语体(口语语体)和正式语体(书面语体)的语体特征标记。正如冯胜利(2015)所指出的,“不同的文体使用着不同的‘语体构件’(如俗体词、正体词、典体词以及俗体句、正体句、典体句等)”,“三种语体(通俗、正式、庄典)分别和总共有多少‘构体部件’,还是一个有待研究的新课题,因此,用哪些部件组成哪些‘文体’(如记叙体、论说体、操作体、新闻体等),更是一个未曾开垦的处女地”,“语体的研究必将在这里开辟出大量的可耕地”。冯胜利(2015)的观点非常有前瞻性,但因目前尚无可供研究使用的大型口语语料库,构建一个“语体构件”库相对比较困难。另外通俗、正式、庄典三分系统虽然在理论上是可行的,但是在语言实践中将庄典纳入正式进行研究更有可操作性,也就是将语体划分为非正式、中性、正式语体三大类(后文将详述具体原因)。我们采纳冯胜利(2006a)的观点,将日常口语看作非正式语体,书面语看作正式语体。我们的研究目标之一是归纳、整理学界现有的关于语体区别特征的具体、零散的研究,利用现有的语料库进行验证和筛选,尝试初步建立区分非正式语体和正式语体的特征标记群。
依据语体特征标记,将留学生书面语中介语语料库与汉语母语者语料库进行对比,将留学生学术论文语料库与汉语母语者学术论文语料库进行对比,发现留学生书面语体习得特点,提出改进语体教学的建议。
1.2.2 研究内容
首先,梳理目前汉语学界的语体研究成果,整理现有成果中能够区分非正式语体和正式语体的语法格式、核心词汇。我们同意金立鑫、白水振(2012)的观点,即“构成不同语体的语言单位一定有着较为明显的差别,这些差别不仅体现在具体的用词上,还体现在对句法结构或句式的选择上”。比如,已有语体语法研究成果表明“V+向/往+NP”用于书面正式语体,“向/往+NP+V”用于口语非正式语体(王永娜2011a);“NP+们”用于书面正式语体(王永娜2011b);“V+和+V”是正式书面语体(王永娜2012);“NNVVN”用于书面正式语体,“VNN”用于通用语体,“VN的(N)”用于口语非正式语体(王永娜2015a);“在”属于口语非正式体,“当现实”属于书面正式体,“当虚构”则倾向于文艺体(王永娜、冯胜利2015);判断句是书面正式语体(王永娜2015b)。这些研究成果为区分非正式语体和正式语体提供了参考。另外,还有一些语体研究成果也可以借鉴,比如,书面语中主语大多数由名词充当,口语中主语大多数由代词充当,书面语的定语构成中名词占绝对优势(刘丙丽等2012);若一对同义词有音节上的差异,口语倾向于为单音节,书面语倾向于为双音节(张文贤等2012);22个条件标记在口语中的使用频次远高于书面语体(姚双云2014)。在现有研究成果基础上,我们运用北京语言大学BCC语料库中各30亿字规模的微博语料库和科技语料库,将汉语语法学界目前研究的能够区分语体的语法格式、核心词汇进行卡方检验,确定一批典型的语体特征标记。
其次,结合欧化语法研究(贺阳2008a)、书面语研究(孙德金2012a)、古句式研究(冯胜利2006b)的成果,补充一批典型的语体特征标记。这些语体特征标记与经过验证、确定的标记共同构成“标记群”,能够有效区分两种不同的语体(正式与非正式)。具体研究时也借鉴英语学界的研究成果,比如Biber&Conrad(2009)关于英语口语样本和学术论文样本中名词、代词和形容词的研究。这些成果为本研究提供了非常有价值的参考。
再次,运用HSK动态作文语料库(从中抽取语料新建不同水平、不同国别语料库)、国家语委现代汉语平衡语料库、中国高中生作文语料库、自建语料库(韩国学生学术论文语料库、中国学者学术论文语料库),利用本研究所确定的语体特征标记群,分析留学生书面语、学术汉语中的语体使用情况。具体而言,通过对比留学生书面语和汉语母语者书面语,分析留学生语体习得总体情况,是否存在口语化倾向,是否存在典雅度不足现象;通过对比不同水平的留学生在语体习得方面有无差异,分析语体习得情况是否与留学生的语言水平呈正相关;通过分国别探讨日本、韩国、欧美留学生的书面语体习得情况,分析国别特点。通过自建语料库,以韩国学生为例,对比其学术论文和中国学者的学术论文,分析韩国学生汉语学术写作中文言结构的使用是否不足。
最后,尝试从教材和口语格式收录问题入手分析面向留学生的语体教学存在哪些问题,对教材及辞书编写提出改进建议。具体而言,这一研究主要通过检索北京大学CCL语料库、中国传媒大学有声媒体文本语料库[8]、自建《实话实说》语料库,分析精读教材中语法格式“待到……之时”“何尝”的语法练习设计问题;考察口语格式在《现代汉语词典》(第7版)、《汉语水平词汇与汉字等级大纲》(修订本)等中的收录情况,以及在汉语对话语料中的使用情况,进而分析日本留学生汉语书面语中存在口语化倾向的原因,以及《现代汉语词典》(第7版)等在口语格式收录方面的得失。
1.2.3 拟突破的重点和难点
正如赵雪、李平(2013)所指出的,“如果不能确定哪些语言标记在语体研究上具有普遍意义,那么再先进的技术手段也将是英雄无用武之地”。因此本研究的重点和难点是语体特征标记的确立和提取。近几年受语体语法理论的影响,汉语语法学界发表了一系列关于区分不同语体的语法特征的文章,这将有助于本研究对研究难点进行突破。另外,目前BCC语料库已经区分了不同语体(微博接近非正式体,科技为正式体),这为不同语体的语法特征、词汇特征的计算机提取奠定了基础。在汇总所有语体特征标记之后,在BCC微博、科技语料库中查找频次,然后运用卡方检验,选取有显著差异的语体特征标记。