1.3
研究思路与研究方法

1.3.1 研究思路

本研究拟将语体语法的相关成果与汉语作为第二语言教学相结合。由于语体的界定、分类仍存在很大的争议,我们根据汉语作为第二语言教学的实际需要,将语体划分为非正式语体、中性语体、正式语体,认为语体之间并非截然对立,而是逐渐过渡的。

在划分语体的基础上,我们梳理并总结本体研究的相关成果,借鉴英语学界的研究方法,将能够区分语体的语法格式、核心词汇通过语料库进行验证,确定语体特征标记。语体特征标记不是仅在某一种语体中存在,另一种语体中不存在,不是“有”和“无”的区别,而是“多”和“少”的区别。我们预计语体特征标记在不同语体中的分布频率存在巨大差异,基于此,确定一批语体特征标记,构成“语体特征标记群”,运用这一标记群可以有效区分不同语体。

确定了语体特征标记群之后,有了对比的标准,我们就可以将留学生中介语语料与汉语母语者的语料进行对比,发现留学生语体使用的特点或者偏误。

1.3.2 研究方法

目前汉语本体就语体语法的研究基本上还使用内省的办法,虽然也有很多有价值的成果,但是仍有一些不足。金立鑫、白水振(2012)认为,“放弃传统的内省的研究方法,走向科学的定量研究,走向实验室方法——语体学研究就有可能走向一个前所未有的、充满科学之美的广阔天地”。本研究是基于语料库的语法格式、核心词汇的分析,必然要运用量化的手段,选取不同语体具有显著差异的语法格式、核心词汇。

本研究主要是通过语料库对比的研究方法,计算出标准化频率,运用Chi-square and Log Likelihood Calculator进行卡方检验,力求运用科学的统计方法得出结论。当然,我们也不会唯量化和数字,而是从数据中发现和总结特点及规律,尝试分析原因。

本研究所使用的在线语料库有:北京语言大学HSK动态作文语料库、北京语言大学BCC语料库、国家语委现代汉语平衡语料库、北京大学CCL语料库、中国传媒大学有声媒体文本语料库。

在HSK动态作文语料库中随机抽取自建的语料库[9]有:留学生低分组语料库、留学生中分组语料库、留学生高分组语料库、日本留学生议论文语料库、韩国留学生议论文语料库、欧美留学生议论文语料库。

自建的语料库有:《实话实说》语料库、韩国学生学术论文语料库、中国学者学术论文语料库、中国高中生作文语料库、中国高中生议论文语料库[10]