首页 卫乃兴-CLIC 2013 专家论坛发言

卫乃兴-CLIC 2013 专家论坛发言

举报
开通vip

卫乃兴-CLIC 2013 专家论坛发言 卫乃兴 我谈三点。 第一点呢,针对这个命题,梁老师说是我出的,其实是我和大家讨论之后共同提出的 一个命题,就是 The Changing Corpus Linguistics。我自己今天针对这个话题谈一点虚的东西, 务虚的一点谈法。我发言的题目就叫做 The Changing and Unchanging Corpus Linguistics,如 果用汉语来讲,就是“语料库语言学的变与不变”。这里面谈三点。第一点呢,我想谈一 谈 corpus linguistics as a method,作为方法的...

卫乃兴-CLIC 2013  专家论坛发言
卫乃兴 我谈三点。 第一点呢,针对这个命题,梁老师说是我出的,其实是我和大家讨论之后共同提出的 一个命题,就是 The Changing Corpus Linguistics。我自己今天针对这个话题谈一点虚的东西, 务虚的一点谈法。我发言的题目就叫做 The Changing and Unchanging Corpus Linguistics,如 果用汉语来讲,就是“语料库语言学的变与不变”。这里面谈三点。第一点呢,我想谈一 谈 corpus linguistics as a method,作为方法的语料库语言学。第二点呢,我想谈一谈 corpus linguistics as a discipline,作为一个学科的语料库语言学。第三点呢,我想谈一谈这两个趋 势共同的、共享的一个东西,叫做 minimum assumption,最小假设。那么,显而易见,语 料库语言学的阵营发生了很多变化,与 40 年前相比发生了很多变化,出现了很多争执,形 成了不同的研究……范式吧,也可以这样讲。那么现在阵营最大的一个范式,等于说叫做 corpus linguistics as a method,把语料库语言学作为一个研究方法的阵营,这个阵营人数最 多,他们主要的观点是,corpus linguistics is a tool,工具,或者说 is a method,是一种方法, 或者说是一个 methodology,是一套方法论。那么 corpus linguistics 在开创时期确实是一个 方法,但是带有一定理念的方法。后来的发展中,这个方法被运用于相关不同的学科领域 研究里面,最先运用 corpus linguistics 这个方法的就是 computational linguistics。那么这个 冯志伟老师可以讲出很多故事,方老师也在场,computational linguistics 在 1980 年代以前 用的是 AI approach,artificial intelligence approach 来处理语言,他们自己深切地体会到, 这条路是没出路的,走不出来的。看到语料库语言学发展的如此兴旺,提供了如此有价值 的数据,那么,说一夜之间他们发生了改变可能有点夸张,但是在很短的时间内,1985 年 前后,整个计算语言学阵营集体转向语料库语言学,采用语料库语言学的方法来搞自然语 言处理,这是真实发生的历史事实,尽管有人不愿意承认,尽管有人到今天还要把 corpus linguistics 当作 computational linguistics 的一个 branch,这是颠倒是非、不注重历史的一个 表述,我要纠正过来。那么第一个首先使用 corpus method 的是 computational linguistics, 然后 systemic functional linguistics,Michael Halliday 领导的那个阵营,然后我们紧接着看到 今天的 cognitive linguistics,印老师在场,印老师是搞 cognitive linguistics 的,cognitive linguistics 从 Langacker(?),Lakoff 提出各种各样的 constructing model 等等以来,相当 长时间是不问语料库数据的,大家看看这几年,认知语言学有多少人在搞语料库建设。然 后我们看到 translation studies,王克非老师搞的 translation universal studies,离了平行语料 库行吗?不行。再往下面看,我感到非常吃惊的就是,transformational generative grammar 也使用起了语料库,这个东西我有点非常非常地吃惊。因为我记得 1990 年代的时 候,外研社出了一套系列丛书,其中有一本书是非常非常有意思的,这本书的前言是乔姆 斯基写的,乔姆斯基在前言里面讲,语言学发展到今天,我们只有搞 mental linguistics, mental inquiry of language,走入我们的 internal language,external language 和 inductive method 是没有用的。这是乔姆斯基的主题。但是在同一本书里面,Geoffrey Leech 的学生, Geoffrey Thompson 吧,我忘了,他写了一篇文章,他比较了他搞了多年的 transformational generative grammar 以后,发现这里面和语言事实越走越远,和语言事实严重地脱节,建立 了那么多高深精密的模型,到最后碰到文本的时候,一筹莫展,处理不出来,所以他发了 一句感叹,Well, if linguistics can distort language facts as such, I’ll say goodbye to such a practice. Geoffrey Leech is across the corridor, I will join Geoffrey Leech to do corpus research. 我讲这个故事什么意思呢?就是说越来越多的人认识到语料库语言学是一个有价值的方法 来做自己的研究,不管是 computational linguistics,systemic functional linguistics,cognitive linguistics,translation studies,even transformational generative grammar,都在做这个事情。 我的观点是,这些人转用语料库语言学做研究之后,自然而然地要把语料库作为一个方法, 把它作为一个方法来探讨方方面面的学科问题,不同的语言学问题的探讨,甚至探讨不同 的其他社会科学领域的问题,为什么不好呢?This is welcome and certainly why not we do that? 这个语言学研究一百多年来索绪尔创造了现代语言学以来,有几个人在忠实于语言文 本数据建立自己的语言模型呢?一百多年过去了,语言学家最大的特征就是理论和数据同 时产生,自己提出一个理论的时候,脑子里的数据随之而生,这是不符合科学研究的。科 学研究不去从数据开始,然后推导出自己的理论。我们接受过方法论训练的人应当认识到 这个。好,把语料库作为一个方法来探讨各种各样的学科问题,好不好呢?非常好,非常 值得鼓励。这就是说这么多的人都把语料库语言学作为一个方法探讨自己的学科问题的时 候,我们应当给予高度的支持,不管你用语料库语言学做认知研究,做语言教学研究,做 翻译研究,甚至做 transformational generative grammar 研究,我们都支持,但是这里面有 一个问题,如果你做这样的研究,你真的像 Lancaster University 的 Andrew Hardie 一样认为 语料库语言学就是 theory free,是一个 neutral method 的话,你要碰到跨越不了的障碍。 语料库语言学在 40 多年的发展历程中产生了自己一些大家有共识性的理论的,这些理论、 这些理念,所有的研究成员基本上都是赞成的、接受的,就像梁茂成老师刚才讲的,大家 认识到搭配的重要性,搭配的确是其中之一,collocation is very important in corpus research but it’s not everything. Collocation 仅仅是大家形成的共识之一。如果纯粹把语料库语言学作 为一个方法,一个工具来对待研究你的学科问题的话,有一天终究你会发现“我走不动了, 我没法走下去了。再走下去,我这个学科要完蛋了,我以前接受的学科背景训练都无用了” ,要产生这个问题。 好,第二个,语料库语言学作为一个学科。作为学科呢,这个是以 John Sinclair 等 Neo-Firthian 为代表的,Neo-Firthian 是少数,我们掐指计算无非就是 Tognini-Bonelli, Michael Stubbs,Michael Hoey,Susan Hunston,再加上 Wolfgang Teubert,这六七个人他们 是少数,但是这一派人,这个团队产生的学术成果的影响力,我还没有发现哪个人能超过。 我们不要仅仅看 Birmingham University 周围这几个人,要看整个 Scandinavia,看看 Scandinavian countries,看看 Italian scholars,看看 German scholars 现在做的什么,用的什 么理论。刚才梁老师谈到 Jan Aarts,他是一个 Scandinavian scholar,他属于 corpus linguistics as a discipline 这个团队的,这个阵营的。Aarts 不属于 corpus linguistics as a method 这个阵营的。你看一看 Altenburg,看一看 Karin Aijmer,看一看 Anna Stenström, 看一看 Michael Stubbs,看看 Alan Partington,这些 Scandinavian scholars 写了什么,做了什 么,他们采用的是什么理论,你会惊人地发现,是 corpus linguistics as a discipline 这个路子 的。那么 corpus linguistics as a discipline 有什么样的特征?第一点,语言是一个 social phenomenon,语言是不是一个 mental phenomenon 呢?当然是,但是他们认为目前我们的 技术,我们的方法不足以研究 mental phenomenon,所以他们把语言当作一个社会现象, 这是第一个界定特征。第二个,研究。语料库语言学的研究是 meaning,is a meaning study,这个 J R Firth 讲的很清楚,the central task of linguistics is semantics, is a study of meaning. 那么这一派、这个阵营,use corpus to study the meaning organizations, meaning realizations of language,那么 meaning 等于 real-life language use。那么他们的方法论最大 的特征时 bottom-up,不大会借用现有的模型来套我这个文本,一定从 bottom-up 做起, 这个方法论特征是 large quantity of data,这个阵营不大去借用 small corpus,John Sinclair 说 small is not beautiful。Corpus 一定要做到 sufficiently large 或者,他讲了一句话, the larger, the better. 所以从这个对语言本体的观察,对语言学的任务,对语言学研究的方 法和路径,他们有一套完整的表述,这是这一个阵营。讲到这里,有问题吗?肯定有问题。 刚才我谈到 corpus linguistics as a method 的时候,有一个问题就是,如果你真要把语料库 语言学当做一个 theory-free,neutral method 来对待的话,你碰到不可跨越的障碍,有一天 发现你要完了,你搞的一些学科背景都不存在了。那么 corpus linguistics as a discipline 有什 么问题呢?我们必须意识到,现在在 corpus 这杆大旗下做工作是一支非常庞大的队伍,非 常多的从业人员,大家提出各种各样完全不同的观点,是一种常态。对于这些不同的观点, 好梳理吗?不好梳理。能做一个完整系统的理论表述吗?到目前为止我还没有见到。从某 种意义上,我愿意把这一派的观点给修整一下,叫做 corpus linguistics is an undisciplined discipline。就是说它要作为一个完整的、比较成熟的 discipline 来发展,它有很多工作要做。 这是第二点。 第三点,minimum assumption,最小假设。对上述两个阵营,或者说,两个流派的思 想和方法我都是赞成的,对学科的发展都是有利的。我没有任何偏见。但是我主张不管是 corpus linguistics as a method,还是 corpus linguistics as a discipline,这里面有一个共同的东 西需要大家考虑,就是 John Sinclair 早年没有完整表述的 minimum assumption,最小假设。 你把它作为一个方法来对待,作为一个学科来对待,不管你探讨什么问题,最好在研究的 initial stage,原初阶段,仅仅对你所设定的研究课题,不管大的课题,小的课题,在我们 中国的语境而言,不管是国家社科基金课题,还是东华大学自己的课题,从高到低,不管 什么样的课题,原初阶段最好仅仅有一个 minimum assumption。不要一开始我就把一个完 整的 model 搬过来,套在文本上。这个 minimum assumption 需要一个 cyclic procedure,一 个循环的工作程序,一批一批地观察数据,也就是濮老师刚才讲的,trust the text。尊重文 本,文本证据一批一批来观察。这一批一批证据可能是 concordance data,也可能是 collocational data,也可能是 cluster data,也可能是 key word data 等等。第一批观察完了, 发现一个特征,一个 pattern,这个 pattern 是广义的,不是 grammatical pattern;再看第二 批,有没有新的出现,有没有否定第一批观察过来发现的特征,修正;然后第三批;直到 最大限度地把有代表性的证据穷尽,形成一个完整的表述。我记得两年前我在北外,在梁 老师的会议上我提出 EOG 这个 procedure。所谓 EOG 就是 extraction, observation and generalization。第一步先把数据提取出来,第二步 observation,第三步 generalization。我 当时提出这个 EOG 说法呢也是我读 J R Firth,读 John Sinclair,看他们的研究我自己思考得 出来的一个建议,我今天依然坚持我提出来的这个方法,第一步 extraction,第二步 observation,第三步 generalization。如果大家参考这个方法的话,遵循这个 minimum assumption 这个建议的话,不管是 corpus linguistics as a method,corpus linguistics as a discipline,其间可能异曲同工,发现一些共同的问题,共同的结论。举个例子来说,昨天 方老师给大家演示了他的那个研究,subordination,或者说更具体一点,adverbial clause 在 书面文本和口语文本中的一些特征。他为什么最后能发现那些结论呢?为什么 Douglas Biber 发现不了呢?Michael Halliday 仅仅在几十年前提出来一个假设,认为书面文本中的 adverbial clause 应该少于,大大地少于口语中。Douglas Biber 也建立了很多语料库,最后 他的结论和 Michael Halliday 完全一致,为什么方老师就会发现不是这回事儿呢?为什么方 老师的研究结果可以挑战 Michael Halliday,挑战 Douglas Biber 呢?我觉得体现于他的科学 精神,严谨地观察数据,严谨地分析数据,最后得出的结论。下面关于 minimum assumption 的第二点就是语言学模型的使用。语言学模型肯定是要用的,什么时候用,用 到什么程度,有没有必要对现有语言学模型提出某种修整呢?我认为语料库语言学更大的 价值在于修整前人的模型,不在于证实前人的模型都是对的,这是我的一个观点。随之而 来的一个问题,即统计和数学在语料库语言学中的应用。我从来都是主张使用统计数据的。 如果在语料库语言学中不使用统计数据,那么你这个学科的方法论特征可能和转换生成语 言学,甚至功能语言学等也就没有什么区别了。语料库语言学的科学性在于它有一套周密 的量化数据,使用一些数学的东西,数学揭示我们语言形式、意义的内在关系,非常必要, 但是我的看法是,目前似乎有一种倾向,statistics, mathematics 用的过度了。我们读了很 多文章,我们看了很多演示,通篇到尾,大量大量的数学公式,大量大量的统计数字,看 不到文本了,看不到语言数据了,Where is the text? Where is the meaning? What’s mathematics? What’s linguistics? Mathematics is very important but mathematics is not linguistics. Statistics is important but meaning is not in the statistics. Meaning is in the text. Meaning is in the language.这是我的一个观点,所以我觉得你可以使用很多很多先进的统计 手段,你可以使用大量的数学公式,但是如果你把文本忘了,你把语言忘了,你做的到底 还是不是语言学研究?我深表怀疑的。我讲话直言不讳,就讲这么多。有些呢,和我的同 行们意见是一致的,有些不一致。但是语料库语言学研究会最大的特点就是我们几个理事 之间从来都是畅所欲言的,友谊归友谊,学术归学术,多年来我们一直奉行这样的 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 。 我们几个人讲的都是抛砖,下面可以引玉了。欢迎大家提出问题,我们尽量回答,谢谢!
本文档为【卫乃兴-CLIC 2013 专家论坛发言】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_579537
暂无简介~
格式:pdf
大小:105KB
软件:PDF阅读器
页数:5
分类:
上传时间:2013-11-17
浏览量:16