首页 语料库语言学术语汇编A glossary of corpus linguistics2.0

语料库语言学术语汇编A glossary of corpus linguistics2.0

举报
开通vip

语料库语言学术语汇编A glossary of corpus linguistics2.0语料库语言学术语汇编(V2.0) Last updated 2012-10-07 by 许家金 Aboutness 所言之事 Absolute frequency 绝对频数 Alignment (of parallel texts) (平行或对应)语料的对齐 Alphanumeric 字母数字构成的 Annotate 标注(动词) Annotated text/corpus 标注文本/语料库、赋码文本/语料库 Annotation 标注(名词) Annotation sc...

语料库语言学术语汇编A glossary of corpus linguistics2.0
语料库语言学术语汇编(V2.0) Last updated 2012-10-07 by 许家金 Aboutness 所言之事 Absolute frequency 绝对频数 Alignment (of parallel texts) (平行或对应)语料的对齐 Alphanumeric 字母数字构成的 Annotate 标注(动词) Annotated text/corpus 标注文本/语料库、赋码文本/语料库 Annotation 标注(名词) Annotation scheme ANSI/American National Standards Institute 美国国家 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 学会 ASCII/American Standard Code for Information Exchange 美国信息交换标准码 Associates (of keywords) (主 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 词的)联想词 AWL/academic word list 学术词 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf Balanced corpus 平衡语料库 Base list/baselist 底表、基础词表 Bigram Bi-text/bitext 双语合并文本、双语分行对齐文本(一句源语一句目标语对齐后存储的文本) Bi-hapax 两次词 Bilingual corpus 双语语料库 Bootcamp debate/discourse/discussion (新手)训练营大辩论/话语/大探讨 CA/Contrastive Analysis 对比分析 Case-sensitive/case sensitivity 大小写敏感、区分大小写 Category-based approach Chi-square test/χ2 卡方检验 Chunk 词块 CIA/Contrastive Interlanguage Analysis 中介语对比分析 CLAWS/Constituent Likelihood Automatic Word-tagging System CLAWS词性赋码系统 Clean text policy 干净文本原则 Cluster 词簇、词丛 Colligation 类联接、类连接、类联结 Collocate n./v. 搭配词;搭配 Collocability 搭配强度、搭配力 Collocation 搭配、词语搭配 Collocational strength 搭配强度 Collocational framework/frame 搭配框架 Collocational profile 搭配概貌 Collocational network 搭配网络 Comparable corpora 类比语料库、可比语料库 Computational Linguistics 计算语言学 ConcGram/concgram 同现词列、框合结构 Concord 索引(行)(简略形式) Concordance (line) 索引(行) Concordance plot (索引)词图 Concordancer 索引工具 Concordancing 索引分析 Context 语境、上下文 Context word 语境词 Contextual prosody 语境韵律 Contingency table 连列表、联列表、列连表、列联表 Co-occurrence/Co-occurring 共现、同现 Corpus Linguistics 语料库语言学 Corpus, pl. corpora 语料库 Corpus-based 基于语料库的 Corpus-based translation studies 基于语料库的翻译研究、语料库翻译学、基于语料库的译学研究 Corpus-driven 语料库驱动的 Corpus-informed 语料库指导下的、参考了语料库的 Corpus size 库容 Corpus stylistics 语料库文体学 Co-select/co-selection/co-selectiveness 共选(机制) Co-text 共文 Data mining 数据挖掘 DDL/Data Driven Learning 数据驱动学习 Dependency (句法)依存关系 Dice coefficient Dice系数 Disambiguation 消歧 Diachronic corpus 历时语料库 Discourse 话语、语篇 Discourse prosody 话语韵律 Documentation 文检 报告 软件系统测试报告下载sgs报告如何下载关于路面塌陷情况报告535n,sgs报告怎么下载竣工报告下载 、备检文件、说明文档 EAGLES/Expert Advisory Groups on Language Engineering Standards EAGLES文本规格 Empirical linguistics 实证语言学 Empiricism 经验主义 Encoding 字符编码 Error-tagging 错误标注、错误赋码 Explicitation 显化 Extended unit of meaning 扩展意义单位 File-based search/concordancing 批量检索 Firthian (linguistics) 弗斯(语言学)、弗斯学派的(语言学) Formulaic sequence 程式化序列、套语 Frequency 频数、频率 Frequency list 词频表 General (purpose) corpus 通用语料库 Genre 语体、体裁 Grammatical patterning 语法型式 Granularity 颗粒度 Hapax legomenon/hapax 一次词 Header/corpus head 文本头、头标、头文件 Hidden Markov model (HMM) 隐马尔科夫模型、隐马模型 Idiom principle 习语原则、成语原则 Idiomaticity 习语性、地道程度 Implicitation 隐化 Index/indexing (建)索引 In-line annotation 文内标注、行内标注 Interlanguage 中介语、过渡语 Inter-coder agreement/reliability 标注者间一致性/信度 Introspection/introspective 内省(式)(的) Intuition 直觉 Key keywords 关键主题词 Keyness 主体性、关键性 Keywords 主题词 KWIC/Key Word in Context 语境中的关键词、语境共现(方式) KWIC sort 语境共现排序、索引行排序 Learner corpus 学习者语料库 Lemma, pl. lemmata/lemmas 词目、原形词、词元 Lemmatization 词形还原、词元化 Lemmatizer 词形还原工具、词元化工具 Lexical bundle 词束 Lexical density 词汇密度 Lexical frequency profile 词频概貌 Lexical grammar 词汇语法 Lexical item 词项、词语项目 Lexical patterning 词语型式、词汇型式 Lexical priming 词汇触发理论、词汇启动理论 Lexical profile 词汇分布概貌 Lexical richness 词汇丰富度 Lexico-grammar 词汇语法 Lexis 词语、词项、词语学 Log-likelihood ratio 对数似然比、对数似然率 Longitudinal/developmental corpus 跟踪语料库、发展语料库、历时语料库 Machine-readable 机读的 Machine translation 机器翻译 Manual annotation 手工标注 Markup/mark-up 标记、置标 MDA (Multi-dimensional analysis/approach) 多维度分析法 Metadata 元信息 Meta-metadata 元元信息 MF/MD approach/multi-feature/multi-dimensional analysis 多特征/多维度分析法 Misuse 误用 Monitor corpus (动态)监察语料库 Monolingual corpus 单语语料库 Multilingual corpus 多语语料库 Multimodal corpus 多模态语料库 MWU/multiword unit 多词单位 MWE/multiword expression 多词表达 MI/mutual information 互信息、互现信息 N-gram N元组、N元序列、N元结构、N元词、多词序列 Neo-Firth (school) 新弗斯学派 Neo-Firthian 新弗斯学派的 NLP/Natural Language Processing 自然语言处理 Node (word) 节点(词) Normalization 标准化、(翻译)规范化、泛化 Normalized frequency 标准化频率、标称频率、归一频率 Observed corpus 观察语料库 Ontology 知识本体、本体 Open choice principle 开放选择原则 Orthographic Orthography 正字法 Overuse 过多使用、超用、使用过度、过度使用 Paradigmatic 纵聚合(关系)的 Parallel corpus 平行语料库、对应语料库 Parole linguistics 言语语言学 Parsed corpus 句法标注的语料库、树库 Parser 句法分析器 Parsing 句法标注、句法分析 Pattern/patterning 型式、模式 Pattern grammar 型式语法 Pattern matching 模式匹配 Pedagogic corpus 教学语料库 Phraseology 短语、短语学 Phraseological unit/sequence 短语单位/序列 Plain text 纯文本 POSgram 赋码序列、码串 POS sequence 赋码序列、码串 POS tagging/Part-of-Speech tagging 词性赋码、词性标注、词性附码 POS tagger 词性赋码器、词性赋码工具 Prefab 预制语块 Probabilistic (基于)概率的、概率性的、盖然的 Probabilistic grammar 概率语法、概率性语法、盖然语法 Probability 概率 Query 查询、检索 Range 分布(范围)、跨度 Rationalism 理性主义 Raw frequency 原始频数、生频数 Raw text/corpus 生文本/生语料 Reference corpus 参照语料库 Regex/RE/RegExp/regular expressions 正则表达式、正则式 Register variation 语域变异 Relative frequency 相对频率 Representative/representativeness 代表性(的) Rule-based 基于规则的 S-universals 源语型共性(特征) Sample n./v. 样本;取样、采样、抽样 Sampling 取样、采样、抽样 Sanitization 净化 Search term 检索项 Search word 检索词 Segmentation 切分、分词 Semantic association 语义联想 Semantic preference 语义倾向、语义趋向 Semantic prosody 语义韵 Sentence alignment 句对齐、句级对齐 SGML/Standard Generalized Markup Language 标准通用标记语言 Simplification 简化 Skipgram 跨词序列、跨词结构 Span 跨距 Specialized corpus 专用语料库、专门用途语料库、专题语料库 Standardized type/token ratio 标准化类符/形符比、标准化类/形比、标准化型次比 Standardized TTR/STTR 标准化类符/形符比、标准化类/形比、标准化型次比 Stand-off annotation 分离式标注 Stochastic 随机的 Stop list 停用词表、过滤词表 Stop word 停用词、过滤词 Synchronic corpus 共时语料库 Syntagmatic 横组合(关系)的 T score T值 T-universals 目标语型共性(特征) Tag 赋码、标记、附码 Tagger 赋码器、赋码工具、标注工具 Tagging 赋码、标注、附码 Tag sequence 赋码序列、码串 Tagset 赋码集、码集 Tertium comparationis 对比中立项、对比基础 Text 文本 Text type 文体、文类 Text category 文体、文类 Text mining 文本挖掘 TEI/Text Encoding Initiative TEI文本编码计划 The Lexical Approach 词汇中心教学法 The Lexical Syllabus 词汇大纲 Token 形符、词次 Token definition/word definition 形符界定、单词界定 Tokenization 分词 Tokenizer 分词工具 Transcription 转写 Translation memory 翻译记忆(库) Translation norms 翻译规范 Translation universals/Universal features of translation 翻译共性、翻译普遍特征 Translational corpus 翻译语料库 Translationese 翻译体、翻译腔 Treebank 树库 Trigram 三元组、三元序列、三元结构 T-score T值 Type 类符、词种、词型 TTR 类符/形符比、类/形比、型次比 Type/token ratio 类符/形符比、类/形比、型次比 Underuse 少用、使用不足 Unicode 通用码 Unicodify 按通用码编码、转换为通用码 Unit of meaning 意义单位 WaC/Web as Corpus 网络语料库、网库 Wildcard 通配符 Word alignment 词对齐、词级对齐 Word form 词形 Word family 词族 Word list 词表 Word sketch 词语素描 WSD/Word-sense disambiguation 词义消歧 XML/Extensible Markup Language 可扩展标记语言 Zipf’s Law/Zipfian Law 齐夫定律 Z score Z值 常用语料库 ACE Australian Corpus of English ANC American National Corpus ARCHER A Representative Corpus of Historical English Registers BASE British Academic Spoken English Corpus BAWE British Academic Written English Corpus BNC British National Corpus BoE Bank of English Brown Brown Corpus CANCODE Cambridge and Nottingham Corpus of Discourse in English CEC China English Corpus CEM Corpus for English Majors CHILDES Child Language Data Exchange System CIC Cambridge International Corpus CLEC Chinese Learners English Corpus CLOB 2009 Brown family corpus of British English COBUILD Collins Birmingham University International Language Database COCA The Corpus of Contemporary American English COLSEC College Learners Spoken English Corpus COLT Bergen Corpus of London Teenage Language Crown 2009 Brown family corpus of American English FLOB Freiburg-LOB Corpus of British English FROWN Freiburg-Brown Corpus of American English Helsinki Diachronic corpus Diachronic part of the Helsinki Corpus of English Texts HKCSE Hong Kong Corpus of Spoken English ICE International Corpus of English ICE-GB International Corpus of English: Great Britain ICLE International Corpus of Learner English JEFLL Japanese EFL Learner Corpus LCMC Lancaster Corpus Mandarin Chinese LINDSEI Louvain International Database of Spoken English Interlanguage LIVAC Linguistic Variations in Chinese Speech Communities LLC London Lund Corpus LOB Lancaster-Oslo/Bergen Corpus LOCNESS Louvain Corpus of Native English Essays LONGDALE LONGitudinal DAtabase of Learner English MICASE Michigan Corpus of Academic Spoken English MICUSP Michigan Corpus of Upper-level Student Papers NESSIE Native English Speakers’ Similarly and Identically-prompted Essays PACCEL Parallel Corpus of Chinese EFL Learners SBCSAE Santa Barbara Corpus of Spoken American English SCCSD The Spoken Chinese Corpus of Situated Discourse SCORE Singapore Corpus of Research in Education SEC Spoken English Corpus SECCL Spoken English Corpus of Chinese Learners SECOPETS Spoken English Corpus of Public English Test System SEU Survey of English Usage SWECCL Spoken and Written English Corpus of Chinese Learners WECCL Written English Corpus of Chinese Learners Last updated 2012-08-08 by 许家金 PAGE 1
本文档为【语料库语言学术语汇编A glossary of corpus linguistics2.0】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_508264
暂无简介~
格式:doc
大小:287KB
软件:Word
页数:8
分类:
上传时间:2012-10-13
浏览量:65