语料库语言学术语汇编(V2.0)
Last updated 2012-10-07 by 许家金
Aboutness
所言之事
Absolute frequency
绝对频数
Alignment (of parallel texts)
(平行或对应)语料的对齐
Alphanumeric
字母数字构成的
Annotate
标注(动词)
Annotated text/corpus
标注文本/语料库、赋码文本/语料库
Annotation
标注(名词)
Annotation scheme
ANSI/American National Standards Institute
美国国家
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
学会
ASCII/American Standard Code for Information Exchange
美国信息交换标准码
Associates (of keywords)
(主
题
快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题
词的)联想词
AWL/academic word list
学术词
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
Balanced corpus
平衡语料库
Base list/baselist
底表、基础词表
Bigram
Bi-text/bitext
双语合并文本、双语分行对齐文本(一句源语一句目标语对齐后存储的文本)
Bi-hapax
两次词
Bilingual corpus
双语语料库
Bootcamp debate/discourse/discussion
(新手)训练营大辩论/话语/大探讨
CA/Contrastive Analysis
对比分析
Case-sensitive/case sensitivity
大小写敏感、区分大小写
Category-based approach
Chi-square test/χ2
卡方检验
Chunk
词块
CIA/Contrastive Interlanguage Analysis
中介语对比分析
CLAWS/Constituent Likelihood Automatic Word-tagging System
CLAWS词性赋码系统
Clean text policy
干净文本原则
Cluster
词簇、词丛
Colligation
类联接、类连接、类联结
Collocate n./v.
搭配词;搭配
Collocability
搭配强度、搭配力
Collocation
搭配、词语搭配
Collocational strength
搭配强度
Collocational framework/frame
搭配框架
Collocational profile
搭配概貌
Collocational network
搭配网络
Comparable corpora
类比语料库、可比语料库
Computational Linguistics
计算语言学
ConcGram/concgram
同现词列、框合结构
Concord
索引(行)(简略形式)
Concordance (line)
索引(行)
Concordance plot
(索引)词图
Concordancer
索引工具
Concordancing
索引分析
Context
语境、上下文
Context word
语境词
Contextual prosody
语境韵律
Contingency table
连列表、联列表、列连表、列联表
Co-occurrence/Co-occurring
共现、同现
Corpus Linguistics
语料库语言学
Corpus, pl. corpora
语料库
Corpus-based
基于语料库的
Corpus-based translation studies
基于语料库的翻译研究、语料库翻译学、基于语料库的译学研究
Corpus-driven
语料库驱动的
Corpus-informed
语料库指导下的、参考了语料库的
Corpus size
库容
Corpus stylistics
语料库文体学
Co-select/co-selection/co-selectiveness
共选(机制)
Co-text
共文
Data mining
数据挖掘
DDL/Data Driven Learning
数据驱动学习
Dependency
(句法)依存关系
Dice coefficient
Dice系数
Disambiguation
消歧
Diachronic corpus
历时语料库
Discourse
话语、语篇
Discourse prosody
话语韵律
Documentation
文检
报告
软件系统测试报告下载sgs报告如何下载关于路面塌陷情况报告535n,sgs报告怎么下载竣工报告下载
、备检文件、说明文档
EAGLES/Expert Advisory Groups on Language Engineering Standards
EAGLES文本规格
Empirical linguistics
实证语言学
Empiricism
经验主义
Encoding
字符编码
Error-tagging
错误标注、错误赋码
Explicitation
显化
Extended unit of meaning
扩展意义单位
File-based search/concordancing
批量检索
Firthian (linguistics)
弗斯(语言学)、弗斯学派的(语言学)
Formulaic sequence
程式化序列、套语
Frequency
频数、频率
Frequency list
词频表
General (purpose) corpus
通用语料库
Genre
语体、体裁
Grammatical patterning
语法型式
Granularity
颗粒度
Hapax legomenon/hapax
一次词
Header/corpus head
文本头、头标、头文件
Hidden Markov model (HMM)
隐马尔科夫模型、隐马模型
Idiom principle
习语原则、成语原则
Idiomaticity
习语性、地道程度
Implicitation
隐化
Index/indexing
(建)索引
In-line annotation
文内标注、行内标注
Interlanguage
中介语、过渡语
Inter-coder agreement/reliability
标注者间一致性/信度
Introspection/introspective
内省(式)(的)
Intuition
直觉
Key keywords
关键主题词
Keyness
主体性、关键性
Keywords
主题词
KWIC/Key Word in Context
语境中的关键词、语境共现(方式)
KWIC sort
语境共现排序、索引行排序
Learner corpus
学习者语料库
Lemma, pl. lemmata/lemmas
词目、原形词、词元
Lemmatization
词形还原、词元化
Lemmatizer
词形还原工具、词元化工具
Lexical bundle
词束
Lexical density
词汇密度
Lexical frequency profile
词频概貌
Lexical grammar
词汇语法
Lexical item
词项、词语项目
Lexical patterning
词语型式、词汇型式
Lexical priming
词汇触发理论、词汇启动理论
Lexical profile
词汇分布概貌
Lexical richness
词汇丰富度
Lexico-grammar
词汇语法
Lexis
词语、词项、词语学
Log-likelihood ratio
对数似然比、对数似然率
Longitudinal/developmental corpus
跟踪语料库、发展语料库、历时语料库
Machine-readable
机读的
Machine translation
机器翻译
Manual annotation
手工标注
Markup/mark-up
标记、置标
MDA (Multi-dimensional analysis/approach)
多维度分析法
Metadata
元信息
Meta-metadata
元元信息
MF/MD approach/multi-feature/multi-dimensional analysis
多特征/多维度分析法
Misuse
误用
Monitor corpus
(动态)监察语料库
Monolingual corpus
单语语料库
Multilingual corpus
多语语料库
Multimodal corpus
多模态语料库
MWU/multiword unit
多词单位
MWE/multiword expression
多词表达
MI/mutual information
互信息、互现信息
N-gram
N元组、N元序列、N元结构、N元词、多词序列
Neo-Firth (school)
新弗斯学派
Neo-Firthian
新弗斯学派的
NLP/Natural Language Processing
自然语言处理
Node (word)
节点(词)
Normalization
标准化、(翻译)规范化、泛化
Normalized frequency
标准化频率、标称频率、归一频率
Observed corpus
观察语料库
Ontology
知识本体、本体
Open choice principle
开放选择原则
Orthographic
Orthography
正字法
Overuse
过多使用、超用、使用过度、过度使用
Paradigmatic
纵聚合(关系)的
Parallel corpus
平行语料库、对应语料库
Parole linguistics
言语语言学
Parsed corpus
句法标注的语料库、树库
Parser
句法分析器
Parsing
句法标注、句法分析
Pattern/patterning
型式、模式
Pattern grammar
型式语法
Pattern matching
模式匹配
Pedagogic corpus
教学语料库
Phraseology
短语、短语学
Phraseological unit/sequence
短语单位/序列
Plain text
纯文本
POSgram
赋码序列、码串
POS sequence
赋码序列、码串
POS tagging/Part-of-Speech tagging
词性赋码、词性标注、词性附码
POS tagger
词性赋码器、词性赋码工具
Prefab
预制语块
Probabilistic
(基于)概率的、概率性的、盖然的
Probabilistic grammar
概率语法、概率性语法、盖然语法
Probability
概率
Query
查询、检索
Range
分布(范围)、跨度
Rationalism
理性主义
Raw frequency
原始频数、生频数
Raw text/corpus
生文本/生语料
Reference corpus
参照语料库
Regex/RE/RegExp/regular expressions
正则表达式、正则式
Register variation
语域变异
Relative frequency
相对频率
Representative/representativeness
代表性(的)
Rule-based
基于规则的
S-universals
源语型共性(特征)
Sample n./v.
样本;取样、采样、抽样
Sampling
取样、采样、抽样
Sanitization
净化
Search term
检索项
Search word
检索词
Segmentation
切分、分词
Semantic association
语义联想
Semantic preference
语义倾向、语义趋向
Semantic prosody
语义韵
Sentence alignment
句对齐、句级对齐
SGML/Standard Generalized Markup Language
标准通用标记语言
Simplification
简化
Skipgram
跨词序列、跨词结构
Span
跨距
Specialized corpus
专用语料库、专门用途语料库、专题语料库
Standardized type/token ratio
标准化类符/形符比、标准化类/形比、标准化型次比
Standardized TTR/STTR
标准化类符/形符比、标准化类/形比、标准化型次比
Stand-off annotation
分离式标注
Stochastic
随机的
Stop list
停用词表、过滤词表
Stop word
停用词、过滤词
Synchronic corpus
共时语料库
Syntagmatic
横组合(关系)的
T score
T值
T-universals
目标语型共性(特征)
Tag
赋码、标记、附码
Tagger
赋码器、赋码工具、标注工具
Tagging
赋码、标注、附码
Tag sequence
赋码序列、码串
Tagset
赋码集、码集
Tertium comparationis
对比中立项、对比基础
Text
文本
Text type
文体、文类
Text category
文体、文类
Text mining
文本挖掘
TEI/Text Encoding Initiative
TEI文本编码计划
The Lexical Approach
词汇中心教学法
The Lexical Syllabus
词汇大纲
Token
形符、词次
Token definition/word definition
形符界定、单词界定
Tokenization
分词
Tokenizer
分词工具
Transcription
转写
Translation memory
翻译记忆(库)
Translation norms
翻译规范
Translation universals/Universal features of translation
翻译共性、翻译普遍特征
Translational corpus
翻译语料库
Translationese
翻译体、翻译腔
Treebank
树库
Trigram
三元组、三元序列、三元结构
T-score
T值
Type
类符、词种、词型
TTR
类符/形符比、类/形比、型次比
Type/token ratio
类符/形符比、类/形比、型次比
Underuse
少用、使用不足
Unicode
通用码
Unicodify
按通用码编码、转换为通用码
Unit of meaning
意义单位
WaC/Web as Corpus
网络语料库、网库
Wildcard
通配符
Word alignment
词对齐、词级对齐
Word form
词形
Word family
词族
Word list
词表
Word sketch
词语素描
WSD/Word-sense disambiguation
词义消歧
XML/Extensible Markup Language
可扩展标记语言
Zipf’s Law/Zipfian Law
齐夫定律
Z score
Z值
常用语料库
ACE
Australian Corpus of English
ANC
American National Corpus
ARCHER
A Representative Corpus of Historical English Registers
BASE
British Academic Spoken English Corpus
BAWE
British Academic Written English Corpus
BNC
British National Corpus
BoE
Bank of English
Brown
Brown Corpus
CANCODE
Cambridge and Nottingham Corpus of Discourse in English
CEC
China English Corpus
CEM
Corpus for English Majors
CHILDES
Child Language Data Exchange System
CIC
Cambridge International Corpus
CLEC
Chinese Learners English Corpus
CLOB
2009 Brown family corpus of British English
COBUILD
Collins Birmingham University International Language Database
COCA
The Corpus of Contemporary American English
COLSEC
College Learners Spoken English Corpus
COLT
Bergen Corpus of London Teenage Language
Crown
2009 Brown family corpus of American English
FLOB
Freiburg-LOB Corpus of British English
FROWN
Freiburg-Brown Corpus of American English
Helsinki Diachronic corpus
Diachronic part of the Helsinki Corpus of English Texts
HKCSE
Hong Kong Corpus of Spoken English
ICE
International Corpus of English
ICE-GB
International Corpus of English: Great Britain
ICLE
International Corpus of Learner English
JEFLL
Japanese EFL Learner Corpus
LCMC
Lancaster Corpus Mandarin Chinese
LINDSEI
Louvain International Database of Spoken English Interlanguage
LIVAC
Linguistic Variations in Chinese Speech Communities
LLC
London Lund Corpus
LOB
Lancaster-Oslo/Bergen Corpus
LOCNESS
Louvain Corpus of Native English Essays
LONGDALE
LONGitudinal DAtabase of Learner English
MICASE
Michigan Corpus of Academic Spoken English
MICUSP
Michigan Corpus of Upper-level Student Papers
NESSIE
Native English Speakers’ Similarly and Identically-prompted Essays
PACCEL
Parallel Corpus of Chinese EFL Learners
SBCSAE
Santa Barbara Corpus of Spoken American English
SCCSD
The Spoken Chinese Corpus of Situated Discourse
SCORE
Singapore Corpus of Research in Education
SEC
Spoken English Corpus
SECCL
Spoken English Corpus of Chinese Learners
SECOPETS
Spoken English Corpus of Public English Test System
SEU
Survey of English Usage
SWECCL
Spoken and Written English Corpus of Chinese Learners
WECCL
Written English Corpus of Chinese Learners
Last updated 2012-08-08 by 许家金
PAGE
1