British National Corpus (BNC) - English Corpora

英语国家语料库(British National Corpus,简称BNC)是目前网络可直接使用的最大的语料库,它是英国牛津出版社﹑朗文出版公司﹑钱伯斯—哈洛普出版公司﹑牛津大学计算机服务中心、兰卡斯特大学英语计算机中心以及大英图书馆等联合开发建立的大型语料库,于1994年完成。

英国国家语料库(BNC)是一个以来源广泛的书面语言和口语为样本,收录了1亿字的电子资源,用以呈现20世纪后期以来的英式英语,涉及口语和书面英语。该语料库书面语与口语并存,词容量超过一亿,由4124篇代表广泛的现代英式英语文本构成。其中书面语占90%,口语占10%。BNC最新版是BNC XML 2007。它采用国际通用标准化标注体系SGML,使用三级赋码标注,使标注错误率由3%减少到1%。在应用方面,该语料库既可用其配套的SARA检索软件,也可支持多种通用检索软件,并可直接进行在线检索。

1 个赞