英语高频词汇表5000有这样一个神奇的网站
不是58同城 不要瞎猜
它叫做 COCA美国现代英文语料库
Corpus of Contemporary American English
之前有报道称,目前英文单词已经超过了 100 万个,这是个吓人数量,我相信没有人能全部记忆。而 SUBTLEXus 根据所有交谈中的单词出现频率,最终得出了我们应该需要记住的单词数量,并以图表的形式直观的表现了出来。
▼
图表可以看出:
You, I , the , to 这 4 个单词用的是最多的,在所有交谈中约占 13%
's ,a , it … 等 16 个单词,在所有交谈中约占 30%
this, he ,on … 等 57 个单词,在所有交谈中约占 50%
360 个常用单词,在所有交谈中约占 75%
2700 个常用单词,在所有交谈中约占 90%
60000 个常用单词,在所有交谈中约占 97%
▶COCA的神奇之处:
1. 来自专业正式文本的美国当代英语语料库
「COCA 美国现代英文语料库」是由美国杨百翰大学 Mark Davies 教授所开发的一个免费的语言资料线上搜寻引擎,他自称是当今世界上最大的语言资料库,而且他的语料来自于美国英语使用情境下的这些文本:
· 口语演讲
· 小说书籍
· 杂志报纸
· 学术期刊
也就是说比起搜寻网络用语素材,「COCA 美国现代英文语料库」的语料来自于有更多严谨检查与使用的专业或正式文件,所以相对起来更能避开有争议的方法,而更接近正式的语法。
这对有「英文文稿翻译」、「英文正式报告」、「英文职场书信」需求的使用者来说,提供了更专业正确的查询管道,并且查询时可以找到各种词汇在这些文件里的使用方法参考。
2. 持续更新,搜寻快速,包含去年最新语料
值得一提的是,「COCA 美国现代英文语料库」从 1999 年创立至今依然持续更新,每年都要更新大约 2000 万的词汇数量,目前到 2015 年年底为止已经拥有 5 亿 2000 万的庞大词汇语料。
即使有这么庞大的语料库,但「COCA 美国现代英文语料库」搜寻的速度依然很快,瞬间就可以找到结果。
在不需登入的情况下,每个用户每天可以使用 10 到 15 次的搜寻,或者你可以注册免费帐户,可以无限制的使用搜寻功能。
3. 如何开始利用「COCA 美国现代英文语料库」搜寻?
基本的使用非常简单,进入「COCA 美国现代英文语料库」网站后,只要找到左方的搜寻栏位,在「Words」中输入你要查询的英文单字或词汇或句子,就可以找到相关的语言资料。
你可以在来自小说、演讲、期刊等资料中,看到一个词汇或一段用语被如何使用的方式,找到更正式或更正确的变化。
4. 如何搜寻一个字可以搭配哪些词汇用法?
更进一步,很多时候我们要写报告、写书信时,需要的是找到一个还不确定的英文词汇的使用方式,例如在一个特殊名词之前应该接什么动词?应该使用什么语法来描述一个事件?这时候要怎么利用「COCA 美国现代英文语料库」查询呢? 这时候就要用到「Collocates」上下文查询的功能。
在「Words」里输入我的核心单字,例如「beach」(海滩),我想查询要如何用正确与文雅的句子来描绘前往海滩的英文语法。
接着在「Collocates 」里输入上下文我想查询的相关词汇词性,例如下图中代表的意思是我想查询「前文」的「一个字范围内」可以接什么「动词」在海滩这个单字的前面。
如果我在 Collocates 栏位改成输入「V*」「4」「4」,那就会变成查询在「beach」这个单字的前文四个字内、后文四个字内如果要使用动词,可以使用哪些动词变化。
你可能会说,还要自己输入词性吗?其实也不用,因为你可以利用下方的「pos list」清单,找到你需要的词性,直接点选,就能输入在前方栏位中。
透过这样的查询,我们就可以去找出在一个单字的前后文里,可以使用哪些动词或名词或形容词,来构成一个正确的句子语法。
而点选一个你感兴趣的结果,右下方就会显示他的各种例句。
5. 如何搜寻一个词汇的所有变化型态?
如果不是要查询语句的用法,而是要找某一个单字的各种变化型态,这时候我们可以用 [eat] 这样的语法,去找到这个单字的所有变化型。
6. 如何查询同义字?
而要找到这个单字的其他同义字,以及相关同义字在各种文本上的使用方式时,我们把搜寻语法改成: [=speak] 就可以找到一个单字的各种同义但或许更专业的用法。
透过上述简单的方法,我们就能好好利用「COCA 美国现代英文语料库」庞大的五亿语料库,从这个美国现代文本资料里,找到当代英语更准确的使用方法,推荐有需要的朋友试试看。