特朗普发推统计
概述
统计时间 2009.05.04-2019.12.23
共43982条推特,10年间平均每年4398条,每天12条
搜集了历年来各个省份的高三英语模拟卷和历年来的高考英语全国卷总共130多份电子文档,统计其中所有的大约50多万单词,得到不同单词的频数。使用python爬取了Google翻译的汉语释义和英文释义,有道词典的单词音标和单词的短语。整理好后用Word进行排版,最后导出pdf到网店进行封装打印成书。成果如下图:
我从网上搜集了历年来高考英语新课标卷真题,还有各个省的高考真题,以及各种模拟题,题型汇总总共20多个doc文件,然后使用正则匹配删除了除了英文单词外的所有字符(保留空格),使用Python写了一个很简单的程序,统计出了8千多个不同的单词及其频数,使用Excel进行排序。