中文搜索引擎指南网

标题: 哪一个汉字的使用频率最高呢? [打印本页]

作者: sowang    时间: 2009-8-13 12:39
标题: 哪一个汉字的使用频率最高呢?
中国的汉字很多,哪到底有多少呢,哪一个汉字的使用频率最高呢?

8月12日,酝酿多年的《通用规范汉字表》终于对外公示。上面的两个问题也有了答案。在现代汉语平衡语料库中,不重复的汉字就有8181个,而“国家语委现代汉语平衡语料库”和北京语言大学“现代新闻媒体动态流通语料库”,收录的汉字量分别为9100万和3.5亿。

汉字这么多,哪一个汉字的使用频率最高呢?

教育部语言文字应用所的王晓明老师经过统计后发现,貌不惊人的“的”字在汉字中使用频率最高,在语料库中出现的次数,竟然高达169万多次。

这其实和英语中最多出现的字母有异曲同工之处。英语中使用频率最高的字母是“e”,一是因为其构成单词多,此外最主要的是“the”这个单词用途太广泛了。现在来看,“的”能在如此多的汉字中独占鳌头,你的我的大家的此类用法功不可没。

《通用规范汉字表》分为一级字表、二级字表和三级字表,共收录8300个汉字。一级字表收字3500个,是使用频率最高的常用字,主要满足基础教育和文化普及层面的用字需要;二级字表收字3000个,使用频度低于一级字。

统计表明,仅仅书写现代汉语文本的用字,一、二级字表的6500字就覆盖全部语料的99.8%,加上三级字表的1800字,余下的字用处实际很少了。就是说,一个汉字用得频率越高,就越会出现在靠前的字表中,字频排列在3000以后的汉字,已经很少使用了。

如果为了取名字,8300个字绝对够用了。如果将字表中的8300个字进行排列组合,再加上姓氏的话,可以组合出的名字数量是个天文数字。

此次字表为51个异体字“转正”,恢复使用的异体字主要用于人名、地名。这些字都有哪些呢?




欢迎光临 中文搜索引擎指南网 (http://sowang.com/bbs/) Powered by Discuz! X3.2