互联网词库来自于对SOGOU搜索引擎所索引到的中文互联网语料的统计分析,统计所进行的时间是2006年10月,涉及到的互联网语料规模在1亿页面以上。统计出的词条数约为15万条高频词,除标出这部分词条的词频信息之外,还标出了常用的词性信息。
格式说明:
数据格式为
词A 词频 词性1 词性2 … 词性N
词B 词频 词性1 词性2 … 词性N
词C 词频 词性1 词性2 … 词性N
词性说明:
词性说明:
N 名词
V 动词
ADJ 形容词
ADV 副词
CLAS 量词
ECHO 拟声词
STRU 结构助词
AUX 助词
COOR 并列连词
CONJ 连词
SUFFIX 前缀
PREFIX 后缀
PREP 介词
PRON 代词
QUES 疑问词
NUM 数词
IDIOM 成语
本文来自织梦