可思数据-人工智能媒体资讯平台!可思数据-人工智能媒体资讯平台!

自然语言处理相关数据-互联网词库

数据类型:文本语料 热度
★★★☆☆

文件类型: .zip     文件大小:未知

授权方式: 其它     发布时间:2019-02-20

数据介绍:
互联网词库来自于对SOGOU搜索引擎所索引到的中文互联网语料的统计分析,统计所进行的时间是2006年10月,涉及到的互联网语料规模在1亿页面以上。统计出的词条数约为15万条高频词,除标出这部分词条的词频信息之外,还标出了常用的词性信息。
 
格式说明:
数据格式为
词A 词频 词性1 词性2 … 词性N
词B 词频 词性1 词性2 … 词性N
词C 词频 词性1 词性2 … 词性N

词性说明:
N 名词
V 动词
ADJ 形容词
ADV 副词
CLAS 量词
ECHO 拟声词
STRU 结构助词
AUX 助词
COOR 并列连词
CONJ 连词
SUFFIX 前缀
PREFIX 后缀
PREP 介词
PRON 代词
QUES 疑问词
NUM 数词
IDIOM 成语
本文来自织梦

特别声明:

¤ 此数据集库仅供研究和教育用途,不得用于任何商业用途。
¤ 如果您在任何出版物或报告中使用该数据库,则必须添加引用来源。
¤ 版权归作者及所在组织所有。
¤ 如用于商业用途,请联系版权所有人。
¤ 本站数据来源于网络如有侵权请联系我们。
人工智能交流群扫码邀请
人工智能交流群扫码邀请

    最近关注
    热点内容
    热点图文