行业报告 AI展会 数据标注 标注供求
数据标注数据集
主页 > 数据下载 > 文本语料 正文

自然语言处理相关数据-互联网词库

时间:2019-02-20
数据类型:文本语料 热度
★★★☆☆

文件类型: .zip              文件大小:未知

授权方式: 其它     发布时间:2019-02-20

数据来源:未知             界面语言:中文

数据介绍:
互联网词库来自于对SOGOU搜索引擎所索引到的中文互联网语料的统计分析,统计所进行的时间是2006年10月,涉及到的互联网语料规模在1亿页面以上。统计出的词条数约为15万条高频词,除标出这部分词条的词频信息之外,还标出了常用的词性信息。
 
格式说明:
数据格式为
词A 词频 词性1 词性2 … 词性N
词B 词频 词性1 词性2 … 词性N
词C 词频 词性1 词性2 … 词性N

词性说明:
N 名词
V 动词
ADJ 形容词
ADV 副词
CLAS 量词
ECHO 拟声词
STRU 结构助词
AUX 助词
COOR 并列连词
CONJ 连词
SUFFIX 前缀
PREFIX 后缀
PREP 介词
PRON 代词
QUES 疑问词
NUM 数词
IDIOM 成语
本文来自织梦

下载地址:

特别声明:

¤ 此数据集库仅供研究和教育用途,不得用于任何商业用途。
¤ 如果您在任何出版物或报告中使用该数据库,则必须添加引用来源。
¤ 版权归作者及所在组织所有。
¤ 如用于商业用途,请联系版权所有人。
¤ 本站数据来源于网络如有侵权请联系我们。
转发量:


人工智能交流群扫码邀请
人工智能交流群扫码邀请

网友评论:

发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片

Copyright©2005-2028 Sykv.com 可思数据 版权所有    京ICP备14056871号

关于我们   免责声明   广告合作   版权声明   联系我们   原创投稿   网站地图  

可思数据 数据标注

扫码入群
扫码关注

微信公众号

返回顶部
扫码入群
咨询反馈
扫码关注

微信公众号

返回顶部