可思数据-人工智能媒体资讯平台!可思数据-人工智能媒体资讯平台!

NUS SMS语料库

数据类型:文本语料 热度
★★★★☆

文件类型: .zip     文件大小:6.4M

授权方式: 其它     发布时间:2019-08-14

数据介绍:
短消息服务(SMS)消息是从一个人从他们的移动电话发送到另一个人的短消息。它们代表了一种个人交流方式,是我们当前数字时代的重要交际神器。由于大多数现有研究使用私人访问SMS语料库,因此到目前为止还不可能使用相同的原始SMS数据进行比较研究。我们描述了收集公共SMS语料库以解决此问题的努力。我们使用一系列方法来收集语料库,特别注意隐私问题以解决贡献者的担忧。我们的实时项目收集新的SMS消息提交,检查其质量,并添加有效的消息。我们将结果语料库作为XML和SQL转储以及每月语料库统计信息发布。我们机会性地收集尽可能多的关于消息及其发送者的元数据,以便实现不同类型的分析。迄今为止,我们收集了超过71,000封信息,主要关注英语和普通话。

特别声明:

¤ 此数据集库仅供研究和教育用途,不得用于任何商业用途。
¤ 如果您在任何出版物或报告中使用该数据库,则必须添加引用来源。
¤ 版权归作者及所在组织所有。
¤ 如用于商业用途,请联系版权所有人。
¤ 本站数据来源于网络如有侵权请联系我们。
人工智能交流群扫码邀请
人工智能交流群扫码邀请

    最近关注
    热点内容
    热点图文