NUS SMS语料库
数据介绍:
短消息服务(SMS)消息是从一个人从他们的移动电话发送到另一个人的短消息。它们代表了一种个人交流方式,是我们当前数字时代的重要交际神器。由于大多数现有研究使用私人访问SMS语料库,因此到目前为止还不可能使用相同的原始SMS数据进行比较研究。我们描述了收集公共SMS语料库以解决此问题的努力。我们使用一系列方法来收集语料库,特别注意隐私问题以解决贡献者的担忧。我们的实时项目收集新的SMS消息提交,检查其质量,并添加有效的消息。我们将结果语料库作为XML和SQL转储以及每月语料库统计信息发布。我们机会性地收集尽可能多的关于消息及其发送者的元数据,以便实现不同类型的分析。迄今为止,我们收集了超过71,000封信息,主要关注英语和普通话。
特别声明: ¤ 此数据集库仅供研究和教育用途,不得用于任何商业用途。¤ 如果您在任何出版物或报告中使用该数据库,则必须添加引用来源。 ¤ 版权归作者及所在组织所有。 ¤ 如用于商业用途,请联系版权所有人。 ¤ 本站数据来源于网络如有侵权请联系我们。 |
人工智能交流群扫码邀请
- 上一篇:中文词语搭配库
- 下一篇:RCV1-2 英文新闻数据