可思数据-人工智能媒体资讯平台!可思数据-人工智能媒体资讯平台!

AMI Corpus 语音数据

数据类型:语音语料 热度
★★★☆☆

文件类型: .zip     文件大小:未知

授权方式: 其它     发布时间:2019-08-28

数据介绍:

AMI语料库

AMI会议语料库是一种多模式数据集,包含100小时的会议录音。有关语料库的温和介绍,请参阅 语料库概述。要访问数据,请发出的指示有。大约三分之二的数据是通过参与者在设计团队中扮演不同角色的场景引出的,从一开始就将设计项目从启动到完成。其余部分包括各种领域的自然会议。详细信息可在文档部分找到。 
  织梦好,好织梦

空值 同步录音设备:
  • 近距离和远场麦克风,个人和房间视频摄像机,投影,白板,个人笔。

注解:
  • 正字转录,许多不同现象的注释(对话行为,头部运动等)。

 

dedecms.com

虽然AMI会议语料库是为了开发会议浏览技术的联盟的使用而创建的,但它被设计用于广泛的研究领域。此网站上的下载内容包括适合大多数用途的视频,但从事视频处理的研究人员可以使用更高分辨率的视频。 

所有信号和转录以及一些注释都已根据 知识共享署名4.0国际许可(CC BY 4.0)公开发布。

 

dedecms.com

标识符: SLR16

本文来自织梦

摘要:来自AMI语料库的声学语音数据和元数据。

织梦好,好织梦

类别:演讲

dedecms.com

许可证: CREATIVE COMMONS ATTRIBUTION -NONCOMMERCIAL-SHAREALIKE v2.0 LICENSE(已修改,在许可证文件和/或AMI网页中查找更多详细信息)

内容来自dedecms

 

织梦好,好织梦

关于此资源:

dedecms.com

AMI会议语料库包含100小时的会议录音。录音使用与公共时间线同步的一系列信号。这些包括近距离和远场麦克风,个人和房间视频摄像机,以及幻灯机和电子白板的输出。在会议期间,参与者还可以使用不同步的笔来记录所写的内容。会议以英语记录,使用三个不同声学特性的房间,主要包括非母语人士。 织梦内容管理系统

描述数据的相关论文: 
  • Jean Carletta(2007年)。释放杀手语料库:创建多种一切AMI会议语料库的经验。语言资源与评估期刊41(2):181-190。PDF格式
  • Steve Renals,Thomas Hain和HervéBourlard(2007)。会议的认可和解释:AMI和AMIDA项目。在Proc。IEEE自动语音识别和理解研讨会(ASRU '07)。PDF格式

数据下载:
ami_manual_1.6.1.tar.gz [21M](AMI注释文件(版本1.6.1))镜像: [中国]   
headset.tar.gz [24G](关闭-说话acosutic数据)镜像: [中国]   
Array1-01.tar.gz [7.4G](Array1遥远的声学数据)镜像: [中国]   

本文来自织梦

Array1-02.tar.gz [7.5G](Array1遥远的声学数据)镜像: [中国]   
Array1-03.tar.gz [7.6G](Array1遥远的声学数据)镜像: [中国]   
Array1-04.tar.gz [7.5G](Array1遥远的声学数据)镜像: [中国]   
Array1-05.tar 。广州[7.5G](Array1远距离声学数据)镜像: [中国]   
Array1-06.tar.gz [7.5G](Array1远距离声学数据)镜像: [中国]    内容来自dedecms
Array1-07.tar.gz [7.5G](Array1遥远的声学数据)镜像: [中国]   
Array1-08.tar.gz [7.6G](Array1遥远的声学数据)镜像: [中国]   
织梦好,好织梦

特别声明:

¤ 此数据集库仅供研究和教育用途,不得用于任何商业用途。
¤ 如果您在任何出版物或报告中使用该数据库,则必须添加引用来源。
¤ 版权归作者及所在组织所有。
¤ 如用于商业用途,请联系版权所有人。
¤ 本站数据来源于网络如有侵权请联系我们。
人工智能交流群扫码邀请
人工智能交流群扫码邀请

    最近关注
    热点内容
    热点图文