用于跟踪的阿姆斯特丹普通视频库(ALOV ++)
阿姆斯特丹普通视频库用于跟踪,ALOV ++,动画以涵盖尽可能多的环境:照明,透明度,镜面反射,与类似物体的混淆,杂乱,遮挡,变焦,严重的形状变化,不同的运动模式,低对比度等等。在编写ALOV ++数据集时,优先考虑了几个较长的视频。在这些方面的每一个方面,我们都会收集从易到难的视频序列,并强调视频难度。ALOV ++还可以通过包含来自现有数据集的11个标准跟踪视频序列来覆盖平滑和遮挡,从而与其他跟踪基准向上兼容。此外,我们选择了11个标准视频序列,这些视频序列在最近的跟踪论文中经常使用,涉及光,反照率,透明度,运动平滑度,混乱,遮挡和摇晃相机。65 PETS研讨会早些时候已经报道了序列,其中250个是新的,总共315个视频序列。dedecms.com
数据的主要来源是来自YouTube的真实视频,包含64种不同类型的目标,包括人脸,人,球,章鱼,微观细胞,塑料袋或罐头。这个系列分为十三个方面的困难,有许多难以拍摄的非常难看的视频,如舞者,音乐会中的摇滚歌手,完整的透明玻璃,章鱼,一群鸟,伪装士兵,完全遮挡的物体和极度放大的视频引入目标的突然运动。
为了最大化多样性,大多数序列都很短。短视频的平均长度为9.2秒,最长为35秒。另外一个类别包含十个长视频,持续时间在一到两分钟之间。ALOV ++中的帧总数为89364. ALOV ++中的数据由沿着每五帧灵活大小的主轴的矩形边界框注释。在极少数情况下,当运动很快时,注释会更频繁。通过线性插值获得了中间帧的基本事实。第一帧中的地面实况边界框被指定给跟踪器。