行业报告 AI展会 数据标注 标注供求
数据标注数据集
主页 > 智能驾驶 正文

初创公司Scale AI开源激光雷达数据集

高质量的数据是支持AI算法的基础。如果没有连续的标记数据流,就会出现瓶颈,算法会慢慢变糟,以致给系统增加风险。因此,已标注的数据对于Zoox、Cruise和Waymo这类公司而言非常重要,它们利用这些数据训练机器学习模型,来开发和部署自动驾驶汽车,这一需求催生了Scale AI等公司。

  
    



  Scale AI利用软件和人工,为创建机器学习算法的公司处理和标注图像、激光雷达和地图数据。其客户主要是自动驾驶汽车技术研发公司,不过其平台也被Airbnb、Pinterest和OpenAI等公司采用。据外媒报道,日前,该公司与激光雷达制造商禾塞(Hesai)合作发布了名为PandaSet的开源数据集,可用于训练自动驾驶机器学习模型。该数据集是免费的,包括使用Hesai前向激光雷达PandarGT和机械旋转激光雷达Pandar64收集的数据,可授权用于学术和商业用途。

  据该公司称,这些数据是疫情前在旧金山和硅谷市区行驶时收集的。Scale首席执行官兼联合创始人Alexandr Wang表示,“机器学习需要高质量的数据来支持其算法。我们希望利用这些开源数据集,推动自动驾驶的发展。”

  据介绍,该数据集包括48000多张摄像头拍摄的图像和16000多张激光雷达扫描图像(超过100个8秒的场景)。此外,每个场景包括28个注释类,以及大多数场景的37个语义分割标签。例如,传统的自行车或汽车周围的立方体标记手段并不足以识别所有的激光雷达数据。而Scale使用点云分割工具,可以精确地标注像雨水这类复杂的物体。

  这并非业内公司首次开源自动驾驶数据。去年,安波福和Scale发布了来自自动驾驶车辆传感器套件的大型数据集nuScenes; Argo AI发布了精心设计的数据和高清地图;Cruise也分享了数据可视化工具Webviz,可以从机器人的所有传感器中收集原始数据,并将二进制代码转换为可视化数据。

  而Scale的数据集有所不同,Wang表示该数据集的许可没有任何限制。Wang称,“对高质量标签数据的需求日益增长,我们想让这些数据的访问大众化,尤其是很多自动驾驶公司无法收集这些数据。”然而这并不意味着Scale会公开所有数据,但该公司考虑在今年晚些时候收集并开源新的数据源。
微信公众号

声明:本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。

网友评论:

发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片
SEM推广服务

Copyright©2005-2028 Sykv.com 可思数据 版权所有    京ICP备14056871号

关于我们   免责声明   广告合作   版权声明   联系我们   原创投稿   网站地图  

可思数据 数据标注

扫码入群
扫码关注

微信公众号

返回顶部