相城区今日大新闻

热透新闻 主页 > 热透新闻 >
初创公司 Scale AI 开源激光雷达数据集_汽车频道_东方
发布日期:2020-06-01 06:03   来源:未知   阅读:

ScaleAI与激光雷达制造商禾塞(Hesai)合作发布了名为PandaSet的开源数据集,可用于训练自动驾驶机器学习模型。

盖世汽车讯高质量的数据是支持AI算法的基础。如果没有连续的标记数据流,就会出现瓶颈,算法会慢慢变糟,以致给系统增加风险。因此,已标注的数据对于Zoox、Cruise和Waymo这类公司而言非常重要,它们利用这些数据训练机器学习模型,来开发和部署自动驾驶汽车,这一需求催生了ScaleAI等公司。

ScaleAI利用软件和人工,为创建机器学习算法的公司处理和标注图像、激光雷达和地图数据。其客户主要是自动驾驶汽车技术研发公司,不过其平台也被Airbnb、Pinterest和OpenAI等公司采用。据外媒报道,日前,该公司与激光雷达制造商禾塞(Hesai)合作发布了名为PandaSet的开源数据集,可用于训练自动驾驶机器学习模型。该数据集是免费的,包括使用Hesai前向激光雷达PandarGT和机械旋转激光雷达Pandar64收集的数据,可授权用于学术和商业用途。

据该公司称,这些数据是疫情前在旧金山和硅谷市区行驶时收集的。Scale首席执行官兼联合创始人AlexandrWang表示,"机器学习需要高质量的数据来支持其算法。我们希望利用这些开源数据集,推动自动驾驶的发展。"

据介绍,该数据集包括48000多张摄像头拍摄的图像和16000多张激光雷达扫描图像(超过100个8秒的场景)。此外,每个场景包括28个注释类,以及大多数场景的37个语义分割标签。例如,传统的自行车或汽车周围的立方体标记手段并不足以识别所有的激光雷达数据。而Scale使用点云分割工具,可以精确地标注像雨水这类复杂的物体。

这并非业内公司首次开源自动驾驶数据。去年,安波福和Scale发布了来自自动驾驶车辆传感器套件的大型数据集nuScenes;ArgoAI发布了精心设计的数据和高清地图;Cruise也分享了数据可视化工具Webviz,可以从机器人的所有传感器中收集原始数据,并将二进制代码转换为可视化数据。

而Scale的数据集有所不同,Wang表示该数据集的许可没有任何限制。Wang称,"对高质量标签数据的需求日益增长,我们想让这些数据的访问大众化,尤其是很多自动驾驶公司无法收集这些数据。"然而这并不意味着Scale会公开所有数据,但该公司考虑在今年晚些时候收集并开源新的数据源。

Power by DedeCms