ICS43.020 CCS R85 T/SHV2X 团 体 标 准 T/SHV2X1-2025 汽车驾驶自动化系统通用语料库 第3部分:语料数据采集 General corpus for automobile driving automation systemPart 3:data collection 2025-01-01发布 2025-01-01实施 上海市车联网协会 发布
T/SHV2X 1-2025
T/SHV2X 1-2025 目次 前 言 引 言 III 1范围 2规范性引用文件, 3术语和定义, 4缩略语.. 5总体要求.. 6语料数据资源 2 6.1语料数据资源分类.
2 6.2基本数据信息 2 6.3外部环境信息 6.4车辆信息, .3 6.5时间截信息 3 6.6采集任务信息 6.7坐标系信息 . 4 6.8IMU数据采集内容.
.4 6.9图像数据. 4 6.10视频信息 5 6.11雷达数据. .6 6.12声音信息 6 6.13CAN总线数据 6.14轨迹导航数据, 7数据采集要求 7.1采集过程要求.
7 7.2数据传输及存储要求, 7.3采集数据质量要求.
8数据采集安全.
7 8.1数据接人端. .8 8.2数据采集端. 8 8.3数据存储端 8 附录 (资料性) 语料数据资源参考指标 6" 附录 B (资料性) 数据资源质量要求.
11 参考文 献 12
T/SHV2X 1-2025 前言 《汽车驾驶自动化系统通用语料库》系列标准拟分为六个部分: 第1部分:总体要求: 第2部分:术语与定义: 第3部分:语料数据采集: 第4部分:语料数据清洗: 第5部分:语料数据标注: 第6部分:语料数据测试. 本文件为第3部分.
本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起 草. 请注意本文件的某些内容可能涉及专利,本文件的发布机构不承担识别这些专利的责任.
本文件由上海市车联网协会提出并归口. 本文件起草单位:上海库帕思科技有限公司、智能汽车创新发展平台(上海)有限公司、智已汽车 科技有限公司、地平线征程(上海)科技有限公司、上海临港绝影智能科技有限公司、上海机动车检测 认证技术研究中心有限公司、上海金桥智能网联汽车发展有限公司、北京一辅智行科技有限公司、上海 优咔网络科技有限公司、亿咖通(上海)技术有限公司、滴水智行科技有限公司、上海航盛实业有限公 司. 本文件主要起草人:山栋明、黄海清、施佳、郭辉、周剑鸣、赵九花、贺锦鹏、蒋达夫、黄剑其、 邵亚萌、徐春雷、解瀚光、朱雷、谭龙欢、于峰、滕添益、张帆、周轶、袁月明、李学根、张裕珍、曹 宇、胡力旗、邓思文、李想、蔡雨辰、黄鹏飞、刘建业、李勋宏、马骏、李轶刚、刘壹青、田浩、郭晓 宾、董连飞、范昌琪.
本文件首批承诺执行单位:上海库帕思科技有限公司、智能汽车创新发展平台(上海)有限公司、 智已汽车科技有限公司、地平线征程(上海)科技有限公司、上海临港绝影智能科技有限公司、上海机 动车检测认证技术研究中心有限公司、上海金桥智能网联汽车发展有限公司、北京一辅智行科技有限公 司、上海优咔网络科技有限公司、亿咖通(上海)技术有限公司、滴水智行科技有限公司、上海航盛实 业有限公司 II
T/SHV2X1-2025 引言 人工智能是新一轮科技革命和产业变革的重要驱动力量,语料数据则是人工智能研究和应用不可或 缺的资源,高质量的语料库更是人工智能赋能新质生产力的关键.
随着端到端模型整合度越来越高,对训练语料的规模和质量要求也成倍增加,相对而言,国内车企 普遍面临高质量训练数据稀缺、分布分散、一致性差、处理效率低下,数据采集成本较高(全量采集的 数据存储、计算成本巨大,且原始数据中高价值信息占比可能不足1%),单款车型上路数量较少、数 据采集规模不足,不同厂商、不同车型采集数据分散且难以形成规模效应.
为了实现可靠的汽车驾驶自动化,大量准确的语料数据采集至关重要,数据是自动驾驶系统的基础, 它能够帮助系统理解复杂的交通环境、做出明智的决策,并不断优化性能,通过对各种外部环境信息、 车辆自身状态信息以及驾驶行为数据的采集和分析,为自动驾驶技术的发展提供有力支持.
围绕“采、洗、标、测”一体化流程,制定《汽车驾驶自动化系统通用语料库》系列标准,本标准 为语料数据采集部分标准,通过本标准的制定,统一的语料数据资源的格式和要求,构建可复用的标准 化训练数据集,促进汽车驾驶自动化系统语料资源高效流通利用,降低业内企业重复采集、处理和管理 数据的巨额成本,提升本市汽车企业竞争力且推进汽车产业健康发展,为未来端到端技术架构发展所需 的数据提供基础支撑和高质量发展的要素型支撑和关键性举措以及高水平对外开放的战略性支撑.
Ⅲ