T/SAIAS 018-2024 具身智能语料库建设导则.pdf

018,2024,SAIAS,具身,语料库,团体标准
文档页数:21
文档大小:819.73KB
文档格式:pdf
文档分类:团体标准
上传会员:
上传日期:
最后更新:

ICS25. 040.99 CCS 166 T/SAIAS 上海市人工智能行业协会团体标准 T/SA1AS018-2024 具身智能语料库建设导则 Construction Guidelines for Corpus of Embodied Intelligence 2024-11-16发布 2024-11-18实施 上海市人工智能行业协会 发布
T/SA1AS 018-2024 目次 前 言 引 言. III 1范围, 2规范性引用文件 3术语和定义, 4缩略语... 5具身智能数据 5.1概述.. 5.2一般原则.

5.3数据集.. 5.4数据资源. 6具身智能数据采集 6.1概述. 6.2真实数据采集. 6.3合成数据采集. 6.4数据资源提交方式 7具身智能语料生产 7.1采集数据完整性检查. 7.2数据资源清洗过程、 7.3数据资源标注过程.

10 8数据安全, 11 8.1安全原则 11 8.2安全性评价 11 8.3制度 11 8.4技术, 12 8.5人员.. 12 附录A(资料性)具身智能大模型方案. 13 A.1语言大模型. 13 A.2视觉语言大模型.

13 A.3视觉语言动作大模型 14 参考文献.. 16
T/SA1AS 018-2024 前言 本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定 起草.

请注意本文件的某些内容可能涉及专利.

本文件的发布机构不承担识别这些专利的责任.

本文件由上海市人工智能行业协会提出并归口.

本文件起草单位:上海库帕思科技有限公司、人形机器人(上海)有限公司、复旦大学、上海交通 大学、同济大学、上海人工智能创新中心、上海智元新创技术有限公司、上海傅利叶智能科技有限公司、 上海开普勒机器人有限公司、中国电子科技集团公司第二十一研究所、星海图(苏州)人工智能科技有 限公司、上海钛米机器人股份有限公司、松应科技有限公司、四川天链机器人股份有限公司、上海市先 导产业促进中心、工业互联网创新中心(上海)有限公司、上海中创产业创新研究院、国创智造科技(上 海)有限公司.

本文件主要起草人:山栋明、黄海清、许彬、姜育刚、卢策吾、何斌、庞江淼、闫维新、高宇翔、 陈春玉、王洪武、郑忠斌、高平、施佳操、卢恒、张裕珍、江磊、刘宇飞、黄媚、刘传厚、陈曦、沈荣 港、冯瑞、蒋烁、王志鹏、王宇、姚卵青、朱建超、胡硕、蔡宇圣、沈林鹏、陈宇涛、李的信、许华哲、 虞磊、潘晶、沈满、聂凯旋、张小波、黄巍、颜进、郑理莹、宋琼、李琐、方金武、王道洋、蒋龙泉、 朱立奇、贺仁龙、郑茂宽.

首期执行单位:上海库帕思科技有限公司、人形机器人(上海)有限公司、上海人工智能创新中心、 上海智元新创技术有限公司、上海傅利叶智能科技有限公司、上海开普勒机器人有限公司、中国电子科 技集团公司第二十一研究所、星海图(苏州)人工智能科技有限公司、上海钛米机器人股份有限公司、 松应科技有限公司、四川天链机器人股份有限公司.

本文件归上海市人工智能行业协会.

未经许可,不得擅自复制、转载、抄袭、改编、汇编、 翻译或将本标准用于其他任何商业目的.

11
T/SA1AS 018-2024 引言 人工智能是新一轮科技革命和产业变革的重要驱动力量,语料数据则是人工智能研究和应用不可或 缺的资源,高质量的语料库更是人工智能赋能新质生产力的关键.

在人工智能的浪潮中,具身智能作为前沿科技的代表,正受到国家和上海市的高度重视.

《具身智 能语料库建设导则》的编纂,正是在这一背景下应运而生,旨在为该领域的发展提供坚实的数据基础和 标准化指导.

国家层面,工信部发布的《人形机器人创新发展指导意见》强调了开展人形机器人标准化路线图研 究的重要性,并提出建立健全人形机器人产业标准体系,这不仅为具身智能语料库的建设提供了政策支 持,也为行业的健康发展指明了方向.

上海市作为科技创新的先行者,率先发布全国首批人形机器人具身智能标准,包括《具身智能智能 化等级分级指南》和《人形机器人分类分级应用指南》.

这些标准不仅规范了人形机器人的技术语言和 发展路径,也为语料库建设提供了明确的技术等级划分依据,上海还计划建设完成多地联动的具身智能 训练场,支持超100台异构机器人采集训练,这将为具身智能的语料库建设提供丰富的实践场景和数据 资源.

此外,上海市人民政府印发的《上海市进一步推进新型基础设施建设行动方案(2023-2026年)》 中提到,将布局智能机器人创新基础设施,建设“大模型人形机器人”协同创新平台,这为具身智能 语料库的建设提供了政策和技术支持.

本文件的编写,紧密结合这些最新的政策导向,为语料库的建设提供科学、系统、标准化的指导.

本导则将详细阐述如何收集、标注和利用数据,以满足具身智能系统在不同场景下的需求,同时确保数 据的质量和多样性.

通过遵循本导则,我们期待能够推动具身智能技术的创新和应用,为具身智能产业 的科学健康发展注入强大动力.

II1

资源链接请先登录(扫码可直接登录、免注册)
①本文档内容版权归属内容提供方。如果您对本资料有版权申诉,请及时联系我方进行处理(联系方式详见页脚)。
②由于网络或浏览器兼容性等问题导致下载失败,请加客服微信处理(详见下载弹窗提示),感谢理解。
③本资料由其他用户上传,本站不保证质量、数量等令人满意,若存在资料虚假不完整,请及时联系客服投诉处理。

投稿会员:匿名用户
我的头像

您必须才能评论!

手机扫码、免注册、直接登录

 注意:QQ登录支持手机端浏览器一键登录及扫码登录
微信仅支持手机扫码一键登录

账号密码登录(仅适用于原老用户)