热门资讯> 正文
2026-04-03 11:00
需要知道
不列颠哥伦比亚省温哥华,2026年4月3日(环球新闻网)- -全球数据注释工具市场的采用率正在增长,其中自动驾驶汽车(AV)和移动性占需求的最大份额。随着市场的发展,构建自动驾驶程序的企业AV团队面临着仅靠模型架构无法解决的挑战:训练数据质量。对于需要在各种天气和地点的高速公路上安全工作的AV程序来说,测试版本和准备使用的系统之间的差异通常取决于标记数据背后的准确性、可靠性和专家知识,而不是模型本身。TELUS Digital是自动驾驶汽车项目人工智能数据解决方案的全球领导者,与整个物理人工智能数据生命周期的企业团队合作,解决生产就绪注释操作的实际需求。
关键事实
TELUS Digital人工智能研究与创新高级总监Steve Nemzer解释道:“在模拟中表现良好的自主系统与在现实世界中可靠运行的自主系统之间的差距几乎总是可以追溯到数据。不是数据量,而是数据的精确度。安全关键应用所需的质量水平的多传感器注释是与通用标签有根本不同的学科。"
自动驾驶汽车正在推动行业中最复杂的注释需求
数据注释工具市场已从一个专门的利基市场发展成为人工智能行业的基础基础设施层之一,而自动驾驶汽车正在推动其要求最高的层面。根据行业研究,2025年全球市场价值为16.9亿美元,预计到2034年将超过140亿美元,其中AV和其他图像和视频注释用例占总市场份额的46%。
该份额反映了AV注释实际需要的规模。自主系统必须在所有天气条件下、以高速公路速度跨多种传感器模式感知和解释物理世界,误差幅度接近零。没有其他注释用例能够强加相同的技术精度、跨模式一致性和安全后果的组合。
《Sensors》杂志2025年发表的一篇评论探讨了自动驾驶的多传感器融合方法,证实了为什么这仍然是人工智能数据操作中最困难的问题之一。该评论发现,构建稳健的感知模型严重依赖于访问跨激光雷达、相机和雷达等多种模式注释的大规模、高质量、精确同步的数据集,但获取此类数据集成本高昂且劳动密集型。在恶劣的天气条件、弱光环境和有障碍的场景中,注释模糊性增加,准确性变得更难大规模保持,挑战进一步加剧。
跨模式一致性是区分安全感知模型与不可靠感知模型的关键
自动驾驶汽车不依赖于单个传感器。现代感知系统融合来自LiDART、雷达、摄像头,有时还有超声波传感器的数据,以全面了解驾驶环境。每种传感器模式都有独特的优势:LiDART提供精确的3D空间数据,雷达检测速度并在不利天气下运行,相机捕捉丰富的视觉背景,包括颜色、纹理和标牌。
数据注释团队面临的挑战在于维护跨模式的一致性。在激光雷达点云中识别的行人必须与摄像机帧和雷达返回中的同一行人精确对应。这需要支持融合传感器数据的3D边界框、语义分割、全景分割和时间序列标记的注释平台。
“当我们谈论自动驾驶的多传感器注释时,我们谈论的是在结构上根本不同的数据类型之间保持一致性,”Nemzer解释道。“激光雷达为您提供稀疏点云,雷达为您提供速度,相机为您提供像素。注释团队必须将这些内容统一为有关场景中发生的事情的单一连贯真相,并且他们必须按规模、逐帧、亚像素的准确度进行。这不是一项您可以完全自动化的任务。"
TELUS Digital的Ground Truth Studio平台专为解决这种复杂性而设计,支持相机与LiDART融合、兼容固态和闪光LiDART传感器的3D点云分割、2D和3D场景中的车道检测,以及大规模视频注释的自动对象插值和跟踪。
自动化标签在哪里达到了极限,以及什么接管
自动化标记工具最近取得了显着进步,它们在加快大容量注释任务的吞吐量方面发挥了重要作用。然而,对于安全关键型人工智能应用来说,仅仅自动化是不够的,在这些应用中,训练数据中的标签错误可能直接导致现实世界中的感知失败。
驾驶场景的长尾解释了为什么。雨、雪、雾和灰尘会降低LiDART数据质量,产生噪音和假点,对自动化标签系统提出挑战。障碍物体、不寻常的道路配置和罕见的边缘情况需要人类判断才能正确解释。主动学习、共识注释和多阶段审查工作流程是人类在环程序保持准确性而不牺牲企业AV程序所需的吞吐量的机制。
TELUS Digital通过其由超过100万训练有素的注释者和语言学家组成的全球人工智能社区来管理这一平衡,并得到了具有汽车、机器人和工业应用专业知识的领域专业团队的支持。该公司每年交付超过20亿个标签,其质量管理系统专为安全关键项目的可追溯性和审计要求而设计。
人工智能数据合作伙伴决策是一项多年战略承诺-以下是如何做出的
对于构建自动驾驶汽车项目的企业AV团队来说,人工智能数据合作伙伴决定是一种多年的战略合作伙伴关系。训练数据中嵌入的质量、一致性和领域专业知识直接决定模型性能、安全裕度和生产部署时间。
行业分析师评估提供了一个有用的视角。TELUS Digital于2024年在Everest Group首届AI/ML数据注释和标签解决方案PEAK Matrix®评估中被评为领导者,是仅有的五家获得该称号的提供商之一。该评估强调了TELUS Digital的平台优先方法及其处理不同数据类型和模式(包括图像、文本、视频、音频、激光雷达、地理空间和计算机视觉)的复杂用例的能力。
Nemzer说:“企业AV团队应该询问谁可以标记他们的数据,以他们的计划所需的规模和质量水平管理完整的数据运营管道,以及谁拥有领域专业知识来了解他们正在查看的内容。”“对于安全关键型应用程序,提供标记数据的数据合作伙伴和提供生产准备培训数据的数据合作伙伴之间的区别就在于原型和产品之间的区别。"
常见问题
问:什么是多传感器数据标签?为什么它对自动驾驶汽车很重要?
答:多传感器数据标记是注释来自多种传感器类型(LiDART、雷达、摄像头,有时还有超声波传感器)的训练数据的过程,以便自动驾驶车辆感知模型可以学习将这些输入融合到对驾驶环境的统一理解中。这很重要,因为没有一个传感器可以提供完整的图像。LiDART提供精确的3D空间数据,但在大雨中表现不佳。相机捕捉丰富的视觉细节,但失去深度感知。这些模式之间的注释必须跨模式一致,这意味着同一对象在每个传感器流中被标记相同。
问:为什么自动驾驶汽车的数据标签不能完全自动化?
答:自动化标签工具对于大容量、简单的注释任务有效,但对安全至关重要的人工智能应用程序需要人在环工作流程来处理边缘情况、模糊场景和降级的传感器数据。雨、雾和灰尘会在激光雷达点云中产生噪音。不寻常的道路配置和罕见的驾驶场景也需要领域专业知识来正确解释。
问:我应该在自动驾驶的人工智能数据合作伙伴中寻找什么?
答:企业AV团队应在五个方面评估潜在的人工智能数据合作伙伴:传感器特定的注释能力(LiDART、雷达、相机融合)、运营规模和注释者社区、具有可追溯性和审计跟踪的质量管理系统、汽车应用领域的专业知识以及安全和合规基础设施。Everest Group的PEAK Matrix®数据注释和标签以及其他行业分析师排名可作为独立判断方式。
问:一般人工智能数据标签和安全关键注释之间有什么区别?
答:通用人工智能数据标记重点关注容量和吞吐量,快速标记大型数据集,以便跨搜索、推荐和内容审核等消费者应用程序进行模型训练。自动驾驶汽车的安全关键注释需要一种根本不同的方法:亚像素准确性、传感器类型的跨模式一致性、视频序列的时间一致性以及具有完全可追溯性的质量保证系统。消费者人工智能应用程序中的注释错误可能会降低推荐的质量。安全关键AV应用程序中的注释错误可能会导致移动车辆的感知故障。
问:什么是LiDART点云?为什么很难注释?
答:激光雷达点云是由激光雷达传感器生成的3D数据集,它使用激光脉冲来测量距离并创建周围环境的空间地图。注释LiDART点云具有挑战性,因为数据是稀疏的(尤其是在远距离时)、非结构化的,并且受环境条件的影响。
关于TELUS Digital TELUS Digital是TELUS Corporation(TFX:T,纽约证券交易所代码:TU)的全资子公司,为客户和员工打造独特且持久的体验,并创造以未来为中心的数字化转型,为我们的客户带来价值。我们是品牌背后的品牌。我们的全球团队成员既是客户产品和服务的热情大使,也是技术专家坚定地追求提升最终客户旅程、解决业务挑战、降低风险并推动持续创新。我们的端到端集成功能组合包括客户体验管理、数字解决方案(例如云解决方案)、人工智能驱动的自动化、前端数字设计和咨询服务、人工智能和数据解决方案(包括计算机视觉)以及信任、安全和保障服务。Fuel iXTM是TELUS Digital的专有平台和产品套件,供客户管理、监控和维护整个企业的生成式AI,提供标准化AI功能和定制应用程序开发工具,用于创建量身定制的企业解决方案。TELUS Digital以目标为动力,利用技术、人类智慧和同情心为客户服务,并在我们在全球运营的地区创建包容、繁荣的社区。在我们的“人在环”原则的指导下,我们对我们开发和部署的变革性技术采取负责任的态度,积极考虑和解决我们工作的更广泛影响。了解更多信息,请访问:telusdigital.com。