当自动驾驶的汽车平稳穿行于街巷,当智能客服准确理解你的诉求,当人脸识别瞬间完成身份核验——这些习以为常的AI应用背后,有一群不为人知的“隐形工匠”。他们终日与屏幕、鼠标为伴,用一次次精准的框选、点击,为人工智能注入认知世界的能力。
在贵阳高新区的各个数据标注基地,数据标注师以指尖的“毫厘之功”,构筑AI落地的“坚实之基”。他们中,有重返职场的全职妈妈,有从一线成长起来的质检骨干,有从基础操作员蜕变为AI训练师的追梦者。这不仅仅是个体的成长故事,更是产业从劳动密集走向技术驱动、从规模扩张迈向质量跃升的生动注脚。

4月27日,在贵州鼎联数据有限公司数据标注基地,数十名数据标注师正专注进行数据标注。这群特殊的“数字工匠”,他们每天点击鼠标超万次,在像素与代码间编织着人工智能的神经网络。
“这个水马的识别区域有问题,这个框点必须要修正。”在鼎联数据的开放办公区,质检工作人员张洋正在复核自动驾驶的数据标注准确度。
“数据标注最基本的就是画框,比如检测目标是车,标注员就需要把一张图上的所有车都标出来,画框要完全卡住车的外接矩形,框得不准确机器就可能‘学坏’。”张洋补充说道,标注员就是无人驾驶车的“眼睛”,需要对行车记录仪拍摄的大量图片进行细致处理,标注出道路上的障碍物、车道线、行人等信息。这些标注后的数据将返回给企业,用于训练自动驾驶模型,使自动驾驶技术更加安全可靠。
张洋是鼎联数据的一名质检成员。在此之前,他只是一名普通的标注员,每天重复着拉框、贴合这些机械操作。“那时候一天要标注上千条数据,既枯燥,又承受着很大的质量压力。”他回忆道。经过不断的练习与实践,张洋逐渐明白,数据标注工作虽然枯燥,却是AI产业的高质量发展的基石。这份认知,让他深感责任在肩。从那以后,张洋养成了“逐帧校验、逐条审核”的习惯,每天提前到岗、延后下班。如今,他和他的质检团队,标注任务准确率始终保持在高位。
此前,陈霞也从没想到自己会成为人工智能领域中的一员。如今,她已经是一名资深的数据标注师了。“之前我不了解数据标注这个行业,文本识别、拉框、贴合等这些词汇对我而言很陌生。我标注的自动驾驶项目最初大多是2D平面图片,适用于一些简单的户外路面识别系统,在经过系统培训与实践考核后,逐步接触3D立体标注以还原真实驾驶场景,后期更涉及2D/3D融合标注及手势采集,用以提升智能系统对驾驶员行为的识别精度。”陈霞表示,未来将了解更多人工智能行业的前沿趋势,掌握语义分割、文本标注等更多技能,努力从标注师成长为培训师,为有志从事这个行业的人提供培训、指导服务。
“人工智能技术的飞速发展离不开海量高质量数据的支撑,数据采集与标注是AI模型训练的基石。为此我们打造了行业领先的‘一站式AI数据生产与管理平台’。”贵州鼎联数据有限公司项目总监李元旭表示,平台构建了覆盖项目发包、智能培训、生产质检、结算支付的全流程一体化的灵活用工平台,可为前沿领域交付专业、可靠且极具成本效益的AI数据解决方案。截至2025年年底,鼎联数据平台注册人数已突破15万人。
“贵阳贵安词元经济发展推进大会的召开为我们下步工作指明了方向。”李元旭表示,未来鼎联数据将探索建设“数据标注产业园”,在中药材、茶两个领域探索建立贵州中药材高质量数据集与贵州茶高质量数据集,为中药材与茶产业提供从育苗种植到终端销售的全程服务,助力贵州中药材和茶产业高质量发展。
在贵阳高新区,像张洋、陈霞这样的标注师并非个例。世纪恒通的两千余名标注师中,有人从全职妈妈转型为技术骨干,有人从应届生成长为项目组长;元壤科技的实训基地里,一批批学员从零基础起步,逐步走上专业岗位。
数千个屏幕前的背影,用日复一日的精准点击,构筑起AI认知世界的底层逻辑。越来越多的优秀人才,投身到数据标注这一领域中来,持续为高新区数据标注产业集聚发展注入源源不断的内生动力。
记者:王轩禹
编辑:陈旭
统筹: 黄静娴 编审: 王丹丹