人工智能训练师于2020年正式成为新职业并纳入国家职业分类目录。2021年,《人工智能训练师国家职业技能标准(2021年版)》发布,数据标注员是人工智能训练师的工种之一。
——————————
4年前,陈霞还是一名全职妈妈,也从没想到自己会成为人工智能领域中的一员。如今,31岁的她已经是一名资深的数据标注师了。
她参与的是无人驾驶项目,负责在电脑上对车在道路上采集的现实交通场景的原始数据进行处理,将其转化为机器学习可识别的专业数据。
“比如道路上的各种障碍物、建筑、绿植,各类车道线以及行人等,我们要把这些人、物标出来,我们就是无人驾驶车的眼睛,告诉它们看见的东西是什么,应该怎么去行驶。”陈霞这样描述着她的工作。
有多少智能,就有多少人工
“数据标注是机器感知现实世界的起点,是大部分人工智能算法得以有效运行的关键环节。”百度智能云数据标注基地业务产品负责人胡驰说,简单来说,数据标注是对未经处理的语音、图片、文本、视频等数据进行特征标签,将非结构化的数据转变为机器可识别的结构化数据,使机器通过大量学习这些数据,化“人工”为“智能”。
数据标注师是伴随人工智能发展诞生的新职业,人工智能的进步离不开数据的标注。随着中国人工智能产业的高速发展,数据标注师这个新职业的需求及人数也在壮大。作为人工智能的“启蒙老师”,数据标注行业流行着一句话,“有多少智能,就有多少人工”。
目前,数据标注不仅服务于自动驾驶行业,还服务于医疗保健、智能安防、新零售等场景。
帅双双是一名医疗数据标注师,他的工作主要是对医疗类问答进行标注,纠正生成式人工智能对医疗相关问题的解答,主要用于在线问诊等场景。他介绍说,“比如向AI提问心脏病的并发症有哪些,我们要从它的多个回答中标注出符合问题的选项。有时,AI的回答虽然正确,但是语句不通顺、不清晰,我们也要对此进行标注,通过这些操作,综合培养AI的回答系统。”
AI技术的落地应用在很大程度上缓解了医疗资源紧张、地区分布不均等问题,提升了医疗体系的整体运行效率。数据标注有望在增强人工智能在医疗保健领域的应用方面发挥重要作用。
胡驰表示,目前,人工智能技术不断演化、技术与行业场景融合不断泛化,这些都需要大量的数据支撑,会对数据产生许多新的需求。数据标注也从早期的相对通用数据向专业化、复杂化方向演进。越来越多的细分场景,需要