“90后”数据标注师 一天在屏幕上标200万个点
“都说数据是人工智能(AI)时代的石油,我们的工作就是把原油炼成汽油。”
“我们就像一个‘幼教’,教AI更好地认识数据。”
……
聊起数据标注师这份职业,“90后”李宇龙显得格外兴奋。虽然从业仅4年,但他已经是一名资深的数据标注师。
数据标注师是随着人工智能的发展而出现的新职业。人工智能练习认知需要大量经过标注的数据,数据标注工作最早由AI工程师完成,随着人工智能所需数据量的不断增加,数据标注逐渐独立成为新的工种。
“数据标注有时候就像玩游戏。”李宇龙最近正做一个自动驾驶的数据标注项目,工作内容是对照一张2D街景照片,在相应的3D点云图上框选打点。
“你看,把汽车框起来,都打成白色的点,就代表这是一个障碍物。”随着鼠标快速滑动,屏幕上的点云图不断翻转,一个个针尖大的数据点被标注在图中不同物体上———蓝色是路面、绿色是绿植、红色是路沿、白色是障碍物。
李宇龙说,像这样一张普通的点云图,大约要标注18万个点,一个熟练的数据标注师只用半个多小时就能完成,“这样算下来,一天标200万个点不成问题”。
李宇龙原本在一家印制电路板的外资企业工作,偶然机会下接触了数据标注行业,便投身其中。他说,与传统产业相比,这份职业有种“科幻感”:传统行业的原料、产品都看得见、摸得着,而数据标注师只需要一台电脑、一根网线,原料是数据,产品也是数据。
然而,这份“科幻”的职业却实实在在地改变着现实生活。自动驾驶、人脸支付、智慧医疗、智能家居……人工智能正在给生活带来越来越多的便利,这背后都有着数据标注师的功劳。
“虽然我们从事的是人工智能领域最基础的工作,却经常能体会到价值感。”李宇龙说,新冠肺炎疫情期间他和同事做了一个医疗项目,是在肺部CT片上标注病灶数据,以提高人工智能对病毒的识别能力。“平常医生看一张CT片需要几分钟,如果用改进后的人工智能算法作为辅助,几秒钟就能初步判断一张CT上是否存在疑似病毒。”
从事数据标注需要每天对着电脑,不免让人觉得枯燥。但李宇龙却说,数据标注为他打开了更大的世界,因为经常接触不同的项目,每个项目涉及的领域也不同,会经常带来新鲜感。
“更重要的是,这会是一个持续发展的行业。”李宇龙说,随着人工智能进入越来越多的行业领域,对数据标注的需求会更多、要求也会更高,数据标注行业的前景无限。
如今,仅李宇龙所在的百度(山西)人工智能基础数据产业基地,就有35家数据标注企业、2300多名数据标注师。百度智能云数据众包则拥有超过5万名线下采集员,超过2000万名众包互联网用户。
“每当有人问起我的职业,我回答数据标注师的时候,对方的脸上总是写满了问号。”李宇龙说,期待有越来越多人了解这个行业,“希望有一天,大家提起数据标注师,就像提起教师、医生一样。”(据新华社)
新闻推荐
封 面 评 论民企经理拟提拔为镇领导 到底属于哪一种任用模式?
封面评论□蒋璟璟据澎湃新闻,杭州市萧山区委组织部近日发布的拟提拔任用区管领导干部任前公示中,现为民营企业浙江...