数据标注行业5年经验,对曼孚、云测、百度、阿里、长安汽车、腾讯等多家供应商都有一定的了解,做过2D拉框、车道线、库位线、点、语音标注、2D语义分割、3D点云单帧、连续帧、融合帧、点云分割等多种数据类型,目前还在这个行业,希望我的回答可以帮到你。
1、首先,我希望先对这个岗位本身做一个阐述,行业小白可以做一下参考。
数据标注就是AI大数据用来机器学习的模型。
简单理解就是把需要机器识别和分辨的数据打上标签,然后让计算机不断的学习这些特征,最终实现计算机能够自主识别。
举个例子,比如数据标注在自动驾驶领域的应用:自动驾驶是怎么完成的?
简单理解:车企通过采集大量的路况信息,将数据贴上标签后来供机器学习和参考,从而实现车辆的自主识别。
人工贴标签的概念,就像老师教学生识字一样,告诉机器路面上哪些是行人、哪些是马路建筑、哪些是不可接触的障碍物等。
但机器与人不同,它只有通过海量数据的学习,才能减少机械识别中的误差值,因此就需要大量的人力来完成贴标签的动作,这样一来,数据标注岗位也就应时而生了。
2、数据标注行业常见的项目有哪些?
另外还有一些文本标注、语音标注、视频审核等内容,我更多接触到的是车企的自动驾驶项目,因此以上截图的项目涉足更多一些。
3、数据标注员岗位的优势和劣势优势:
优势:
(1)岗位需求量大
上面有提到,要做到智能,就需要大量的基础数据做支撑,因此数据标注属于劳动密集型产业,需要大量的人工来给数据打标签,工作相对比较好找,门槛也不高。
(2)工作简单易上手
这个岗位其实只需要懂得简单的电脑操作就可以做,适合应届毕业生、实习生、暑假工、宝妈等人群,入职只需要简单的培训就能轻松上手。
(3)无销售性质
对比一些销售岗位,需要不断推销产品等这样的工作性质,数据标注员岗位就显得比较轻松了,他不需要和别人打交道,只需要把分给自己的数据按时保质保量完成就可以了,多劳多得的性质,很适合社恐人群。
劣势 :
(1)成长空间不大
因为属于劳动密集型企业,就好像是在工厂打螺丝,一个组长要管好多人,那么管理岗本来就很少,晋升的空间就很有限,年轻人注重发展的,其实是不太建议做这个行业的。
(2)重复性强
我们的工作内容,其实就是一直在重复,比如给车辆画框,一天要画几千个,每个框都是一样的,就显得很无聊,个人成长的空间是比较小的,工作本身也没有什么挑战性。
(3)数据中断,频繁换项目
这个行业有个很烦人的事情,就是数据的持续性一般都很差,有的项目刚上手做了一两个月,就没有数据了,就要换到另外的新项目上培训学习,这样就会导致你的标注产量一直上不去,但我们这个工作本身就是靠产量来拿工资的,可想而知工资就不会高。
(4)数据质量不达标,返修
做数据标注,最重要的就是交付的质量,一个框是不是按规则进行了贴边,尺寸大小是否合理等,都是有非常精准的要求的,行业小白一开始接触肯定会觉得吹毛求疵,但这就是行业的难点,如果数据一旦不达标,就要进行返修,而返修一般都会要求不能占用工作时间,所以加班也就成了家常便饭。
(5)产能无法达到要求
刚接触数据标注岗位的员工,都会觉得公司管理人员有毛病,要求那么高的产值,简直不是人干的工作。比如2D框基础产量要求画几千框,而刚入职第一天你一试只能画几百框,差的非常远,所以你不停地加班冲产量,再加上时间长了,你之前做的数据又需要返修,还不能占用工作时间,可能会更烦。
其实行业老人都知道,熟练后,领导要求的产能是可以完成的,但最让人不能接受的,就是辛辛苦苦加班做的数据,最后没有验收还被扣钱,搁谁都能气死。
如果想要全职做标注的话,建议你看看上面我在这个行业遇到的问题,如果都能接受,不妨可以试试。
不过需要注意的是,如果能选择大一点的公司最好,最起码工资会有保证,很多小公司因为项目款结算周期长的问题,拖欠员工工资给不了也是常事。
另外如果你入职觉得实在是不适应,也请你不要犹豫,有好的机会就可以转行,这行如果无法混到管理岗位,还是不要长期干,我感觉人会废掉的。