數據標註行業5年經驗,對曼孚、雲測、百度、阿裏、長安汽車、騰訊等多家供應商都有一定的了解,做過2D拉框、車道線、庫位線、點、語音標註、2D語意分割、3D點雲單幀、連續幀、融合幀、點雲分割等多種數據類別,目前還在這個行業,希望我的回答可以幫到你。
1、首先,我希望先對這個崗位本身做一個闡述,行業小白可以做一下參考。
數據標註就是AI大數據用來機器學習的模型。
簡單理解就是把需要機器辨識和分辨的數據打上標簽,然後讓電腦不斷的學習這些特征,最終實作電腦能夠自主辨識。
舉個例子,比如數據標註在自動駕駛領域的套用:自動駕駛是怎麽完成的?
簡單理解:車企透過采集大量的路況資訊,將數據貼上標簽後來供機器學習和參考,從而實作車輛的自主辨識。
人工貼標簽的概念,就像老師教學生識字一樣,告訴機器路面上哪些是行人、哪些是馬路建築、哪些是不可接觸的障礙物等。
但機器與人不同,它只有透過海量數據的學習,才能減少機械辨識中的誤差值,因此就需要大量的人力來完成貼標簽的動作,這樣一來,數據標註崗位也就應時而生了。
2、數據標註行業常見的專案有哪些?
另外還有一些文本標註、語音標註、影片稽核等內容,我更多接觸到的是車企的自動駕駛專案,因此以上截圖的專案涉足更多一些。
3、數據標註員崗位的優勢和劣勢優勢:
優勢:
(1)崗位需求量大
上面有提到,要做到智能,就需要大量的基礎數據做支撐,因此數據標註屬於勞動密集型產業,需要大量的人工來給數據打標簽,工作相對比較好找,門檻也不高。
(2)工作簡單易上手
這個崗位其實只需要懂得簡單的電腦操作就可以做,適合應屆畢業生、實習生、暑假工、寶媽等人群,入職只需要簡單的培訓就能輕松上手。
(3)無銷售性質
對比一些銷售崗位,需要不斷推銷產品等這樣的工作性質,數據標註員崗位就顯得比較輕松了,他不需要和別人打交道,只需要把分給自己的數據按時保質保量完成就可以了,多勞多得的性質,很適合社恐人群。
劣勢 :
(1)成長空間不大
因為屬於勞動密集型企業,就好像是在工廠打螺絲,一個組長要管好多人,那麽管理崗本來就很少,晉升的空間就很有限,年輕人註重發展的,其實是不太建議做這個行業的。
(2)重復性強
我們的工作內容,其實就是一直在重復,比如給車輛畫框,一天要畫幾千個,每個框都是一樣的,就顯得很無聊,個人成長的空間是比較小的,工作本身也沒有什麽挑戰性。
(3)數據中斷,頻繁換專案
這個行業有個很煩人的事情,就是數據的持續性一般都很差,有的專案剛上手做了一兩個月,就沒有數據了,就要換到另外的新專案上培訓學習,這樣就會導致你的標註產量一直上不去,但我們這個工作本身就是靠產量來拿薪金的,可想而知薪金就不會高。
(4)數據質素不達標,返修
做數據標註,最重要的就是交付的質素,一個框是不是按規則進行了貼邊,尺寸大小是否合理等,都是有非常精準的要求的,行業小白一開始接觸肯定會覺得吹毛求疵,但這就是行業的難點,如果數據一旦不達標,就要進行返修,而返修一般都會要求不能占用工作時間,所以加班也就成了家常便飯。
(5)產能無法達到要求
剛接觸數據標註崗位的員工,都會覺得公司管理人員有毛病,要求那麽高的產值,簡直不是人幹的工作。比如2D框基礎產量要求畫幾千框,而剛入職第一天你一試只能畫幾百框,差的非常遠,所以你不停地加班沖產量,再加上時間長了,你之前做的數據又需要返修,還不能占用工作時間,可能會更煩。
其實行業老人都知道,熟練後,領導要求的產能是可以完成的,但最讓人不能接受的,就是辛辛苦苦加班做的數據,最後沒有驗收還被扣錢,擱誰都能氣死。
如果想要全職做標註的話,建議你看看上面我在這個行業遇到的問題,如果都能接受,不妨可以試試。
不過需要註意的是,如果能選擇大一點的公司最好,最起碼薪金會有保證,很多小公司因為專案款結算周期長的問題,拖欠員工薪金給不了也是常事。
另外如果你入職覺得實在是不適應,也請你不要猶豫,有好的機會就可以轉行,這行如果無法混到管理崗位,還是不要長期幹,我感覺人會廢掉的。