
文章圖片

文章圖片

文章圖片
人工智能深度學習的數據標注已經發(fā)展成為一個全新的行業(yè) , 機器學習對于數據的需求不僅僅數量在上升 , 質量和精確度也在不斷的增加 。 在這樣一個行業(yè)背景下 , 對于像數據標注師、質檢師和項目經理等專業(yè)人才的需求量也大量增加 。 所以 , 想要加入這個行業(yè) , 不僅僅要學習了解什么是數據標注?更要學習數據標注的類型有哪些 , 并且能夠在相應的項目標注平臺上熟練操作 。
常見的數據標注類型
數據標注有很多類型 , 如分類標注、標框標注、描點標注、區(qū)域標注等 。 接下來 , 精數標注研究院帶大家學習幾種常見的數標注分類 , 希望對大家在學習工作中有所幫助 。
基礎的數據標注類型有計算機視覺、語音工程、自然語言處理 。
1、計算機視覺類:
計算機視覺類
拉框標注:用2D框、3D框、多邊形框等標注出圖像或視頻數據中的指定目標對象 。
語義分割:標記圖像中存在的內容及位置 , 根據屬性進行像素級分割 , 支持單屬性、多級屬性 。
3D點云標注:將點云數據圖像中的多類指定對象使用3D框進行標注 。
關鍵點標注:對人臉關鍵點、人體骨骼關鍵點、人臉五官等進行關鍵點標注 。
線標注:支持貝塞爾曲線和普通線段標注 , 支持對車道線進行貝塞爾曲線標注 , 使用線段將圖像目標的邊緣、輪廓用線段標注 。
2D/3D融合標注:對2D平面圖與3D點云圖映射的數據組進行標注 , 支持自動貼邊、跨幀復制、測距、2/3D圖片標注分離等多種功能 。
2、自然語言處理類:
自然語言處理
OCR轉寫:將圖像中的文字進行識別 , 并以文本的形式轉寫 。
文本信息抽取:把文本里包含的信息進行分類和打標簽等結構化處理 。
NLU語句泛化:基于特定文本數據進行多角度泛化 , 以不同的描述方式重組語句 。
詞性標注:基于特定文本數據進行詞性理解標注 , 如動詞、名詞、形容詞等 。
情感判斷:針對指定文本數據 , 判斷該文本的情感類別并給出相應的標簽 , 如積極、消極等 。
意圖判斷:常使用分類的方法將句子分為相應的意圖種類 , 進而判斷語義意圖 。
3、語音工程類:
語音工程
ASR語音轉寫:提取語音數據特征 , 轉寫為對應的文本或命令 。
語音情緒判定:從語音數據中識別說話人的情緒狀態(tài) 。
聲紋識別標注:對音頻數據中的說話人進行辨認或確認 。
語音切割:根據需求 , 將語音實現分段切割 。
按照標注的難易程度來劃分 , 可以分為常識性標注和專業(yè)性標注:
1、常識性標注:比如標注道路標線、路牌、地圖等數據 , 語音識別標注等數據都屬于常識性標注 。 這種類型的標注因為應用的場景多且復雜 , 所以需要大量的標注訓練樣本 , 標注員只要認真負責、項目完成效率高、質量好就是一名好的標注師 。
地圖標注
2、專業(yè)性標注:比如醫(yī)療診斷、航空航天、電力系統(tǒng)等專業(yè)領域的標注 。 該類型的標注工作需要有領域專業(yè)知識的標注員 , 或者稱為標注專家 , 標注的工作難度也大 。
智慧醫(yī)療
【自然語言處理|數據標注有哪些類型?】
相關經驗推薦
- 紅米手機|性價比排名第1的手機,搭載天璣8100處理器,如今官方跌至1569元
- 三星Galaxy|手機出貨數據出爐,芯片堆積庫存,兩大美企坐不住了?
- 聯(lián)想|為什么建議以團隊的形式開展數據標注,而非個人
- vivo|AMD發(fā)布銳龍7000處理器:真良心廠商?性能大漲價格還降了
- 榮耀|榮耀太瘋狂,榮耀80將提前到11月發(fā)布,不止處理器會升級
- 小米科技|驍龍8+旗艦處理器,120W+5000mAh大電池,99%好評率
- |iPhoneSE4概念機:劉海全屏+A16處理器,比iPhone14還要香?
- 聯(lián)想|你的海量隱私數據,交由聯(lián)想個人云存儲X1s替你守護!
- |騰訊云游戲掌機曝光,AMD 7000系發(fā)布,看數據很Yes!
- 潘塔|ROG幻142022,AMD處理器獨顯,14英寸輕薄高端全能本
