中商情報網(wǎng)訊:數(shù)據(jù)標注是對未經(jīng)處理的語音、圖片、文本、視頻等數(shù)據(jù)進行轉義、打點、拉線、拉框等操作,將這些數(shù)據(jù)標注為電腦可以識別的信息,然后上傳到數(shù)據(jù)庫,以供人工智能使用。隨著人工智能技術的不斷進步和應用場景的拓展,數(shù)據(jù)標注產(chǎn)業(yè)將迎來更加廣闊的發(fā)展空間和市場機遇。
一、數(shù)據(jù)標注的定義
數(shù)據(jù)標注,也被稱為數(shù)據(jù)標定、數(shù)據(jù)注釋,是指對文本、圖像、語音、視頻等待標注數(shù)據(jù)進行歸類、整理、編輯、糾錯、標記和批注等操作,為機器學習和人工智能算法提供訓練樣本。由于數(shù)據(jù)的質(zhì)量和數(shù)量直接影響大模型的智能水平,因此數(shù)據(jù)標注也被視作人工智能的基石。數(shù)據(jù)標注的方法和類型多種多樣,包括但不限于以下幾種:
資料來源:中商產(chǎn)業(yè)研究院整理
二、數(shù)據(jù)標注行業(yè)發(fā)展政策
數(shù)據(jù)標注產(chǎn)業(yè)是對數(shù)據(jù)進行篩選、清洗、分類、注釋、標記和質(zhì)量檢驗等加工處理的新興產(chǎn)業(yè)。培育壯大數(shù)據(jù)標注產(chǎn)業(yè)對于提升數(shù)據(jù)供給質(zhì)量,推動人工智能創(chuàng)新發(fā)展具有重要支撐作用。為促進數(shù)據(jù)標注產(chǎn)業(yè)高質(zhì)量發(fā)展,發(fā)展改革委等四部門發(fā)布了《關于促進數(shù)據(jù)標注產(chǎn)業(yè)高質(zhì)量發(fā)展的實施意見》,提出到2027年,數(shù)據(jù)標注產(chǎn)業(yè)規(guī)模大幅躍升,培育一批具有影響力的科技型數(shù)據(jù)標注企業(yè),形成相對完善的數(shù)據(jù)標注產(chǎn)業(yè)生態(tài)。
資料來源:中商產(chǎn)業(yè)研究院整理