草根影響力新視野 黎松子 

說起小鎮青年,我第一印象便想到賈樟柯導演的電影,山西某個縣城裡的遊戲廳、檯球廳晃蕩的小鎮青年,他們不佔有社會資源,也沒有過硬的生存本領,但時代的洪流裹挾著他們,安穩活著已經不容易。

他們怎麼會與高大上的人工智慧搭上關係 ?

沒錯,他們就是人工智慧訓練師,是資源閉塞的小鎮青年能打的為數不多的一種工作。

眾所周知,人工智慧的三大基石是資料、算力與演算法,數量越多品質越高的資料,往往越能夠訓練出更“聰明”的模型。人工智慧需要資料餵養,人工智慧訓練師就是為人工智慧提供“飼料”的飼養員。他們將大量的文字、語音、圖像打上標記,比如一條道路的街景,要將上面的物體標注出來,記好名稱、大小、顏色等基本資訊,俗稱“拉框”。這些被標注過的資料,才能為各類人工智慧所用。

一個熟手,平均一天可以拉兩千到三千個框 ,一個框4分錢,一個月可以掙三千多塊錢。

簡而言之,就是資料標注員。資料標注是人工智慧獲取訓練資料的主要管道,應用場景廣泛。從語音轉錄、人臉識別、自動駕駛到AI聊天,人工智慧模型訓練所需要的海量資料目前幾乎全部依賴資料標注員手工標注。

這份工作,起點低,有手就行,唯一的缺點是費眼。四五線小鎮,沒什麼產業,青年們有一份月入3000多的工作已經不錯了。現在一般的城鎮都只剩下老頭兒老太太,年輕人在家沒工可打 ,只能外流,而現在很多農村類視頻博主,拍拍農村生活,帶帶農村土特產,主打就是一個販賣鄉愁,但這些博主可能都未必真正生活在農村,也就是拍段子的時候才回去,很多已經都是成熟的MCN團隊運營了,城鎮和農村,留人很難,所以資料標注員真是留下來的小鎮青年為數不多的選擇。這份工作顯然是枯燥的,每天重複拉框標注,沒什麼技術含量,以最簡單的技能,與最前沿的技術產生了聯繫。

因特網 標牌 公司 現代 數字 高科技 在線 應用程序 建築 徽 符號 關閉 外觀 信 中國 加州 標誌 美國 司令部 中國的 牌 圖標 網站 企業 正面 公司 技術 美國 標誌 美國 業務 辦公室 研究 服務 發育 標識
圖片取自:(示意圖123rf)

貴州,西南腹地,有一個百鳥河數字小鎮,位於黔南州惠水縣城西南部,距惠水縣城約10公里,真正大山深處的 “高科技”基地,她是由政府推動的以大資料應用為引領的新型數位產業園。這裡有很多資料標注公司,有大量小鎮青年為百度、阿裡、京東、HTC、科大訊飛、鯤雲科技等知名大資料關聯企業提供資料加工處理服務。這些數位標準員很少211,985,一般就是普通本科,很多還是附近職業學院的學生。

山西,賈樟柯電影中的山西,一般人印象中的產煤大省,也有百度佈局的資料標注基地。資料標注員超過2000多名。

在疫情期間,他們標注病人的肺炎影像圖,平常醫生可能需要幾分鐘判斷一張CT,加入了人工智慧標注作為輔助手段以後,幾秒張就能判斷一張CT上是否有病毒。他們還完成了戴口罩的人臉圖像標注,採集大量的戴口罩的人臉照片後,資料標注師對人臉的眉毛、眼鏡、顴骨等人臉關鍵點進行精準的標注,標注的特徵點越多,AI就越能精確地識別戴口罩場景下的人臉,讓人們在不摘口罩的情況下也能實現精確的體溫測量,或是通過人臉閘機。看似簡單重複的工作,也能帶來巨大的價值。

百度山西太原資料標注基地2023年招聘工作人員簡章上招聘要求只有六點:1、大專及以上學歷,有工作經驗者優先,特別優秀者可放寬至中專。可接受實習生。2、年齡18到40周歲之間,特別優秀者可適當放寬年齡條件。3、身體健康,無色盲、色弱、色差。4、掌握電腦的基礎操作。5、具有較好的學習能力和理解能力。6、工作積極主動,責任心強,細心耐心。這基本上完美契合了小鎮青年的工作期望,門檻低,入手快,工資將就。

在新疆,新疆和田皮山縣,也有數字產業園,,政府重點發展呼叫中心、電子商務、直播平臺、資料標注、人才培養基地等五大重點產業領域,其中資料標注被放在了首要位置。有4000人在產業園從事資料標注工作。

現在全國各地都有規模在1000人以上的資料標注基地,他們大多都建在二三線城市,為大量城鎮青年提供就業機會。這些地方經濟欠發達,產業不健全,年輕人就業機會少,從職業技能來講也卷不過大城市名牌大學生。CHAT GPT的資料標記員就來源於相對不發達的非洲肯亞、烏幹達地區。一個缺工作,一個缺大量勞動力,兩者雙相奔赴,很多做標注員的青年也許並不清楚自己工作的性質,也可能不會意識到自己當下的工作與人工智慧有什麼聯繫,對他們來說,這僅僅就是一份工作而已。

他們餵養人工智慧,而人工智慧最終替代他們。 但人工智慧領域有一句流傳甚廣的老話,即“人工智慧行業,有多少人工就有多少智慧”。著名圖片資料庫ImageNet,官網上介紹有14197122 張圖片, 21841 個同義詞索引,這個資料量的背後是來自於167個國家的五萬名標注員長達三年的辛苦工作。所以,就目前來看,人工智慧還需大量資料餵養,小鎮青年一時半會也不會被人工智慧替代,但是否有一天,人工智慧否會獲得足夠多的資料,自主學習,不再需要“餵養”?不管怎樣,作為標注員的小鎮青年,可能是最底層的互聯網民工,他們以簡單粗暴、最沒科技含量的方式跟當下最具科技含量的人工智慧產生聯繫,他們教會人工智慧如何理解世界。