AI 大模型資料標註「民工」月收入不超過5,000元，單價下降至4分-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

AI 大模型資料標註「民工」月收入不超過5,000元，單價下降至4分

王林

Oct 09, 2023 am 11:25 AM

人工智慧 ai 大模型是

AI 大模型是近年來人工智慧領域的熱門話題，它們能夠實現各種令人驚嘆的功能，例如生成逼真的文字和圖像，或與人類進行流暢的對話。然而，在這些大模型背後，有一群默默無聞的數據標註員，他們每天辛勤工作，為原始數據添加標籤，為AI技術提供所需的海量數據

AI 大模型数据标注“民工”月收入不超过5000元，单价下降至4分

# #數據標註員們的工作並不容易，他們需要面對乏味的任務、低收入、長期的不穩定性和隨時可能被替代的風險。他們是人工智慧技術發展的基石，卻很少受到關注和尊重

根據《Tech 星球》報道，數據標註員們採用最原始的計件製算工資，

大部分從業者每個月的收入都不過5000 元。他們有些人是專科畢業生，有些人是寶媽，有些人是轉行者。他們在三、四線城市的格子間處理圖片、文字、語音等數據，為網路大廠和車企提供服務。

本站注意到，數據標註產業也經歷了起伏。 2017 年，AI 技術期望爆棚時，數據標註員可以賺到高額收入，一個 2D 拉框就有 5 毛錢。但隨著產業競爭加劇和技術發展不順利，

數據標註的單價越來越低，現在最低只有 4 分錢。

數據標註公司也面臨巨大的壓力。他們需要具備一定的規模和資金儲備才能從源頭取得訂單，並且要承擔回款週期長、員工流動性大、品質和週期不穩定等問題。海天瑞聲是目前數據標註產業內首家主機板上市公司，去年利潤率剛超過 10%，今年上半年就陷入了虧損。

更讓數據標註員們擔憂的是，他們可能很快就會被自己參與創造的 AI 所取代。國內外都有一些公司正在開發可以自動標註資料的工具，利用市面上主流的大模型來標註資料集。這些工具聲稱可以提高標註效率和降低成本，並且達到與人工相近甚至超過人工的準確率。

當然，並非所有的資料標註都可以被 AI 取代。一些需要專業知識和邏輯分析能力的數據標註仍然需要人工參與，例如醫療、金融、自動駕駛等領域。然而，這也意味著行業門檻將不斷提高，對於數據標註員而言，要在這個行業生存下去，可能需要更多的學習和努力

以上是AI 大模型資料標註「民工」月收入不超過5,000元，單價下降至4分的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

gmail信箱登陸入口在哪裡

7493

CakePHP 教程

1377

steam的賬戶名稱是什麼格式

win11激活密鑰永久

NYT連接提示和答案

Related knowledge

位元組跳動剪映推出 SVIP 超級會員：連續包年 499 元，提供多種 AI 功能 Jun 28, 2024 am 03:51 AM

本站6月27日訊息，剪映是由位元組跳動旗下臉萌科技開發的一款影片剪輯軟體，依託於抖音平台且基本面向該平台用戶製作短影片內容，並相容於iOS、安卓、Windows 、MacOS等作業系統。剪映官方宣布會員體系升級，推出全新SVIP，包含多種AI黑科技，例如智慧翻譯、智慧劃重點、智慧包裝、數位人合成等。價格方面，剪映SVIP月費79元，年費599元（本站註：折合每月49.9元），連續包月則為59元每月，連續包年為499元每年（折合每月41.6元）。此外，剪映官方也表示，為提升用戶體驗，向已訂閱了原版VIP

使用Rag和Sem-Rag提供上下文增強AI編碼助手 Jun 10, 2024 am 11:08 AM

透過將檢索增強生成和語意記憶納入AI編碼助手，提升開發人員的生產力、效率和準確性。譯自EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG，作者JanakiramMSV。雖然基本AI程式設計助理自然有幫助，但由於依賴對軟體語言和編寫軟體最常見模式的整體理解，因此常常無法提供最相關和正確的程式碼建議。這些編碼助手產生的代碼適合解決他們負責解決的問題，但通常不符合各個團隊的編碼標準、慣例和風格。這通常會導致需要修改或完善其建議，以便將程式碼接受到應

微調真的能讓LLM學到新東西嗎:引入新知識可能讓模型產生更多的幻覺 Jun 11, 2024 pm 03:57 PM

大型語言模型（LLM）是在龐大的文字資料庫上訓練的，在那裡它們獲得了大量的實際知識。這些知識嵌入到它們的參數中，然後可以在需要時使用。這些模型的知識在訓練結束時被「具體化」。在預訓練結束時，模型實際上停止學習。對模型進行對齊或進行指令調優，讓模型學習如何充分利用這些知識，以及如何更自然地回應使用者的問題。但是有時模型知識是不夠的，儘管模型可以透過RAG存取外部內容，但透過微調使用模型適應新的領域被認為是有益的。這種微調是使用人工標註者或其他llm創建的輸入進行的，模型會遇到額外的實際知識並將其整合

七個很酷的GenAI & LLM技術性面試問題 Jun 07, 2024 am 10:06 AM

想了解更多AIGC的內容，請造訪：51CTOAI.x社群https://www.51cto.com/aigc/譯者|晶顏審校|重樓不同於網路上隨處可見的傳統問題庫，這些問題需要跳脫常規思維。大語言模型（LLM）在數據科學、生成式人工智慧（GenAI）和人工智慧領域越來越重要。這些複雜的演算法提升了人類的技能，並在許多產業中推動了效率和創新性的提升，成為企業保持競爭力的關鍵。 LLM的應用範圍非常廣泛，它可以用於自然語言處理、文字生成、語音辨識和推薦系統等領域。透過學習大量的數據，LLM能夠產生文本

為大模型提供全新科學複雜問答基準與評估體系，UNSW、阿貢、芝加哥大學等多家機構共同推出SciQAG框架 Jul 25, 2024 am 06:42 AM

編輯|ScienceAI問答（QA）資料集在推動自然語言處理（NLP）研究中發揮著至關重要的作用。高品質QA資料集不僅可以用於微調模型，也可以有效評估大語言模型（LLM）的能力，尤其是針對科學知識的理解和推理能力。儘管目前已有許多科學QA數據集，涵蓋了醫學、化學、生物等領域，但這些數據集仍有一些不足之處。其一，資料形式較為單一，大多數為多項選擇題（multiple-choicequestions），它們易於進行評估，但限制了模型的答案選擇範圍，無法充分測試模型的科學問題解答能力。相比之下，開放式問答

你所不知道的機器學習五大學派 Jun 05, 2024 pm 08:51 PM

機器學習是人工智慧的重要分支，它賦予電腦從數據中學習的能力，並能夠在無需明確編程的情況下改進自身能力。機器學習在各個領域都有廣泛的應用，從影像辨識和自然語言處理到推薦系統和詐欺偵測，它正在改變我們的生活方式。機器學習領域存在著多種不同的方法和理論，其中最具影響力的五種方法被稱為「機器學習五大派」。這五大派分別為符號派、聯結派、進化派、貝葉斯派和類推學派。 1.符號學派符號學（Symbolism），又稱符號主義，強調利用符號進行邏輯推理和表達知識。該學派認為學習是一種逆向演繹的過程，透過現有的

SOTA性能，廈大多模態蛋白質-配體親和力預測AI方法，首次結合分子表面訊息 Jul 17, 2024 pm 06:37 PM

編輯|KX在藥物研發領域，準確有效地預測蛋白質與配體的結合親和力對於藥物篩選和優化至關重要。然而，目前的研究並沒有考慮到分子表面訊息在蛋白質-配體相互作用中的重要作用。基於此，來自廈門大學的研究人員提出了一種新穎的多模態特徵提取（MFE）框架，該框架首次結合了蛋白質表面、3D結構和序列的信息，並使用交叉注意機制進行不同模態之間的特徵對齊。實驗結果表明，該方法在預測蛋白質-配體結合親和力方面取得了最先進的性能。此外，消融研究證明了該框架內蛋白質表面資訊和多模態特徵對齊的有效性和必要性。相關研究以「S

佈局 AI 等市場，格芯收購泰戈爾科技氮化鎵技術和相關團隊 Jul 15, 2024 pm 12:21 PM

本站7月5日消息，格芯（GlobalFoundries）於今年7月1日發布新聞稿，宣布收購泰戈爾科技（TagoreTechnology）的功率氮化鎵（GaN）技術及智慧財產權組合，希望在汽車、物聯網和人工智慧資料中心應用領域探索更高的效率和更好的效能。隨著生成式人工智慧（GenerativeAI）等技術在數位世界的不斷發展，氮化鎵（GaN）已成為永續高效電源管理（尤其是在資料中心）的關鍵解決方案。本站引述官方公告內容，在本次收購過程中，泰戈爾科技公司工程師團隊將加入格芯，進一步開發氮化鎵技術。 G

See all articles

AI 大模型資料標註「民工」月收入不超過5,000元，單價下降至4分

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題