AI大模型的訓練需要海量的數(shù)據(jù),而這些數(shù)據(jù)從哪里來? 隨著人工智能技術(shù)的飛速發(fā)展,各大科技公司對高質(zhì)量數(shù)據(jù)的需求日益增長。為了滿足這一需求,一些互聯(lián)網(wǎng)巨頭將目光轉(zhuǎn)向了廉價的年輕人。
為了獲取更多的數(shù)據(jù),一些大廠開始招募“AI錄音員”。 這些年輕人會被邀請參加長時間的對話,內(nèi)容涵蓋各種話題。這些對話會被錄音并整理,成為訓練的寶貴數(shù)據(jù)。參與者通常會獲得一筆不菲的報酬,但這背后也隱藏著一些問題。
長時間的對話、重復性的工作以及對數(shù)據(jù)質(zhì)量的高要求,讓這項工作變得枯燥乏味。 而且,一些公司對個人隱私的保護措施不夠完善,參與者擔心自己的個人信息會被泄露。此外,這種模式也引發(fā)了對數(shù)據(jù)采集倫理的討論。如何平衡數(shù)據(jù)需求與個人隱私保護,是擺在科技公司面前的一道難題。