馬斯克在推特上說:「他們非法使用推特的數據進行訓練。訴訟時間到了。」
馬斯克的行動表明,數據所有權正迅速成為「生成式人工智慧」熱潮中一個充滿爭議的戰場。大科技公司正努力開發尖端AI模型,而數據所有者試圖阻止他們,或對內容的使用收費。
微軟週三才在網站上宣布,自2023年4月25日起,多平臺智慧廣告服務(Smart Campaigns with Multi-platform),以及數據行銷中心(Digital Marketing Center,DMC)將不再支援推特,馬斯克的推文也是對此事的回應。
微軟表示,Facebook、Instagram和LinkedIn等其他社交媒體仍可繼續使用這些功能。
微軟之所以做出這一改變,可能是因為推特開始對「應用程式接口」(API)收費。
目前還不清楚馬斯克指責微軟利用推特數據非法訓練哪些AI產品,但推特並不是唯一反擊大科技公司利用其數據、訓練AI產品的公司。
像GPT這樣的AI模型,需要大量的數據進行訓練,其中大部分數據是從Reddit、StackOverflow和推特等網站上搜集而來。來自社交網路的數據很有價值的,因為它包含了非正式的、來回的對話內容。
隨著這些AI模型從研究實驗室和大學進入企業界,數據的所有者開始提出要求。
據《商業內幕》報導,Reddit現在也要求計畫使用其數據的公司,必須為瀏覽付費。
據CNBC報導,環球音樂集團本週也表示,利用藝術家的音樂進行這種訓練,代表「違反我們的協議和版權法」。圖片數據庫Getty Images正在起訴Stable Diffusion,指控該公司複製Getty Images的內容,以訓練AI圖像生成器。
目前還不清楚微軟的行為是否違法,也不確定馬斯克提出的要求是否有效。然而,一些分析指出,AI公司使用數據進行訓練時,應為其使用付費應是一個合理的要求。
推特、微軟都沒有回應CNBC的置評請求。◇