首頁 國際 要聞

透視搜尋引擎 谷歌演算法存在偏見(完)

2018年11月1日,Google員工就公司包庇性騷擾案件,進行罷工。(BRYAN R. SMITH/AFP via Getty Images)
2018年11月1日,Google員工就公司包庇性騷擾案件,進行罷工。(BRYAN R. SMITH/AFP via Getty Images)

【記者楊傑凱/報導】前言:谷歌(Google)和臉書(Facebook)等科技巨擘,可能會操縱演算法來影響使用者的認知、觀感態度,甚至投票傾向嗎?搜尋結果的排名又如何影響中間選民呢?在瀏覽網頁的背後,搜尋演算法對我們的行為到底產生多大的影響?

英文《大紀元時報》資深記者楊傑凱(Jan Jekielek)2019年9月專訪《今日心理學》雜誌的前主編羅伯特.愛潑斯坦(Robert Epstein),討論上述問題。以下為訪談內容:

「機器學習公平演算法」

楊傑凱:我也覺得這令我毛骨悚然。現在大量研究顯示,程式開發者的意識形態偏見會被納入演算法。那可能需要在另一次訪談來專門探討。但是谷歌如何抵消這種影響?假設他們決定以您希望的方式做出回應,但要如何做呢?他們是否必須對搜尋進行重新排序,以免出現偏見?這又要如何運作呢?

愛潑斯坦:幾個月前我還在思考這個問題,但現在已有答案。這要感謝揭密的前谷歌員工沃瑞斯(Zach Vorhies),感謝他公布的一些文件。事實上,谷歌可以輕鬆解決搜尋結果中的政治偏見,那我怎麼知道呢?因為谷歌內部一直都在解決所謂演算法不公平或相關的困難問題,所以谷歌開發了一系列使演算法較公平的方法,稱為「機器學習公平演算法」(ML Fairness Algorithms)。

簡單介紹一下該演算法的原理,假設你正在谷歌上瀏覽圖片,然後輸入「CEO」(執行長),你會主要看到男性的圖片,因為絕大多數美國的CEO是男性。這正是某些人稱谷歌演算法不公平的一個具體例子。即使目前大多數的執行長都是男性,但這個事實可能會讓某些人不開心。

因此,他們開發了非常簡單的方法來彌補,當您輸入「CEO」時,您會看到一半是男性,一半是女性。這做法很聰明,當然並不一定符合真實情況,但可以被視為社會工程(social engineering),因為它產生的印象並不完全符合真實情況。當然,如果將這種邏輯應用於社會各層面,則你可能在進行大規模社會工程,或可能被指控在從事大規模社會工程。

我想表達的重點是,谷歌有能力消除任何可能的政治偏見,他們可以很快做到,也許一天之內就可以。這就是我在思考,如果我們透過大型監視系統暴露各種偏見,谷歌公司可能會退縮,他們可能會使用已經開發的技術,即所謂的機器學習公平性演算法來彌補這個問題。下次我們尋找偏見時,就什麼也找不到,問題已消失。

臉書的操作手法

楊傑凱:您不僅說明了問題,還提出可能的解決方案,實屬難得。那請問目前其他搜尋引擎的操控方法,例如大型社群平台臉書又如何呢?他們採用何種演算法呢?

愛潑斯坦:臉書至少有5種影響人們意見和投票傾向的方法。我最早是在2016年寫過這類文章。他們最簡單的方法稱為「定向消息傳遞」,我在一定程度上研究和量化過這個問題,我稱之為「目標消息傳遞效應」(targeted messaging effect,TME),舉個最簡單的例子,順帶一提,這是基於臉書2012年自己發布的數據。

如果在2016年選舉日,祖克柏(Mark Zuckerberg,臉書執行長)決定僅向民主黨選民或偏左的選民發送「去投票」的提示,那一天希拉蕊.柯林頓的投票數將比她當天實際得票多至少45萬。那因為祖克伯偏左,我猜他可能因為沒有想到要發出針對性的訊息而懊惱。但關鍵是,他有能力那樣做,定向消息傳遞有非常強大的影響力。

在2018年,谷歌確實在其首頁上發布了「去投票」的提醒,他們將主頁上彩色的「Google」換成「Go Vote」。如您所知,我發表了一篇文章,其中包含所有計算結果,文中表明如果這個投票提示發送給每個美國人,那麼會有更多人投票,否則這些人將待在家裡。但是由於使用谷歌的人群分布的原因,民主黨獲得的票數將比共和黨獲得的票數多80萬,聽起來是很多選票,但這是期中選舉,因此,這些選票分散在數百個選舉中。儘管如此,這還是有利於民主黨。毫無疑問,在谷歌發布提示之前,谷歌的數據分析師所做的計算與我的計算相同。

如果谷歌僅將該提示主要顯示給民主黨人,或者顯示給左傾或偏左的人,那將產生更大的影響。在極端情況下,民主黨獲得的選票將比共和黨獲得的選票多出460萬,這是另一種效應,我們稱其為「差異人口統計效應」(differential demographics effect,DDE)。正如我之前所說,我偶然發現這些現象,並且一直在努力嘗試理解它們,並對其進行量化。

大多數這些影響類型在人類歷史上從未發生過。網際網路造就了科技巨頭,也可能被這些科技巨頭完全掌握與壟斷。換句話說,你無法抵消這種影響,即使找到原因,也無法完全消滅它。

楊傑凱:因此,您成功建立了龐大的監視系統。有至少1千人、甚至更多人在研究搜尋引擎的操縱效應,那有無法發現DDE或其他效應的情況嗎?

愛潑斯坦:當然。到目前為止,我已經確定大約有12種效應,例如SEME、DDE和TME。但肯定還有其他方法,畢竟這只有我在研究。到目前為止,一直努力去發現這些效應並對其進行量化和研究的只有我一人,我也是唯一設置監視系統來捕獲短暫經歷的人。這令我覺得很奇怪,我想這需要有所改變。到2020年將非常棘手,如果只有我和我的同事蒐集所有這些數據,會能產生影響或改變什麼嗎?

楊傑凱:您的意思是,需要更多人來參與這個領域的研究,是嗎?

愛潑斯坦:確實應該有很多像我這樣的人,分散在不同的機構展開這樣的工作。政府、非營利組織、大學裡都應該有人在從事類似這種研究。我希望在2020年,如果有更突破且可信的發現,再將這些數據移交給合適的主管部門和專家,應能為社會帶來一些真正的改變。

楊傑凱:這真是了不起的工作,非常感謝您!

愛潑斯坦:謝謝。(全文完)◇