台灣自主研發的繁體中文「可信任人工智慧對話引擎」(TAIDE)已完成階段性任務,國科會主委吳政忠20日宣布,目前已開發出TAIDE-7B(可商用版本),表現等同於ChatGPT3.5,預計於4月中開源釋出。
大型語言模型(LLM)快速崛起,但國際上訓練資料仍以英文為主,中文部分常以中國的簡體中文資料進行訓練,容易產生資訊偏誤或不符臺灣文化與價值觀的回應。
國科會表示,TAIDE是專屬臺灣的大型語言模型,TAIDE團隊盤點公私部門資料並個別洽商授權,整備處理共89.4GB優質繁體中文資料,並建置最新GPU運算資源,去年12月更與超級電腦「台灣杉二號」完成整合,正式提供運算服務。
目前開發出兩種模型,包括TAIDE-7B(可商用版本)及TAIDE-13B(學研用版本),即分別擁有70億及130億訓練參數量,可以處理多輪對話及阻絕產生不恰當回應能力,主要能執行寫文章、寫信、摘要、英翻中、中翻英等五大任務。
吳政忠透露,由於TAIDE-7B是放在國家網路中心,若全台有1,000萬人上線恐難負荷,因此商用版本預計4月中旬釋出給民間業者,未來安裝於筆電、手機就能給大眾應用。他說,TAIDE未來演進會以「月」來改變,並提供各行各業發展。
吳政忠指出,對話引擎目前以公務預算支應、做基礎的維護,將鼓勵更多新創嫁接在引擎上,政府也會對法律、道德、智財權、風險等進行把關。
媒體追問面對對岸敵意,深偽技術偽造影片已真假難辨,甚至無法運用AI破解,該如何因應?學生使用AI做報告、寫作業,可能帶來不良影響?
對此,吳政忠回應,影像生成等深偽技術的影響,不只是台灣面臨的問題,這部份都在研究與密切關注中,未來看到任何資訊都要多方確認;至於學校應該要讓老師了解AI發展,建議能以口頭報告方式,作為最後一道防線,學生也要有道德的使用AI。