大型語言模型 (LLM) 可翻譯語言、產生文字摘要、生成創意寫作內容、產生程式碼、支援聊天機器人和虛擬助理,以及輔助搜尋引擎和推薦系統。然而,隨著功能和用途不斷演進,這項技術可能遭到誤用、濫用,並造成非預期或無法預見的後果。LLM 可能生成預期外的輸出內容,包括令人反感、未顧及感受或違反事實的文字。
由於 LLM 的功能多元,令人難以準確預測會輸出什麼出乎意料或未預期的內容。考量到這些風險和複雜性,Gemini Enterprise Agent Platform 生成式 AI API 的設計皆以 Google 的 AI 原則為依據。不過,開發人員務必瞭解並測試模型,確保安全且負責任地部署模型。為協助開發人員,Vertex AI Studio 內建內容過濾功能,而我們的生成式 AI API 也會提供安全屬性分數,協助客戶測試 Google 的安全過濾機制,並根據用途和業務需求設定合適的可信度門檻。如要瞭解如何使用 API 的安全篩選器和屬性,請參閱 Agent Platform 的 Gemini API。
將生成式 API 整合至您的專屬用途和情境時,可能需要考量其他負責任的 AI 考量事項和限制。我們建議客戶採用最佳做法,以促進公平性、可解讀性、隱私權和安全性。此外,客戶仍有責任遵守 Google Cloud的《可接受的使用政策》(AUP)、《生成式 AI 使用限制政策》,以及使用 AI/ML 和生成式 AI 服務時的任何其他服務專屬條款或相關規定。
模型限制
使用生成式 AI 模型時可能會遇到下列限制 (包括但不限於):
極端情況:極端情況是指訓練資料中未充分呈現的異常、罕見或特殊情況。這類情況可能會導致模型效能受限,例如模型過度自信、誤解脈絡或輸出不當內容。
模型幻覺、建立基準和事實性:生成式 AI 模型需要以真實世界資訊、物理性質和對特定資料的準確理解為基礎,才能減少模型產生不準確、不相關或無意義輸出的機率。如要進一步瞭解 Agent Platform 中的建立基準功能,請參閱建立基準功能總覽。
資料品質和微調:輸入模型中的提示或資料品質、準確度和偏誤程度,會對模型回覆的品質造成重大影響。如果使用者輸入不準確或錯誤的資料或提示詞,模型可能會產生不盡理想的效能或錯誤的模型輸出。
偏誤放大:生成式 AI 模型可能會不慎放大訓練資料中的現有偏誤,導致輸出內容進一步加深社會偏見,並對特定群體造成不平等待遇。
語言品質:雖然模型在我們評估的基準中展現了令人驚豔的多語言能力,但我們的大多數基準 (包括所有公平性評估) 都是以英文進行。詳情請參閱 Google 研究部落格。
- 生成式 AI 模型為不同使用者提供的服務品質可能不一致。舉例來說,由於訓練資料中某些方言或語言變體所占比例較低,因此文字生成功能可能無法有效處理這些語言。如果語言並非英文,或是英文變體所占比例較低,效能可能會更差。
公平性基準和子群組:Google Research 對生成式 AI 模型進行的公平性分析,並未詳盡說明各種潛在風險。舉例來說,我們著重於性別、種族、族裔和宗教軸向的偏誤,但只對英文資料和模型輸出內容進行分析。詳情請參閱 Google Research 網誌。
專業領域知識有限:生成式 AI 模型可能缺乏深入資訊,無法針對高度專業或技術性主題提供準確詳細的回覆,導致資訊不夠深入或有誤。如要用於專業複雜的用途,模型應根據特定領域的資料進行調整,且在可能對個人權利造成重大影響的情況下,必須有專人監督。
輸入和輸出內容的長度和結構:生成式 AI 模型的輸入和輸出內容詞元數設有限制。如果輸入或輸出內容超過這個限制,系統就不會套用安全分類器,最終可能導致模型效能不佳。雖然 Agent Platform 上代管的模型可處理各種文字格式,但如果輸入資料的結構異常或複雜,模型效能可能會受到影響。
建議做法
為了安全且負責任地運用這項技術,除內建的技術防護措施外,務必考量其他風險,包括與用途、使用者和業務背景相關的風險。
建議採取下列步驟:
- 評估應用程式的資安風險。
- 根據用途執行適當的安全測試。
- 視需要設定安全篩選器。
- 徵求使用者意見回饋及監控內容。
監控濫用情形
Google Cloud 已建立相關程序,可協助偵測潛在的濫用行為,以及違反生成式 AI 服務使用條款的行為。如要進一步瞭解這些程序,以及針對標示為「進階 AI」的模型或功能所設下的嚴格規定,請參閱濫用監控文件。
檢舉濫用情形
如要檢舉疑似濫用本服務的行為,或檢舉含有不當內容或不實資訊的生成輸出內容,請使用以下表單:檢舉疑似濫用行為Google Cloud。
其他資源
- 進一步瞭解 Google 的負責任的 AI 做法建議。
- 請參閱「在發展負責任的 AI 技術方面達成共識」網誌文章,