這份入門指南將介紹生成式 AI 的核心技術,並說明這些技術如何共同運作,為聊天機器人和應用程式提供支援。生成式 AI (也稱為生成式 AI 或生成式 AI) 是機器學習 (ML) 領域,主要開發及使用機器學習模型來生成新內容。
生成式 AI 模型通常稱為大型語言模型 (LLM),因為這類模型規模龐大,且能理解及生成自然語言。不過,視模型訓練所用的資料而定,這類模型可以理解及生成多種形式的內容,包括文字、圖片、影片和音訊。處理多種形式資料的模型稱為多模態模型。
Google 提供 Gemini 系列生成式 AI 模型,專為多模態用途而設計,可處理圖片、影片和文字等多種形式的資訊。
生成內容
生成式 AI 模型必須具備下列功能,才能生成實用內容,用於實際應用:
瞭解如何執行新工作:
生成式 AI 模型的設計用途是執行一般工作。如要讓模型執行特定用途的專屬工作,就必須自訂模型。在 Gemini Enterprise Agent Platform 上,您可以透過模型微調自訂模型。
存取外部資訊:
生成式 AI 模型會接受大量資料訓練。不過,如要讓這些模型發揮作用,就必須讓模型存取訓練資料以外的資訊。舉例來說,如果想建立由生成式 AI 模型驅動的客戶服務聊天機器人,模型就必須存取你提供的產品和服務資訊。在 Gemini Enterprise Agent Platform 中,你可以使用基礎和函式呼叫功能,協助模型存取外部資訊。
封鎖有害內容:
生成式 AI 模型可能會生成預期外的輸出內容,包括令人反感或未顧及感受的文字。為維護安全和防止濫用,模型需要安全篩選機制,才能封鎖可能有害的提示和回覆。Gemini Enterprise Agent Platform 內建安全功能,可促進負責任地使用我們的生成式 AI 服務。
提示詞
|
|
生成式 AI 工作流程通常從提示開始。提示是傳送給生成式 AI 模型的自然語言要求,用來引導模型提供回覆。視模型而定,提示可以包含文字、圖片、影片、音訊、文件和其他模態,甚至可以包含多種模態 (多模態)。 建立提示,讓模型提供所需的回覆,這個過程稱為提示設計。雖然提示設計是反覆試驗的過程,但您可以運用提示設計原則和策略,引導模型做出符合預期的行為。 Vertex AI Studio 提供提示管理工具,協助您管理提示。 |
基礎模型
|
|
系統會將提示傳送給生成式 AI 模型,以便生成回覆。 Gemini Enterprise Agent Platform 提供各種生成式 AI 基礎模型,可透過受管理 API 存取,包括:
這些模型的大小、模態和費用各不相同。您可以在 Model Garden 中探索 Google 模型、開放模型和 Google 合作夥伴模型。 |
自訂模型
|
|
您可以自訂 Google 基礎模型的預設行為,使模型不需要複雜的提示,便能生成一致、符合預期的結果。這項自訂程序稱為「模型微調」。調整模型有助於簡化提示,減少要求的成本和延遲時間。 Gemini Enterprise Agent Platform 也提供模型評估工具,協助您評估微調模型的效能。調整後的模型準備好用於正式環境後,您就可以將模型部署至端點,並監控效能,就像標準 MLOps 工作流程一樣。 |
存取外部資訊
|
|
Gemini Enterprise Agent Platform 提供多種方式,讓模型存取外部 API 和即時資訊。 |
引用內容檢查
|
|
生成回覆後,Gemini Enterprise Agent Platform 會檢查回覆是否需要附上引文。如果回應中的大部分文字出自同一來源,該來源會加入回應的引文中繼資料。 |
負責任的 AI 技術與安全
|
|
提示和回覆在傳回前,會經過最後一層檢查,也就是安全篩選器。Gemini Enterprise Agent Platform 會檢查提示和回覆,判斷提示或回覆屬於安全類別的程度。如果一或多個類別超出門檻,系統會封鎖回應,Gemini Enterprise Agent Platform 則會傳回備用回應。 |
回應
|
|
如果提示和回應通過安全篩選器檢查,系統就會傳回回應。通常會一次傳回所有回應。不過,您也可以啟用串流,透過 Agent Platform 逐步接收代理程式生成的回覆。 |
開始使用
如要開始在 Agent Platform 上使用生成式 AI,請試用下列任一快速入門導覽課程:
- 使用 Agent Platform Gemini API 生成文字: 使用 SDK 將要求傳送至 Gemini API
- 使用 Gemini 生成圖片: 根據文字提示生成圖片