Google uses AI technology to translate content into your preferred language. AI translations can contain errors.
コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
Cloud AI の応用研究とエンジニアリングについて学ぶ
大規模言語モデル(LLM)の状況が進化するにつれて、「マシンあたり 1 つのモデル」というデプロイ パターンが、企業における LLM サービングの費用対効果の重大なボトルネックになりつつあります。モデルの共同ホスティングでは、複数のモデル インスタンスが同じ仮想マシンと GPU リソースを共有できるようにすることで、この効率性のギャップを解消します。この技術ブログでは、モデルの共存を本番環境対応のクラウド サービスに導入する Vertex AI エンジニアリングのプロセスについて詳しく説明します。
[[["わかりやすい","easyToUnderstand","thumb-up"],["問題の解決に役立った","solvedMyProblem","thumb-up"],["その他","otherUp","thumb-up"]],[["わかりにくい","hardToUnderstand","thumb-down"],["情報またはサンプルコードが不正確","incorrectInformationOrSampleCode","thumb-down"],["必要な情報 / サンプルがない","missingTheInformationSamplesINeed","thumb-down"],["翻訳に関する問題","translationIssue","thumb-down"],["その他","otherDown","thumb-down"]],[],[],[]]