Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Cloud AI の応用研究とエンジニアリングについて学ぶ

おすすめの記事

Vertex AI でモデルの共同ホスティングを使用して LLM サービングの効率ギャップを解消する

大規模言語モデル（LLM）の進化する状況において、「マシンごとに 1 つのモデル」というデプロイパターンは、企業における LLM サービングの費用対効果の大きなボトルネックになっています。モデルの共同ホスティングは、複数のモデルインスタンスが同じ仮想マシンと GPU リソースを共有できるようにすることで、この効率性のギャップに対処します。この技術ブログでは、モデルの共同ホスティングを本番環境対応のクラウドサービスに導入する Vertex AI Engineering のプロセスについて詳しく説明します。

記事を読む