Vertex AI の Anthropic Claude モデルは、API としてフルマネージドのサーバーレス モデルを提供します。Vertex AI で Claude モデルを使用するには、Vertex AI API エンドポイントにリクエストを直接送信します。Anthropic Claude モデルではマネージド API を使用するため、インフラストラクチャのプロビジョニングや管理は不要です。
Claude の回答をストリーミングして、エンドユーザーが認識するレイテンシを軽減できます。回答をストリーミングする際には、サーバー送信イベント(SSE)を使用して回答を段階的にストリーミングします。
Claude モデルは従量課金制です。プロビジョンド スループットを使用する場合は、固定料金制になります。従量課金制の料金については、Vertex AI の料金ページの Anthropic Claude モデルをご覧ください。
使用可能な Claude モデル
Vertex AI で使用できる Anthropic のモデルは次のとおりです。Claude モデルにアクセスするには、Model Garden のモデルカードに移動します。
Anthropic の Claude モデルは、Vertex AI のリクエスト / レスポンス ロギングをサポートしています。プロンプトと補完アクティビティの 30 日間のリクエスト / レスポンス ロギングを有効にして、ユーザーによるモデルの不正使用を追跡します。詳細については、リクエストとレスポンスをログに記録するをご覧ください。
Claude Sonnet 4.5
Claude Sonnet 4.5 は、現実世界のエージェントを強化するための Anthropic の最新の Sonnet クラスモデルです。コーディング、コンピュータ使用、サイバーセキュリティ、スプレッドシートなどのオフィス業務のファイル操作に対して、業界をリードする機能を備えています。
- 長時間実行エージェント: 顧客サポートの自動化から、最高レベルの精度、インテリジェンス、スピードを必要とする複雑な運用ワークフローまで、マルチステップのリアルタイム アプリケーションに対してプロダクション レディなアシスタントを提供します。
- コーディング: 向上したパフォーマンスで日常的な開発作業を行うことができます。複数のセッションにわたって情報を保存、維持、参照できるため、数時間または数日かかる複雑なソフトウェア プロジェクトを計画して実行することもできます。
- サイバーセキュリティ: エージェントをデプロイして、脆弱性が悪用される前に自律的にパッチを適用し、事後対応型の検出から事前対応型の防御にシフトできます。
- 財務分析: 初級レベルの財務分析や高度な予測分析を行うことができます。また、クラス最高の専門知識や経験を生かしたインテリジェントなリスク管理戦略を策定できます。
- コンピュータの使用: コンピュータの使用において最も正確な Anthropic のモデル。デベロッパーは、人間と同じようにコンピュータを使用するようモデルに指示できます。
- ビジネスタスク: 最小限の入力で、スライド、ドキュメント、スプレッドシートなど、オフィス業務のファイルを生成、編集します。
- 調査: 複数のデータソースにわたって集中的な分析を実行し、専門家による分析を最終的な成果物に反映させます。複雑な問題解決、迅速なビジネス インテリジェンス、リアルタイムの意思決定支援に最適です。
Claude Opus 4.1
Claude Opus 4.1 は Anthropic の最新の Opus クラスモデルであり、コーディング機能やエージェント機能、特にエージェント検索において業界をリードしています。最先端のインテリジェンスを必要とするお客様に最適です。
- AI エージェント: AI エージェントが複雑な複数のステップのタスクを正確かつ確実に完了できるようにします。
- エージェント検索と分析: 複数のデータソースに接続して、さまざまなリポジトリの情報を統合し、分析情報を取得します。
- エキスパート レベルのコーディング: 複雑なコーディング タスクをエンドツーエンドで計画して実行し、スタイルと一貫性のある高品質のコードを維持します。
- 仮想コラボレーション: 持続的な推論機能を使用して、長期的なタスクや長いアクション チェーンを含む新しいユースケースを実現できます。
- コンテンツの作成: 人間が書いたような自然な文章でコンテンツを生成します。長文コンテンツ、技術ドキュメント、マーケティング コピー、フロントエンド設計モックアップを作成します。
- 長いコンテキストとメモリ: 以前のやり取りを効果的に要約して参照できるメモリ機能を組み込んでいます。
Claude Haiku 4.5
Claude Haiku 4.5 は、幅広いユースケースで最先端に近いパフォーマンスを実現し、無料のプロダクトや大量のユーザー エクスペリエンスを支える適切な速度とコストを備えた、世界で最も優れたコーディング モデルの一つとして際立っています。
- 無料枠のユーザー エクスペリエンス: Claude Haiku 4.5 は、コストとスピードの点で最先端に近いパフォーマンスを提供し、無料のエージェント プロダクトとエージェント ユースケースを大規模かつ経済的に展開することができます。
- レイテンシの影響を受けやすいエクスペリエンス: Claude Haiku 4.5 の速度は、応答時間が重要なカスタマー サービス エージェントや chatbot などのリアルタイム アプリケーションに最適です。
- サブエージェントのコーディング: Claude Haiku 4.5 を使用してサブエージェントを強化し、複雑なリファクタリング、移行、大規模な機能構築を高品質でスピーディーに処理するマルチエージェント システムを実現できます。
- 財務分析: Claude Haiku 4.5 により、数千ものデータ ストリームをモニタリングし、規制の変更、市場の兆候、ポートフォリオ リスクを追跡して、以前は不可能だった規模でコンプライアンス システムと取引システムを事前に適応させることができます。
- 調査サブエージェント: 複数のデータソースを使用して並列的に分析を行いながら、迅速な応答時間を維持できます。迅速なビジネス インテリジェンス、競合分析、リアルタイムの意思決定支援に最適です。
- ビジネスタスク: Claude Haiku 4.5 では、スライド、ドキュメント、スプレッドシートなどのオフィス業務のファイルを作成し、編集することができます。また、戦略やキャンペーンの計画、ビジネス分析、ブレインストーミングをより適切にサポートします。
Claude Opus 4
Claude Opus 4 は、コーディングとエージェント機能、特にエージェント検索において、最高水準の性能を発揮するモデルです。最先端のインテリジェンスを必要とするお客様に最適です。
- 高度なコーディング: 複雑な開発タスクをエンドツーエンドで独自に計画して実行します。スタイルに合わせて、コードの品質を維持します。
- 長期的なタスクと複雑な問題解決(仮想コラボレーター): メモリ、継続的な推論、長いアクション チェーンを必要とする長期的なタスクを含む新しいユースケースを実現できます。
- AI エージェント: エージェントが、最高レベルの精度を必要とする複雑なステップのタスクに取り組むことができます。
- エージェントによる検索と調査: 複数のデータソースに接続して、リポジトリ全体で包括的な分析情報を合成します。
- コンテンツ作成: 自然な文章で人間が作成したかのような質の高いコンテンツを作成します。長文のクリエイティブ コンテンツ、技術ドキュメント、マーケティング コピー、フロントエンド デザインのモックアップを作成します。
- メモリとコンテキストの管理: 以前のやり取りを効果的に要約して参照できるメモリ機能を組み込んでいます。
Claude Sonnet 4
Claude Sonnet 4 は、コーディングで優れたパフォーマンスを発揮し、大規模なユースケースに適したスピードとコストバランスを提供します。
- コーディング: パフォーマンスが向上したことで、日常的な開発タスクを処理できます。コードレビュー、バグの修正、API の統合、機能開発を即時のフィードバック ループで実行できます。
- AI アシスタント: 顧客サポートの自動化からインテリジェンスとスピードの両方を必要とする運用ワークフローまで、リアルタイム アプリケーション向けのプロダクション レディなアシスタントを提供します。
- 効率的な調査: 複数のデータソースにわたって集中的な分析を実行しながら、迅速な応答時間を維持します。迅速なビジネス インテリジェンス、競合分析、リアルタイムの意思決定支援に最適です。
- 大規模なコンテンツ: 品質が向上したコンテンツを大規模に生成して分析します。顧客向けコミュニケーションの作成、ユーザーからのフィードバックの分析、品質とスループットのバランスが取れたマーケティング資料の作成を行います。
Claude 3.5 Haiku
Claude 3.5 Haiku は、スピードと手頃な価格が重視されるユースケース向けに最適化されています。あらゆるスキルセットにおいて以前のモデルよりも向上しています。Claude 3.5 Haiku は次のようなユースケース向けに最適化されています。
- コード補完 - 迅速なレスポンス時間を実現し、プログラミング パターンを理解する能力を備えた Claude 3.5 Haiku は、リアルタイム開発ワークフローでの迅速かつ正確なコードの提案と補完を得意としています。
- インタラクティブな chat bot - Claude 3.5 Haiku は推論能力に優れ、自然な会話が可能なため、大量のユーザー インタラクションを効率的に処理できるレスポンシブで魅力的な chat bot を作成するのに最適です。
- データの抽出とラベル付け - Claude 3.5 Haiku は、その優れた分析スキルを活用することで、データを効率的に処理し、分類できます。これにより、迅速なデータ抽出と自動ラベル付けタスクを実現できます。
- リアルタイムのコンテンツ管理 - 優れた推論スキルとコンテンツ理解力を備えた Claude 3.5 Haiku は、迅速なレスポンスが求められる大規模なプラットフォームで迅速かつ信頼性の高いコンテンツ管理を実現します。
Claude 3 Haiku
Anthropic の Claude 3 Haiku は、Anthropic で最速のビジョンとテキストのモデルで、基本的なクエリにほぼ瞬時に応答し、人間のやり取りに近いシームレスな AI エクスペリエンスを実現します。
お客様とのライブ対応と翻訳。
不審な行為やお客様のリクエストを検出するためのコンテンツの管理
在庫管理や非構造化データからの知識抽出など、費用削減に役立つタスク。
ビジョンタスク(画像からのテキスト出力のほか、図表、グラフ、技術図、レポートといった視覚的なコンテンツの分析など)。