コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
Vertex AI の応用研究とエンジニアリングについて学ぶ
投機的デコーディングは LLM による推論を高速化しますが、従来の方法では非効率的なドラフトモデルが別に必要となります。Vertex AI は、内部レイヤに小さなドラフトヘッド(ターゲット モデルの 2~5%)を追加する EAGLE-3 を利用することで、トレーニングを簡素化し、デコーディング速度を約 2~3 倍向上させます。この投稿では、Vertex AI で SGLang を使用して EAGLE-3 のデータ クリーニング、エンベディング、トレーニング、サービングを大規模に行うためのパイプラインの概要を説明します。
[[["わかりやすい","easyToUnderstand","thumb-up"],["問題の解決に役立った","solvedMyProblem","thumb-up"],["その他","otherUp","thumb-up"]],[["わかりにくい","hardToUnderstand","thumb-down"],["情報またはサンプルコードが不正確","incorrectInformationOrSampleCode","thumb-down"],["必要な情報 / サンプルがない","missingTheInformationSamplesINeed","thumb-down"],["翻訳に関する問題","translationIssue","thumb-down"],["その他","otherDown","thumb-down"]],[],[],[]]