コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
Vertex AI の応用研究とエンジニアリングについて学習する
投機的デコードは LLM 推論を高速化しますが、従来の方法では非効率的な別のドラフト モデルが必要です。Vertex AI は EAGLE-3 を利用し、内部レイヤに小さなドラフト ヘッド(ターゲット モデルの 2 ~ 5%)を追加することで、トレーニングを簡素化し、デコード速度を約 2 ~ 3 倍に向上させています。この投稿では、Vertex AI で SGLang を使用して EAGLE-3 を大規模にクリーニング、エンベディング、トレーニング、サービングするためのパイプラインの概要について説明します。
[[["わかりやすい","easyToUnderstand","thumb-up"],["問題の解決に役立った","solvedMyProblem","thumb-up"],["その他","otherUp","thumb-up"]],[["わかりにくい","hardToUnderstand","thumb-down"],["情報またはサンプルコードが不正確","incorrectInformationOrSampleCode","thumb-down"],["必要な情報 / サンプルがない","missingTheInformationSamplesINeed","thumb-down"],["翻訳に関する問題","translationIssue","thumb-down"],["その他","otherDown","thumb-down"]],[],[],[]]