Mendesain infrastruktur komputasi Anda dengan Gemini

Dokumen ini menjelaskan cara merencanakan dan mendesain infrastruktur komputasi Anda dengan meminta Gemini.

Anda dapat menggunakan Gemini di Google Cloud konsol sebagai antarmuka yang didukung AI untuk mengevaluasi opsi hardware, memperkirakan biaya deployment, dan melihat konfigurasi yang direkomendasikan untuk instance Compute Engine Anda. Untuk menyesuaikan rekomendasinya, Gemini mengevaluasi Google Cloud project Anda dengan memeriksa batas kuota, pemesanan yang ada, diskon abonemen (CUD), region dan zona default, serta batasan lokasi resource. Dengan menggunakan Gemini untuk membantu perencanaan, Anda dapat mencapai konfigurasi yang optimal untuk workload sebelum membuat atau mengubah instance komputasi.

Untuk mempelajari lebih lanjut komponen yang harus Anda konfigurasikan sebelum atau saat Anda membuat instance komputasi, lihat Ringkasan pembuatan instance Compute Engine.

Batasan

Saat meminta Gemini di Google Cloud konsol, Anda tidak dapat membuat, mengubah, atau menghapus resource menggunakan Gemini.

Sebelum memulai

Saat menggunakan Google Cloud konsol untuk mengakses Google Cloud layanan dan API, Anda tidak perlu menyiapkan autentikasi.

Peran yang diperlukan

Untuk mendapatkan izin yang diperlukan untuk mengakses dan meminta Gemini, minta administrator untuk memberi Anda peran IAM Compute Viewer (roles/compute.viewer) pada project. Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.

Peran bawaan ini berisi izin yang diperlukan untuk mengakses dan meminta Gemini. Untuk melihat izin yang benar-benar diperlukan, perluas bagian Izin yang diperlukan:

Izin yang diperlukan

Izin berikut diperlukan untuk mengakses dan meminta Gemini:

  • Untuk melihat daftar instance: compute.instances.list

Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.

Mengakses Gemini di Google Cloud konsol

Untuk mengakses Gemini di Google Cloud konsol, selesaikan langkah-langkah berikut:

  1. Dikonsol, buka halaman Ringkasan. Google Cloud

    Buka Ringkasan

  2. Di bagian Desain infrastruktur Anda dengan Compute Advisor, Anda dapat melihat hal berikut:

    Screenshot halaman Compute Advisor dan elemen UI yang menyusunnya.

    Elemen UI yang ditampilkan dalam screenshot sebelumnya adalah sebagai berikut:

    • Kartu perintah tindakan cepat: sekumpulan kartu yang masing-masing berisi contoh perintah. Jika Anda mengklik kartu, Google Cloud konsol akan otomatis mengisi kotak perintah dengan contoh perintah.

    • Kotak perintah: kolom ini memungkinkan Anda memasukkan dan mengirimkan perintah. Untuk mengirimkan perintah, klik Kirim perintah.

    • Lihat percakapan sebelumnya: fitur ini memungkinkan Anda melihat detail percakapan sebelumnya dan melanjutkannya, atau menghapus percakapan jika tidak lagi diperlukan.

Memasukkan perintah ke Gemini

Setelah Anda mengirimkan perintah, Gemini akan mulai membuat respons. Panel akan muncul dan Google Cloud konsol akan menampilkan respons terhadap perintah Anda di panel, seperti yang ditunjukkan pada screenshot berikut:

Screenshot halaman Compute Advisor setelah Anda mengirimkan perintah.

Berdasarkan perintah Anda, panel respons mencakup elemen berikut:

  • Grounding kontekstual: Gemini otomatis mengevaluasi konteks project Anda untuk memberikan rekomendasi yang sangat disesuaikan, termasuk batas kuota, pemesanan yang ada, CUD, region dan zona default, serta batasan lokasi resource.

  • Cuplikan kode interaktif: Gemini membuat perintah gcloud, metode REST API, atau resource Terraform. Anda dapat menyalin dan menempel cuplikan kode ini atau menjalankannya di Cloud Shell.

  • Kanvas visual: Gemini mengatur rekomendasi ke dalam tabel terstruktur dan perbandingan berdampingan. Tampilan ini membantu Anda mengevaluasi fitur produk dan pendekatan arsitektur. Tampilan ini juga memberikan rencana penerapan untuk kasus penggunaan Anda.

Bagian berikut menguraikan praktik terbaik untuk menulis perintah, dan contoh perintah yang dapat Anda gunakan sebelum membuat atau mengubah instance komputasi.

Praktik terbaik untuk meminta

Untuk mendapatkan rekomendasi yang paling akurat dan dapat ditindaklanjuti dari Gemini, sebaiknya strukturkan perintah Anda dengan cara yang sama seperti yang Anda lakukan pada blok kode. Pendekatan ini memandu AI generatif dengan menggunakan deklarasi parameter yang jelas, definisi peran, petunjuk khusus, dan format output eksplisit.

Saat meminta Gemini, pertimbangkan praktik terbaik berikut:

  • Fokus pada desain dan perencanaan: sebaiknya jangan meminta Gemini untuk memecahkan masalah error instance komputasi. Untuk mengatasi error ini, lihat Memecahkan masalah pembuatan, pembaruan, dan penghapusan instance komputasi.

  • Tentukan persona atau peran: deklarasikan peran atau persona target, seperti administrator IT, peneliti AI, atau engineer platform, untuk diadopsi Gemini. Pendekatan ini memandu gaya bahasa, kedalaman, dan tingkat keahlian rekomendasi yang dihasilkan.

  • Berikan petunjuk eksplisit dan bernomor: bagi tujuan Anda menjadi pertanyaan atau tugas konkret langkah demi langkah. Pendekatan ini menyusun proses penalaran Gemini dan membantu memastikan bahwa Gemini memenuhi semua persyaratan Anda.

  • Tentukan format output tertentu: nyatakan secara eksplisit format rekomendasi yang Anda inginkan, seperti penjelasan panduan, tabel perbandingan Markdown, atau blok kode gcloud yang siap digunakan.

  • Manfaatkan grounding konteks otomatis: Anda tidak perlu menyertakan region atau zona default, kuota yang tersedia, CUD, atau batasan lokasi resource ke dalam perintah Anda. Gemini dapat mengakses informasi ini di project Anda. Google Cloud

  • Perbaiki desain Anda secara berulang: Anda dapat mengubah atau memperluas respons yang dihasilkan Gemini dengan mengirimkan perintah baru. Misalnya, Anda dapat meminta asisten untuk menambahkan rekomendasi jaringan ke rencana deployment atau mengubah persyaratan penyimpanan tanpa memulai percakapan baru.

Contoh perintah

Berikut adalah contoh perintah yang dapat Anda gunakan untuk membantu mendesain dan mengoptimalkan infrastruktur komputasi Anda:

  • Topologi instance komputasi dan strategi penempatan: untuk menentukan model deployment dan kebijakan penempatan yang optimal untuk workload ketersediaan tinggi, gunakan perintah seperti berikut:

    Act as a cloud architect. I need to design a compute instance topology for a
    distributed database that balances multi-zone resilience with
    sub-millisecond latency.
    
    Please provide the following:
    1. A side-by-side comparison of regional MIGs against zonal MIGs.
    2. An explanation of whether compact placement policies work regionally.
    3. The optimal autoscaling configuration for this workload.
    
    Format the comparison as a Markdown table, and provide the deployment steps
    as ready-to-use gcloud code blocks.
    
  • Model penyediaan dan pengoptimalan biaya: untuk mengevaluasi model penyediaan dan mengurangi biaya pemrosesan batch, gunakan perintah seperti berikut:

    Act as a platform engineer. I need to find the cheapest way to run large,
    interruptible analytics jobs on our cloud servers without risking data loss.
    
    Please provide the following:
    1. A cost and reliability comparison of standard discounted servers against
       queue-based servers.
    2. An explanation of how to boot all our compute power at the exact same
       time.
    3. A deployment script that gives our jobs a two-minute warning before a
       server gets reclaimed.
    
    Format the comparison as a Markdown table, and provide the script as a
    ready-to-use code block.
    

Langkah berikutnya