Mengumpulkan log aktivitas Rippling

Didukung di:

Dokumen ini menjelaskan cara menyerap log aktivitas Rippling ke Google Security Operations menggunakan Google Cloud Storage. Rippling adalah platform pengelolaan tenaga kerja yang menyediakan solusi HR, IT, dan Keuangan, termasuk penggajian, tunjangan, orientasi karyawan, pengelolaan perangkat, dan penyediaan aplikasi. Company Activity API menyediakan log audit tindakan administratif dan pengguna di seluruh platform Rippling.

Sebelum memulai

Pastikan Anda memiliki prasyarat berikut:

  • Instance Google SecOps
  • Project GCP dengan Cloud Storage API diaktifkan
  • Izin untuk membuat dan mengelola bucket GCS
  • Izin untuk mengelola kebijakan IAM di bucket GCS
  • Izin untuk membuat layanan Cloud Run, topik Pub/Sub, dan tugas Cloud Scheduler
  • Akses istimewa ke Rippling (token API dengan akses ke Aktivitas Perusahaan)

Membuat bucket Google Cloud Storage

  1. Buka Google Cloud Console.
  2. Pilih project Anda atau buat project baru.
  3. Di menu navigasi, buka Cloud Storage > Buckets.
  4. Klik Create bucket.
  5. Berikan detail konfigurasi berikut:

    Setelan Nilai
    Beri nama bucket Anda Masukkan nama yang unik secara global (misalnya, rippling-activity-logs)
    Location type Pilih berdasarkan kebutuhan Anda (Region, Dual-region, Multi-region)
    Lokasi Pilih lokasi (misalnya, us-central1)
    Kelas penyimpanan Standar (direkomendasikan untuk log yang sering diakses)
    Access control Seragam (direkomendasikan)
    Alat perlindungan Opsional: Aktifkan pembuatan versi objek atau kebijakan retensi
  6. Klik Buat.

Mengumpulkan kredensial Rippling API

  1. Login ke Admin Rippling.
  2. Buka Search > API Tokens.
    • Jalur alternatif: Setelan > Setelan Perusahaan > Token API.
  3. Klik Create API token.
  4. Berikan detail konfigurasi berikut:
    • Nama: Masukkan nama yang unik dan bermakna (misalnya, Google SecOps GCS Export).
    • Versi API: Pilih Base API (v1).
    • Cakupan/Izin: Aktifkan company:activity:read (diperlukan untuk Aktivitas Perusahaan).
  5. Klik Buat.
  6. Salin dan simpan nilai token di lokasi yang aman. Anda akan menggunakannya sebagai token pembawa.

Buat akun layanan untuk Cloud Run Function

Fungsi Cloud Run memerlukan akun layanan dengan izin untuk menulis ke bucket GCS.

Membuat akun layanan

  1. Di GCP Console, buka IAM & Admin > Service Accounts.
  2. Klik Create Service Account.
  3. Berikan detail konfigurasi berikut:
    • Nama akun layanan: Masukkan rippling-logs-collector-sa.
    • Deskripsi akun layanan: Masukkan Service account for Cloud Run function to collect Rippling activity logs.
  4. Klik Create and Continue.
  5. Di bagian Berikan akun layanan ini akses ke project:
    1. Klik Pilih peran.
    2. Telusuri dan pilih Storage Object Admin.
    3. Klik + Add another role.
    4. Telusuri dan pilih Cloud Run Invoker.
    5. Klik + Add another role.
    6. Telusuri dan pilih Cloud Functions Invoker.
  6. Klik Lanjutkan.
  7. Klik Selesai.

Peran ini diperlukan untuk:

  • Storage Object Admin: Menulis log ke bucket GCS dan mengelola file status
  • Cloud Run Invoker: Mengizinkan Pub/Sub memanggil fungsi
  • Cloud Functions Invoker: Mengizinkan pemanggilan fungsi

Memberikan izin IAM pada bucket GCS

Beri akun layanan izin tulis di bucket GCS:

  1. Buka Cloud Storage > Buckets.
  2. Klik nama bucket Anda.
  3. Buka tab Izin.
  4. Klik Grant access.
  5. Berikan detail konfigurasi berikut:
    • Tambahkan prinsipal: Masukkan email akun layanan (misalnya, rippling-logs-collector-sa@your-project.iam.gserviceaccount.com).
    • Tetapkan peran: Pilih Storage Object Admin.
  6. Klik Simpan.

Membuat topik Pub/Sub

Buat topik Pub/Sub yang akan dipublikasikan oleh Cloud Scheduler dan akan dilanggan oleh fungsi Cloud Run.

  1. Di GCP Console, buka Pub/Sub > Topics.
  2. Klik Create topic.
  3. Berikan detail konfigurasi berikut:
    • ID Topik: Masukkan rippling-activity-trigger.
    • Biarkan setelan lainnya tetap default.
  4. Klik Buat.

Membuat fungsi Cloud Run untuk mengumpulkan log

Fungsi Cloud Run dipicu oleh pesan Pub/Sub dari Cloud Scheduler untuk mengambil log dari Rippling Company Activity API dan menuliskannya ke GCS.

  1. Di GCP Console, buka Cloud Run.
  2. Klik Create service.
  3. Pilih Function (gunakan editor inline untuk membuat fungsi).
  4. Di bagian Konfigurasi, berikan detail konfigurasi berikut:

    Setelan Nilai
    Nama layanan rippling-activity-collector
    Wilayah Pilih region yang cocok dengan bucket GCS Anda (misalnya, us-central1)
    Runtime Pilih Python 3.12 atau yang lebih baru
  5. Di bagian Pemicu (opsional):

    1. Klik + Tambahkan pemicu.
    2. Pilih Cloud Pub/Sub.
    3. Di Select a Cloud Pub/Sub topic, pilih topik rippling-activity-trigger.
    4. Klik Simpan.
  6. Di bagian Authentication:

    1. Pilih Wajibkan autentikasi.
    2. Periksa Identity and Access Management (IAM).
  7. Scroll ke bawah dan luaskan Containers, Networking, Security.

  8. Buka tab Security:

    • Akun layanan: Pilih akun layanan rippling-logs-collector-sa.
  9. Buka tab Containers:

    1. Klik Variables & Secrets.
    2. Klik + Tambahkan variabel untuk setiap variabel lingkungan:
    Nama Variabel Nilai Contoh
    GCS_BUCKET rippling-activity-logs
    GCS_PREFIX rippling/activity/
    STATE_KEY rippling/activity/state.json
    RIPPLING_API_TOKEN your-api-token
    RIPPLING_ACTIVITY_URL https://api.rippling.com/platform/api/company_activity
    LIMIT 1000
    MAX_PAGES 10
    LOOKBACK_MINUTES 60
    END_LAG_SECONDS 120
  10. Scroll ke bawah di tab Variables & Secrets ke Requests:

    • Waktu tunggu permintaan: Masukkan 600 detik (10 menit).
  11. Buka tab Setelan di Penampung:

    • Di bagian Materi:
      • Memori: Pilih 512 MiB atau yang lebih tinggi.
      • CPU: Pilih 1.
    • Klik Selesai.
  12. Scroll ke Lingkungan eksekusi:

    • Pilih Default (direkomendasikan).
  13. Di bagian Penskalaan revisi:

    • Jumlah minimum instance: Masukkan 0.
    • Jumlah maksimum instance: Masukkan 100 (atau sesuaikan berdasarkan perkiraan beban).
  14. Klik Buat.

  15. Tunggu hingga layanan dibuat (1-2 menit).

  16. Setelah layanan dibuat, editor kode inline akan terbuka secara otomatis.

Menambahkan kode fungsi

  1. Masukkan main di Function entry point
  2. Di editor kode inline, buat dua file:

    • File pertama: main.py:
    import functions_framework
    from google.cloud import storage
    import json
    import os
    import urllib3
    from datetime import datetime, timezone, timedelta
    import time
    
    # Initialize HTTP client
    http = urllib3.PoolManager(timeout=urllib3.Timeout(connect=5.0, read=60.0), retries=False)
    
    # Initialize Storage client
    storage_client = storage.Client()
    
    @functions_framework.cloud_event
    def main(cloud_event):
        """
        Cloud Run function triggered by Pub/Sub to fetch logs from Rippling Company Activity API and write to GCS.
    
        Args:
            cloud_event: CloudEvent object containing Pub/Sub message
        """
    
        # Get environment variables
        bucket_name = os.environ.get('GCS_BUCKET')
        prefix = os.environ.get('GCS_PREFIX', 'rippling/activity/')
        state_key = os.environ.get('STATE_KEY', 'rippling/activity/state.json')
    
        # Rippling API configuration
        api_token = os.environ.get('RIPPLING_API_TOKEN')
        activity_url = os.environ.get('RIPPLING_ACTIVITY_URL', 'https://api.rippling.com/platform/api/company_activity')
        limit = int(os.environ.get('LIMIT', '1000'))
        max_pages = int(os.environ.get('MAX_PAGES', '10'))
        lookback_minutes = int(os.environ.get('LOOKBACK_MINUTES', '60'))
        end_lag_seconds = int(os.environ.get('END_LAG_SECONDS', '120'))
    
        if not all([bucket_name, api_token]):
            print('Error: Missing required environment variables')
            return
    
        try:
            # Get GCS bucket
            bucket = storage_client.bucket(bucket_name)
    
            # Load state (last processed timestamp and cursor)
            state = load_state(bucket, state_key)
            since_iso = state.get('since')
            next_cursor = state.get('next')
    
            # Calculate time window
            run_end = datetime.now(timezone.utc) - timedelta(seconds=end_lag_seconds)
            end_iso = run_end.replace(microsecond=0).isoformat().replace('+00:00', 'Z')
    
            if since_iso is None:
                since_iso = iso_from_epoch(time.time() - lookback_minutes * 60)
            else:
                try:
                    since_iso = (parse_iso(since_iso) + timedelta(seconds=1)).replace(microsecond=0).isoformat().replace('+00:00', 'Z')
                except Exception:
                    since_iso = iso_from_epoch(time.time() - lookback_minutes * 60)
    
            print(f'Processing logs from {since_iso} to {end_iso}')
    
            run_ts_iso = end_iso
            pages = 0
            total = 0
            newest_ts = None
            pending_next = None
    
            # Fetch logs with pagination
            while pages < max_pages:
                params = {'limit': str(limit)}
    
                if next_cursor:
                    params['next'] = next_cursor
                else:
                    params['startDate'] = since_iso
                    params['endDate'] = end_iso
    
                # Build URL with query parameters
                url = build_url(activity_url, params)
    
                # Fetch data from Rippling API
                headers = {
                    'Authorization': f'Bearer {api_token}',
                    'Accept': 'application/json'
                }
    
                # Implement exponential backoff for rate limiting
                backoff = 1.0
                max_retries = 3
                retry_count = 0
    
                while retry_count < max_retries:
                    response = http.request('GET', url, headers=headers, timeout=60.0)
    
                    if response.status == 429:
                        retry_after = int(response.headers.get('Retry-After', str(int(backoff))))
                        print(f'Rate limited (429). Retrying after {retry_after}s...')
                        time.sleep(retry_after)
                        backoff = min(backoff * 2, 30.0)
                        retry_count += 1
                        continue
    
                    break
    
                if response.status != 200:
                    print(f'Error: API returned status {response.status}')
                    break
    
                data = json.loads(response.data.decode('utf-8'))
    
                # Write page to GCS
                write_to_gcs(bucket, prefix, data, run_ts_iso, pages)
    
                # Extract events
                events = data.get('events') or []
                total += len(events) if isinstance(events, list) else 0
    
                # Track newest timestamp
                if isinstance(events, list):
                    for ev in events:
                        t = ev.get('timestamp') or ev.get('time') or ev.get('event_time')
                        if isinstance(t, str):
                            try:
                                dt_ts = parse_iso(t)
                                if newest_ts is None or dt_ts > newest_ts:
                                    newest_ts = dt_ts
                            except Exception:
                                pass
    
                # Check for next page
                nxt = data.get('next')
                pages += 1
    
                if nxt:
                    next_cursor = nxt
                    pending_next = nxt
                    continue
                else:
                    pending_next = None
                    break
    
            # Update state
            new_since_iso = (newest_ts or run_end).replace(microsecond=0).isoformat().replace('+00:00', 'Z')
            save_state(bucket, state_key, {'since': new_since_iso, 'next': pending_next})
    
            print(f'Successfully processed {total} events across {pages} pages')
            print(f'Updated state: since={new_since_iso}, next={pending_next}')
    
        except Exception as e:
            print(f'Error processing logs: {str(e)}')
            raise
    
    def load_state(bucket, key):
        """Load state from GCS."""
        try:
            blob = bucket.blob(key)
            if blob.exists():
                state_data = blob.download_as_text()
                return json.loads(state_data)
        except Exception as e:
            print(f'Warning: Could not load state: {str(e)}')
        return {}
    
    def save_state(bucket, key, state):
        """Save state to GCS."""
        try:
            blob = bucket.blob(key)
            blob.upload_from_string(
                json.dumps(state, separators=(',', ':')),
                content_type='application/json'
            )
        except Exception as e:
            print(f'Warning: Could not save state: {str(e)}')
    
    def write_to_gcs(bucket, prefix, payload, run_ts_iso, page_index):
        """Write payload to GCS."""
        try:
            day_path = parse_iso(run_ts_iso).strftime('%Y/%m/%d')
            key = f"{prefix.strip('/')}/{day_path}/{run_ts_iso.replace(':', '').replace('-', '')}-page{page_index:05d}-company_activity.json"
    
            blob = bucket.blob(key)
            blob.upload_from_string(
                json.dumps(payload, separators=(',', ':')),
                content_type='application/json'
            )
            print(f'Wrote page {page_index} to {key}')
        except Exception as e:
            print(f'Error writing to GCS: {str(e)}')
            raise
    
    def parse_iso(ts):
        """Parse ISO 8601 timestamp."""
        if ts.endswith('Z'):
            ts = ts[:-1] + '+00:00'
        return datetime.fromisoformat(ts)
    
    def iso_from_epoch(sec):
        """Convert epoch seconds to ISO 8601 timestamp."""
        return datetime.fromtimestamp(sec, tz=timezone.utc).replace(microsecond=0).isoformat().replace('+00:00', 'Z')
    
    def build_url(base, params):
        """Build URL with query parameters."""
        if not params:
            return base
        query_string = '&'.join([f'{k}={v}' for k, v in params.items()])
        return f'{base}?{query_string}'
    
    • File kedua: requirements.txt:
    functions-framework==3.*
    google-cloud-storage==2.*
    urllib3>=2.0.0
    
  3. Klik Deploy untuk menyimpan dan men-deploy fungsi.

  4. Tunggu hingga deployment selesai (2-3 menit).

Buat tugas Cloud Scheduler

Cloud Scheduler memublikasikan pesan ke topik Pub/Sub secara berkala, sehingga memicu fungsi Cloud Run.

  1. Di GCP Console, buka Cloud Scheduler.
  2. Klik Create Job.
  3. Berikan detail konfigurasi berikut:

    Setelan Nilai
    Nama rippling-activity-hourly
    Wilayah Pilih region yang sama dengan fungsi Cloud Run
    Frekuensi 0 * * * * (setiap jam, tepat pada waktunya)
    Zona waktu Pilih zona waktu (UTC direkomendasikan)
    Jenis target Pub/Sub
    Topik Pilih topik rippling-activity-trigger
    Isi pesan {} (objek JSON kosong)
  4. Klik Buat.

Opsi frekuensi jadwal

  • Pilih frekuensi berdasarkan volume log dan persyaratan latensi:

    Frekuensi Ekspresi Cron Kasus Penggunaan
    Setiap 5 menit */5 * * * * Volume tinggi, latensi rendah
    Setiap 15 menit */15 * * * * Volume sedang
    Setiap jam 0 * * * * Standar (direkomendasikan)
    Setiap 6 jam 0 */6 * * * Volume rendah, pemrosesan batch
    Harian 0 0 * * * Pengumpulan data historis

Menguji tugas penjadwal

  1. Di konsol Cloud Scheduler, temukan tugas Anda.
  2. Klik Jalankan paksa untuk memicu secara manual.
  3. Tunggu beberapa detik, lalu buka Cloud Run > Services > rippling-activity-collector > Logs.
  4. Pastikan fungsi berhasil dieksekusi.
  5. Periksa bucket GCS untuk mengonfirmasi bahwa log telah ditulis.

Mengambil akun layanan Google SecOps

Google SecOps menggunakan akun layanan unik untuk membaca data dari bucket GCS Anda. Anda harus memberi akun layanan ini akses ke bucket Anda.

Dapatkan email akun layanan

  1. Buka Setelan SIEM > Feed.
  2. Klik Tambahkan Feed Baru.
  3. Klik Konfigurasi satu feed.
  4. Di kolom Nama feed, masukkan nama untuk feed (misalnya, Rippling Activity Logs).
  5. Pilih Google Cloud Storage V2 sebagai Source type.
  6. Pilih Rippling Activity Logs sebagai Log type.
  7. Klik Get Service Account. Email akun layanan yang unik akan ditampilkan, misalnya:

    chronicle-12345678@chronicle-gcp-prod.iam.gserviceaccount.com
    
  8. Salin alamat email ini untuk digunakan di langkah berikutnya.

Memberikan izin IAM ke akun layanan Google SecOps

Akun layanan Google SecOps memerlukan peran Storage Object Viewer di bucket GCS Anda.

  1. Buka Cloud Storage > Buckets.
  2. Klik nama bucket Anda.
  3. Buka tab Izin.
  4. Klik Grant access.
  5. Berikan detail konfigurasi berikut:
    • Add principals: Tempel email akun layanan Google SecOps.
    • Tetapkan peran: Pilih Storage Object Viewer.
  6. Klik Simpan.

Mengonfigurasi feed di Google SecOps untuk memproses Log Aktivitas Rippling

  1. Buka Setelan SIEM > Feed.
  2. Klik Tambahkan Feed Baru.
  3. Klik Konfigurasi satu feed.
  4. Di kolom Nama feed, masukkan nama untuk feed (misalnya, Rippling Activity Logs).
  5. Pilih Google Cloud Storage V2 sebagai Source type.
  6. Pilih Rippling Activity Logs sebagai Log type.
  7. Klik Berikutnya.
  8. Tentukan nilai untuk parameter input berikut:

    • URL bucket penyimpanan: Masukkan URI bucket GCS dengan jalur awalan:

      gs://rippling-activity-logs/rippling/activity/
      
      • Ganti:

        • rippling-activity-logs: Nama bucket GCS Anda.
        • rippling/activity/: Jalur folder/awalan tempat log disimpan (harus cocok dengan variabel lingkungan GCS_PREFIX).
    • Opsi penghapusan sumber: Pilih opsi penghapusan sesuai preferensi Anda:

      • Jangan pernah: Tidak pernah menghapus file apa pun setelah transfer (direkomendasikan untuk pengujian).
      • Hapus file yang ditransfer: Menghapus file setelah transfer berhasil.
      • Hapus file yang ditransfer dan direktori kosong: Menghapus file dan direktori kosong setelah transfer berhasil.

    • Usia File Maksimum: Menyertakan file yang diubah dalam beberapa hari terakhir. Defaultnya adalah 180 hari.

    • Namespace aset: Namespace aset (misalnya, rippling.activity).

    • Label penyerapan: Label opsional yang akan diterapkan ke peristiwa dari feed ini.

  9. Klik Berikutnya.

  10. Tinjau konfigurasi feed baru Anda di layar Selesaikan, lalu klik Kirim.

Perlu bantuan lebih lanjut? Dapatkan jawaban dari anggota Komunitas dan profesional Google SecOps.