Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Raccogliere i log di Splunk Attack Analyzer

Supportato in:

Google SecOps SIEM

Questo documento spiega come importare i log di Splunk Attack Analyzer in Google Security Operations utilizzando Google Cloud Storage V2.

Splunk Attack Analyzer (precedentemente TwinWave) è una piattaforma di analisi automatica delle minacce che rileva phishing e malware tramite l'analisi comportamentale. Fornisce i risultati dei job completati e i dati forensi normalizzati tramite un'API REST.

Prima di iniziare

Assicurati di soddisfare i seguenti prerequisiti:

Un'istanza Google SecOps
Un progetto GCP con l'API Storage Cloud abilitata
Autorizzazioni per creare e gestire bucket GCS
Autorizzazioni per gestire le policy IAM nei bucket GCS
Autorizzazioni per creare servizi Cloud Run, argomenti Pub/Sub e job Cloud Scheduler
Accesso privilegiato a Splunk Attack Analyzer con autorizzazioni di generazione delle chiavi API

Crea un bucket Cloud Storage

Vai alla console Google Cloud.
Seleziona il tuo progetto o creane uno nuovo.
Nel menu di navigazione, vai a Cloud Storage > Bucket.
Fai clic su Crea bucket.

Fornisci i seguenti dettagli di configurazione:

Impostazione	Valore
Assegna un nome al bucket	Inserisci un nome univoco globale (ad esempio `splunk-attack-analyzer-logs`).
Tipo di località	Scegli in base alle tue esigenze (regione singola, a due regioni, multiregionale)
Località	Seleziona la posizione (ad esempio, `us-central1`).
Classe di archiviazione	Standard (consigliato per i log a cui si accede di frequente)
Controllo dell'accesso	Uniforme (consigliato)
Strumenti di protezione	(Facoltativo) Attivare il controllo delle versioni degli oggetti o la policy di conservazione

Fai clic su Crea.

Raccogli le credenziali API di Splunk Attack Analyzer

Genera chiave API

Accedi a Splunk Attack Analyzer.
Seleziona il tuo nome utente nell'angolo in alto a destra, poi seleziona Chiavi API.
Fai clic su + Nuova chiave.
Inserisci un nome descrittivo per la chiave (ad esempio, Google Security Operations Integration).
Fai clic su Crea.
Copia e salva il secret API visualizzato nella finestra modale in una posizione sicura.

Nota: non potrai visualizzare di nuovo questo secret dopo aver abbandonato la pagina. Puoi avere fino a 20 chiavi API attive in Splunk Attack Analyzer.

Verifica le autorizzazioni

Per verificare che la chiave API disponga dell'accesso richiesto:

Accedi a Splunk Attack Analyzer.
Seleziona il tuo nome utente nell'angolo in alto a destra, poi seleziona Chiavi API.
Verifica che la chiave API sia elencata e attiva.

Nota: per la documentazione completa dell'API, accedi a Splunk Attack Analyzer, seleziona il tuo nome utente > Knowledge Center > Visualizza documentazione API.

Testare l'accesso API

Verifica le tue credenziali prima di procedere con l'integrazione:

# Replace with your actual API key
API_KEY="your-api-key"

# Test API access - list completed jobs
curl -v -H "Authorization: Bearer ${API_KEY}" \
  "https://app.twinwave.io/api/v1/jobs?done=true&limit=1"

Crea un account di servizio per la funzione Cloud Run

La funzione Cloud Run richiede un account di servizio con autorizzazioni per scrivere nel bucket GCS e per essere richiamato da Pub/Sub.

Crea service account

Nella console Google Cloud, vai a IAM e amministrazione > Service account.
Fai clic su Crea account di servizio.
Fornisci i seguenti dettagli di configurazione:
- Nome del service account: inserisci saa-collector-sa.
- Descrizione service account: inserisci Service account for Cloud Run function to collect Splunk Attack Analyzer logs.
Fai clic su Crea e continua.
Nella sezione Concedi a questo account di servizio l'accesso al progetto, aggiungi i seguenti ruoli:
1. Fai clic su Seleziona un ruolo.
2. Cerca e seleziona Amministratore oggetti di archiviazione.
3. Fai clic su + Aggiungi un altro ruolo.
4. Cerca e seleziona Cloud Run Invoker.
5. Fai clic su + Aggiungi un altro ruolo.
6. Cerca e seleziona Invoker di Cloud Functions.
Fai clic su Continua.
Fai clic su Fine.

Questi ruoli sono necessari per:

Storage Object Admin: scrive i log nel bucket GCS e gestisce i file di stato
Cloud Run Invoker: consente a Pub/Sub di richiamare la funzione
Cloud Functions Invoker: consente la chiamata di funzioni

Concedi autorizzazioni IAM sul bucket GCS

Concedi al account di servizio le autorizzazioni di scrittura sul bucket GCS:

Vai a Cloud Storage > Bucket.
Fai clic sul nome del bucket (ad esempio splunk-attack-analyzer-logs).
Vai alla scheda Autorizzazioni.
Fai clic su Concedi l'accesso.
Fornisci i seguenti dettagli di configurazione:
- Aggiungi entità: inserisci l'email del account di servizio (ad esempio, saa-collector-sa@your-project.iam.gserviceaccount.com).
- Assegna i ruoli: seleziona Storage Object Admin.
Fai clic su Salva.

Crea argomento Pub/Sub

Crea un argomento Pub/Sub a cui Cloud Scheduler pubblicherà e a cui la funzione Cloud Run si iscriverà.

Nella console GCP, vai a Pub/Sub > Argomenti.
Fai clic su Crea argomento.
Fornisci i seguenti dettagli di configurazione:
- ID argomento: inserisci saa-trigger.
- Lascia invariate le altre impostazioni predefinite.
Fai clic su Crea.

Crea una funzione Cloud Run per raccogliere i log

La funzione Cloud Run verrà attivata dai messaggi Pub/Sub di Cloud Scheduler per recuperare i log dall'API Splunk Attack Analyzer e scriverli in GCS.

Nella console GCP, vai a Cloud Run.
Fai clic su Crea servizio.
Seleziona Funzione (usa un editor in linea per creare una funzione).

Nella sezione Configura, fornisci i seguenti dettagli di configurazione:

Impostazione	Valore
Nome servizio	`saa-collector`
Regione	Seleziona la regione corrispondente al tuo bucket GCS (ad esempio, `us-central1`)
Tempo di esecuzione	Seleziona Python 3.12 o versioni successive

Nella sezione Trigger (facoltativo):
1. Fai clic su + Aggiungi trigger.
2. Seleziona Cloud Pub/Sub.
3. In Seleziona un argomento Cloud Pub/Sub, scegli l'argomento saa-trigger.
4. Fai clic su Salva.
Nella sezione Autenticazione:
1. Seleziona Richiedi autenticazione.
2. Controlla Identity and Access Management (IAM).
Nota: Pub/Sub gestirà automaticamente l'autenticazione quando richiama la funzione.
Scorri verso il basso ed espandi Container, networking, sicurezza.
Vai alla scheda Sicurezza:
- Service account: seleziona il account di servizio saa-collector-sa.

Vai alla scheda Container:

Fai clic su Variabili e secret.
Fai clic su + Aggiungi variabile per ogni variabile di ambiente:

Nome variabile	Valore di esempio	Descrizione
`GCS_BUCKET`	`splunk-attack-analyzer-logs`	Nome del bucket GCS
`GCS_PREFIX`	`saa`	Prefisso per i file di log
`STATE_KEY`	`saa/state.json`	Percorso file di stato
`API_KEY`	`your-api-key`	Chiave API Splunk Attack Analyzer
`API_BASE`	`https://app.twinwave.io`	URL di base dell'API
`MAX_RECORDS`	`5000`	Numero massimo di record per esecuzione
`PAGE_SIZE`	`100`	Record per pagina
`LOOKBACK_HOURS`	`24`	Periodo di riferimento iniziale

Scorri verso il basso nella scheda Variabili e secret fino a Richieste:
- Timeout richiesta: inserisci 600 secondi (10 minuti).
Vai alla scheda Impostazioni in Container:
- Nella sezione Risorse:
  - Memoria: seleziona 512 MiB o un valore superiore.
  - CPU: seleziona 1.
Nella sezione Scalabilità della revisione:
- Numero minimo di istanze: inserisci 0.
- Numero massimo di istanze: inserisci 100 (o modifica in base al carico previsto).
Fai clic su Crea.
Attendi la creazione del servizio (1-2 minuti).
Dopo aver creato il servizio, si aprirà automaticamente l'editor di codice incorporato.

Aggiungi codice per la funzione

Inserisci main in Entry point della funzione.

Nell'editor di codice incorporato, crea due file:

Primo file: main.py:

import functions_framework
from google.cloud import storage
import json
import os
import urllib3
from datetime import datetime, timezone, timedelta
import time

# Initialize HTTP client with timeouts
http = urllib3.PoolManager(
  timeout=urllib3.Timeout(connect=5.0, read=30.0),
  retries=False,
)

# Initialize Storage client
storage_client = storage.Client()

# Environment variables
GCS_BUCKET = os.environ.get('GCS_BUCKET')
GCS_PREFIX = os.environ.get('GCS_PREFIX', 'saa')
STATE_KEY = os.environ.get('STATE_KEY', 'saa/state.json')
API_KEY = os.environ.get('API_KEY', '')
API_BASE = os.environ.get('API_BASE', 'https://app.twinwave.io').rstrip('/')
MAX_RECORDS = int(os.environ.get('MAX_RECORDS', '5000'))
PAGE_SIZE = int(os.environ.get('PAGE_SIZE', '100'))
LOOKBACK_HOURS = int(os.environ.get('LOOKBACK_HOURS', '24'))

def parse_datetime(value: str) -> datetime:
  """Parse ISO datetime string to datetime object."""
  if value.endswith("Z"):
    value = value[:-1] + "+00:00"
  return datetime.fromisoformat(value)

@functions_framework.cloud_event
def main(cloud_event):
  """
  Cloud Run function triggered by Pub/Sub to fetch Splunk Attack Analyzer logs and write to GCS.

  Args:
    cloud_event: CloudEvent object containing Pub/Sub message
  """

  if not all([GCS_BUCKET, API_KEY]):
    print('Error: Missing required environment variables')
    return

  try:
    bucket = storage_client.bucket(GCS_BUCKET)

    # Load state
    state = load_state(bucket, STATE_KEY)

    # Determine time window
    now = datetime.now(timezone.utc)
    last_time = None

    if isinstance(state, dict) and state.get("last_event_time"):
      try:
        last_time = parse_datetime(state["last_event_time"])
        last_time = last_time - timedelta(minutes=2)
      except Exception as e:
        print(f"Warning: Could not parse last_event_time: {e}")

    if last_time is None:
      last_time = now - timedelta(hours=LOOKBACK_HOURS)

    print(f"Fetching jobs from {last_time.isoformat()} to {now.isoformat()}")

    # Fetch completed jobs
    jobs, newest_event_time = fetch_jobs(
      start_time=last_time,
      end_time=now,
      page_size=PAGE_SIZE,
      max_records=MAX_RECORDS,
    )

    if not jobs:
      print("No new completed jobs found.")
      save_state(bucket, STATE_KEY, now.isoformat())
      return

    # Fetch forensics for each job
    all_records = []
    for job in jobs:
      job_id = job.get('id', '')
      if not job_id:
        continue

      forensics = fetch_forensics(job_id)
      if forensics:
        # Combine job metadata with forensics
        record = {
          'job': job,
          'forensics': forensics
        }
        all_records.append(record)

    if not all_records:
      print("No forensics data retrieved.")
      save_state(bucket, STATE_KEY, now.isoformat())
      return

    # Write to GCS as NDJSON
    timestamp = now.strftime('%Y%m%d_%H%M%S')
    object_key = f"{GCS_PREFIX}/logs_{timestamp}.ndjson"
    blob = bucket.blob(object_key)

    ndjson = '\n'.join([json.dumps(record, ensure_ascii=False) for record in all_records]) + '\n'
    blob.upload_from_string(ndjson, content_type='application/x-ndjson')

    print(f"Wrote {len(all_records)} records to gs://{GCS_BUCKET}/{object_key}")

    if newest_event_time:
      save_state(bucket, STATE_KEY, newest_event_time)
    else:
      save_state(bucket, STATE_KEY, now.isoformat())

    print(f"Successfully processed {len(all_records)} records")

  except Exception as e:
    print(f'Error processing logs: {str(e)}')
    raise

def load_state(bucket, key):
  """Load state from GCS."""
  try:
    blob = bucket.blob(key)
    if blob.exists():
      state_data = blob.download_as_text()
      return json.loads(state_data)
  except Exception as e:
    print(f"Warning: Could not load state: {e}")

  return {}

def save_state(bucket, key, last_event_time_iso: str):
  """Save the last event timestamp to GCS state file."""
  try:
    state = {'last_event_time': last_event_time_iso}
    blob = bucket.blob(key)
    blob.upload_from_string(
      json.dumps(state, indent=2),
      content_type='application/json'
    )
    print(f"Saved state: last_event_time={last_event_time_iso}")
  except Exception as e:
    print(f"Warning: Could not save state: {e}")

def fetch_jobs(start_time: datetime, end_time: datetime, page_size: int, max_records: int):
  """
  Fetch completed jobs from Splunk Attack Analyzer API with pagination and rate limiting.

  Args:
    start_time: Start time for job query
    end_time: End time for job query
    page_size: Number of records per page
    max_records: Maximum total records to fetch

  Returns:
    Tuple of (jobs list, newest_event_time ISO string)
  """
  endpoint = f"{API_BASE}/api/v1/jobs"

  headers = {
    'Authorization': f'Bearer {API_KEY}',
    'Accept': 'application/json',
    'User-Agent': 'GoogleSecOps-SAACollector/1.0'
  }

  records = []
  newest_time = None
  page_num = 0
  backoff = 1.0
  offset = 0

  while True:
    page_num += 1

    if len(records) >= max_records:
      print(f"Reached max_records limit ({max_records})")
      break

    current_limit = min(page_size, max_records - len(records))
    url = f"{endpoint}?done=true&limit={current_limit}&offset={offset}"

    try:
      response = http.request('GET', url, headers=headers)

      if response.status == 429:
        retry_after = int(response.headers.get('Retry-After', str(int(backoff))))
        print(f"Rate limited (429). Retrying after {retry_after}s...")
        time.sleep(retry_after)
        backoff = min(backoff * 2, 30.0)
        continue

      backoff = 1.0

      if response.status != 200:
        print(f"HTTP Error: {response.status}")
        response_text = response.data.decode('utf-8')
        print(f"Response body: {response_text}")
        return [], None

      data = json.loads(response.data.decode('utf-8'))

      page_results = data.get('jobs', [])

      if not page_results:
        print(f"No more results (empty page)")
        break

      # Filter by time window
      filtered = []
      for job in page_results:
        created = job.get('created_at', '')
        if created:
          try:
            job_time = parse_datetime(created)
            if start_time <= job_time <= end_time:
              filtered.append(job)
              if newest_time is None or job_time > parse_datetime(newest_time):
                newest_time = created
          except Exception as e:
            print(f"Warning: Could not parse job time: {e}")
            filtered.append(job)

      print(f"Page {page_num}: Retrieved {len(page_results)} jobs, {len(filtered)} in time window")
      records.extend(filtered)

      if len(page_results) < page_size:
        print(f"Reached last page (size={len(page_results)} < limit={page_size})")
        break

      offset += len(page_results)

    except Exception as e:
      print(f"Error fetching jobs: {e}")
      return [], None

  print(f"Retrieved {len(records)} total jobs from {page_num} pages")
  return records, newest_time

def fetch_forensics(job_id: str):
  """
  Fetch normalized forensics for a specific job.

  Args:
    job_id: The job ID

  Returns:
    Forensics data dict or None
  """
  endpoint = f"{API_BASE}/api/v1/jobs/{job_id}/normalizedforensics"

  headers = {
    'Authorization': f'Bearer {API_KEY}',
    'Accept': 'application/json',
    'User-Agent': 'GoogleSecOps-SAACollector/1.0'
  }

  backoff = 1.0
  max_retries = 3

  for attempt in range(max_retries):
    try:
      response = http.request('GET', endpoint, headers=headers)

      if response.status == 429:
        retry_after = int(response.headers.get('Retry-After', str(int(backoff))))
        print(f"Rate limited (429) on forensics for job {job_id}. Retrying after {retry_after}s...")
        time.sleep(retry_after)
        backoff = min(backoff * 2, 30.0)
        continue

      if response.status != 200:
        print(f"Warning: Could not fetch forensics for job {job_id}: HTTP {response.status}")
        return None

      return json.loads(response.data.decode('utf-8'))

    except Exception as e:
      print(f"Warning: Error fetching forensics for job {job_id}: {e}")
      if attempt < max_retries - 1:
        time.sleep(backoff)
        backoff = min(backoff * 2, 30.0)
        continue
      return None

  return None

Secondo file: requirements.txt:

functions-framework==3.*
google-cloud-storage==2.*
urllib3>=2.0.0

Fai clic su Esegui il deployment per salvare la funzione ed eseguirne il deployment.
Attendi il completamento del deployment (2-3 minuti).

Nota :la configurazione del trigger Pub/Sub crea automaticamente le sottoscrizioni e le autorizzazioni necessarie.

Crea job Cloud Scheduler

Cloud Scheduler pubblicherà messaggi nell'argomento Pub/Sub a intervalli regolari, attivando la funzione Cloud Run.

Nella console di GCP, vai a Cloud Scheduler.
Fai clic su Crea job.

Fornisci i seguenti dettagli di configurazione:

Impostazione	Valore
Nome	`saa-collector-hourly`
Regione	Seleziona la stessa regione della funzione Cloud Run
Frequenza	`0 * * * *` (ogni ora, all'ora)
Fuso orario	Seleziona il fuso orario (UTC consigliato)
Tipo di target	Pub/Sub
Argomento	Seleziona l'argomento `saa-trigger`
Corpo del messaggio	`{}` (oggetto JSON vuoto)

Fai clic su Crea.

Opzioni di frequenza di pianificazione

Scegli la frequenza in base al volume dei log e ai requisiti di latenza:

Frequenza	Espressione cron	Caso d'uso
Ogni 5 minuti	`/5 * * *`	Volume elevato, bassa latenza
Ogni 15 minuti	`/15 * * *`	Volume medio
Ogni ora	`0 * * * *`	Standard (consigliato)
Ogni 6 ore	`0 /6 * *`	Volume basso, elaborazione batch
Ogni giorno	`0 0 * * *`	Raccolta dei dati storici

Testare l'integrazione

Nella console Cloud Scheduler, trova il tuo job (saa-collector-hourly).
Fai clic su Forza esecuzione per attivare manualmente.
Attendi qualche secondo e vai a Cloud Run > Servizi > saa-collector > Log.

Verifica che la funzione sia stata eseguita correttamente. Cerca:

Fetching jobs from YYYY-MM-DDTHH:MM:SS+00:00 to YYYY-MM-DDTHH:MM:SS+00:00
Page 1: Retrieved X jobs, Y in time window
Wrote Z records to gs://splunk-attack-analyzer-logs/saa/logs_YYYYMMDD_HHMMSS.ndjson
Successfully processed Z records

Controlla il bucket GCS (splunk-attack-analyzer-logs) per verificare che i log siano stati scritti.

Se visualizzi errori nei log:

HTTP 401: controlla la chiave API nelle variabili di ambiente
HTTP 403: verifica che la chiave API disponga delle autorizzazioni richieste
HTTP 429: limitazione di frequenza: la funzione riproverà automaticamente con backoff
Variabili di ambiente mancanti: controlla che tutte le variabili richieste siano impostate

Configura un feed in Google SecOps per importare i log di Splunk Attack Analyzer

Vai a Impostazioni SIEM > Feed.
Fai clic su Aggiungi nuovo feed.
Fai clic su Configura un singolo feed.
Nel campo Nome feed, inserisci un nome per il feed (ad esempio, Splunk Attack Analyzer Logs).
Seleziona Google Cloud Storage V2 come Tipo di origine.
Seleziona Splunk Attack Analyzer come Tipo di log.
Fai clic su Ottieni service account. Verrà visualizzata un'email dell'account di servizio univoca, ad esempio:
```
chronicle-12345678@chronicle-gcp-prod.iam.gserviceaccount.com
```
Copia l'indirizzo email. Lo utilizzerai nel prossimo passaggio.

Nota :ogni istanza di Google SecOps ha un account di servizio univoco. Non utilizzare service account di altre documentazioni o esempi.
Fai clic su Avanti.
Specifica i valori per i seguenti parametri di input:
- URL bucket di archiviazione: inserisci l'URI del bucket GCS con il percorso del prefisso:
```
gs://splunk-attack-analyzer-logs/saa/
```
  - Sostituisci:
    - splunk-attack-analyzer-logs: il nome del bucket GCS.
    - saa: (Facoltativo) prefisso/percorso della cartella in cui vengono archiviati i log (lascia vuoto per la radice).
Nota: includi sempre la barra finale (/) alla fine dell'URI.
- Opzione di eliminazione della fonte: seleziona l'opzione di eliminazione in base alle tue preferenze:
  - Mai: non elimina mai i file dopo i trasferimenti (opzione consigliata per i test).
  - Elimina file trasferiti: elimina i file dopo il trasferimento riuscito.
  - Elimina file trasferiti e directory vuote: elimina i file e le directory vuote dopo il trasferimento riuscito.
    
    Nota :se selezioni un'opzione di eliminazione, il account di servizio deve disporre del ruolo Storage Object Admin anziché Storage Object Viewer. Aggiorna le autorizzazioni IAM di conseguenza.
- Età massima file: includi i file modificati nell'ultimo numero di giorni (il valore predefinito è 180 giorni).
- Spazio dei nomi dell'asset: lo spazio dei nomi dell'asset.
- Etichette di importazione: l'etichetta da applicare agli eventi di questo feed.
Fai clic su Avanti.
Controlla la nuova configurazione del feed nella schermata Finalizza e poi fai clic su Invia.

Concedi le autorizzazioni IAM al account di servizio Google SecOps

Il account di servizio Google SecOps deve avere il ruolo Visualizzatore oggetti Storage nel bucket GCS.

Vai a Cloud Storage > Bucket.
Fai clic sul nome del bucket (splunk-attack-analyzer-logs).
Vai alla scheda Autorizzazioni.
Fai clic su Concedi l'accesso.
Fornisci i seguenti dettagli di configurazione:
- Aggiungi entità: incolla l'email del account di servizio Google SecOps.
- Assegna ruoli: seleziona Visualizzatore oggetti Storage.
Fai clic su Salva.

Nota: se prevedi di utilizzare l'opzione di eliminazione "Elimina file trasferiti" o "Elimina file trasferiti e directory vuote", assegna il ruolo Storage Object Admin anziché Storage Object Viewer.

Tabella di mappatura UDM

Campo log	Mappatura UDM	Logic
quando	metadata.event_timestamp	Quando si è verificato l'evento
deviceName	principal.hostname	Nome host dell'entità
messageid	metadata.id	Identificatore univoco dell'evento
azione	security_result.action	Azione intrapresa dal prodotto di sicurezza
protocollo	network.ip_protocol	Protocollo IP
srcAddr	principal.ip	Indirizzo IP del principale
srcPort	principal.port	Numero di porta del principale
dstAddr	target.ip	Indirizzo IP della destinazione
dstPort	target.port	Numero di porta della destinazione
	metadata.event_type	Tipo di evento
	metadata.product_name	Nome del prodotto
	metadata.vendor_name	Nome fornitore/azienda

Hai bisogno di ulteriore assistenza? Ricevi risposte dai membri della community e dai professionisti di Google SecOps.