Usa BigQuery Graph y Spanner Graph

En este documento, se comparan BigQuery Graph y Spanner Graph para ayudarte a determinar qué solución de gráficos usar.

Esta comparación sirve como recomendación y no pretende ser absoluta. Existe una superposición significativa de funciones entre BigQuery Graph y Spanner Graph, y los usuarios deben identificar sus propias necesidades de carga de trabajo para determinar qué función usar.

Cuándo usar BigQuery Graph y Spanner Graph

BigQuery Graph y Spanner Graph ejecutan diferentes tipos de cargas de trabajo de gráficos. BigQuery Graph se usa para el análisis profundo a gran escala, mientras que Spanner Graph se usa para las operaciones en tiempo real.

BigQuery Graph

BigQuery Graph está optimizado para ejecutar consultas complejas en gráficos grandes. Puedes analizar patrones globales, identificar tendencias históricas y descubrir relaciones ocultas en conjuntos de datos masivos.

Sus características técnicas incluyen un rendimiento optimizado a gran escala, procesamiento paralelo, consultas complejas en una parte significativa del grafo, procesamiento intensivo y agregaciones complejas.

Los siguientes son algunos de los casos de uso comunes:

  • Detección de fraude sin conexión: Encuentra otros usuarios sospechosos que estén conectados con defraudadores conocidos en toda tu red en un gráfico de clientes, con pocos grados de conexión que compartan el mismo correo electrónico, número de teléfono o dirección. Para ver un instructivo sobre la detección de fraudes, consulta Spanner y BigQuery: Escudo de defensa contra fraudes en tiempo real.
  • Optimización de la cadena de suministro: Crea un gráfico de la lista de materiales que represente las relaciones entre los productos finales y sus componentes para la planificación del inventario. Analiza los productos de nivel superior hasta sus componentes raíz en todas las líneas de productos para calcular las fechas de entrega y comprender la disponibilidad de materiales.
  • Segmentación de 360 grados del cliente: Crea un gráfico de 360 grados del cliente para comprender los recorridos del cliente en relación con las suscripciones a productos, las conversiones y la deserción. Utiliza esta información para identificar por qué los clientes abandonan la empresa, identificar patrones de uso y usar el gráfico para la segmentación de clientes y la segmentación por público en todo el público.

Spanner Graph

Spanner Graph es para operaciones en tiempo real. Está optimizada para aplicaciones que necesitan realizar consultas de k-saltos que afectan a un pequeño conjunto de elementos del grafo de forma instantánea, detectar fraudes en milisegundos, realizar un seguimiento del linaje para la verificación de identidades y dependencias, y ofrecer recomendaciones en vivo.

Sus características técnicas incluyen una latencia predecible con una fluctuación mínima, consultas por segundo (QPS) que se escalan de forma lineal con la cantidad de nodos de Spanner y una escala prácticamente ilimitada. También incluye almacenamiento de gráficos integrado con intercalación de tablas de nodos y aristas, disponibilidad permanente, coherencia global y consultas de búsqueda de puntos y de múltiples saltos a partir de un solo nodo de gráfico o un conjunto de nodos de gráfico.

Los siguientes son algunos de los casos de uso comunes:

  • Detección de fraudes en tiempo real: Verifica el deslizamiento de una tarjeta de crédito en un gráfico de dispositivos y cuentas fraudulentos conocidos en cuestión de milisegundos.
  • Operaciones de red autónomas: Crea un gemelo digital de tu red para supervisar y optimizar el rendimiento en tiempo real.
  • Resolución de entidades: Crea clústeres de identidades vinculadas como fuente de verdad a partir de diferentes IIP (correo electrónico, teléfono, ID de Vemo). Usar los perfiles canónicos para la búsqueda de identidad antes de publicar anuncios, realizar la detección de fraudes en tiempo real y entrenar los almacenes de funciones

Cómo funcionan en conjunto BigQuery Graph y Spanner Graph

BigQuery Graph y Spanner Graph trabajan en conjunto para proporcionar una solución integral. Por ejemplo, en un caso de uso de 360 del cliente:

  1. Estadísticas en tiempo real: Un agente de servicio al cliente usa Spanner Graph para abordar los reclamos de los usuarios sobre el envío del producto incorrecto en función de las estadísticas de compra y entrega en tiempo real.
  2. Replicar o consultar: Puedes replicar datos de Spanner a BigQuery con Spanner Change Streams sin un proceso complejo de extracción, transformación y carga (ETL), o bien consultar datos de Spanner directamente desde BigQuery con consultas federadas de BigQuery.
  3. Analizar patrones: Un científico de datos usa BigQuery Graph para identificar un "punto de riesgo de abandono" en esos mismos datos y etiquetar al cliente como "en riesgo".
  4. Ciclo de retroalimentación: Las etiquetas de "en riesgo" se envían al gráfico de Spanner con compatibilidad de extracción, transformación y carga (ETL) inversas para generar un código de cupón para este cliente y evitar la deserción.

Traslada datos entre BigQuery Graph y Spanner Graph

Puedes mover datos entre Spanner Graph y BigQuery Graph para satisfacer los requisitos de tu carga de trabajo:

  • ETL directa: Para transferir datos de Spanner a BigQuery para realizar consultas analíticas, usa una plantilla de Dataflow.

  • ETL inversa: Si bien puedes consultar los datos de Spanner directamente desde BigQuery Graph, es posible que haya situaciones en las que necesites incorporar datos de BigQuery a Spanner Graph. Usa la instrucción de SQL EXPORT DATA. Para obtener más detalles, consulta Información sobre la canalización de ETL inversa.

Comparación de funciones

En la siguiente tabla, se proporciona un desglose detallado de las funciones según el producto para el que están más optimizadas:

Función BigQuery Graph (sin conexión o por lotes) Spanner Graph (en línea/en tiempo real)
Modelo, consulta y visualización de gráficos Lenguaje de consulta y modelado de grafos unificados, todo potenciado por GoogleSQL, que forma parte del estándar ISO de SQL. La misma interfaz para la visualización de gráficos. Modelado y lenguaje de consultas de grafos unificados, todo potenciado por GoogleSQL, que forma parte del estándar ISO de SQL. La misma interfaz para la visualización de gráficos.
Carga de trabajo principal Sin conexión (por lotes): Agregaciones en conjuntos de datos masivos En línea (en tiempo real): Gran volumen de lecturas y escrituras de baja latencia
Latencia de las consultas De segundos a horas. Está optimizado para analizar terabytes y petabytes. Milisegundos a segundos. Es fundamental para las apps para el usuario.
Patrón de consulta Global o gráfico completo: "¿Quién tiene un "Alcance de la red" de más de 5,000 personas?" Local o vecindario: "¿Quiénes son amigos de mis amigos, pero no están en mi círculo inmediato?"
Escala Escala de petabytes, prácticamente ilimitado y optimizado para datos históricos a gran escala. Escalable horizontalmente, con una escala prácticamente ilimitada y optimizada para datos activos.
Actualidad de los datos Casi en tiempo real o por lotes Puede acceder a datos de diferentes fuentes (por ejemplo, datos de Spanner Graph con Data Boost para Spanner, Bigtable, Cloud Storage o Amazon S3). Coherencia sólida en tiempo real
Entrada de datos Data lakes, registros históricos y datos de transacciones archivados Transmisiones de aplicaciones en vivo, interacciones del usuario
Movimiento de datos Spanner a BigQuery (extracción, transformación y carga [ETL] directas) con plantillas prediseñadas (por lotes y de transmisión). BigQuery a Spanner (ETL inverso) con EXPORT_DATA. Federación de consultas (sin ETL) con esquema externo Spanner a BigQuery (extracción, transformación y carga [ETL] directas) con plantillas prediseñadas (por lotes y de transmisión). BigQuery a Spanner (ETL inverso) con EXPORT_DATA. Federación de consultas (sin ETL) con esquema externo

¿Qué sigue?