Améliorer les performances de Data Studio

La vitesse à laquelle un rapport Data Studio se charge et répond aux modifications des utilisateurs (l'application de filtres ou la modification de la plage de dates, par exemple) dépend, entre autres, des facteurs suivants :

  • Les performances de l'ensemble de données sous-jacent
  • La quantité de données interrogées dans les visualisations du rapport
  • La complexité de ces requêtes
  • La latence du réseau

Certains de ces facteurs échappent à votre contrôle (ou à celui de Data Studio). Par exemple, vous ne pourrez sans doute pas faire grand-chose pour améliorer la réactivité de la plate-forme des données sous-jacentes ni accélérer votre connexion réseau. En revanche, vous pouvez agir au niveau de la précision des performances de vos rapports dans Data Studio.

Ajuster la fraîcheur des données

La plupart des types de sources de données disposent d'une option de fraîcheur des données (à l'exception des sources de données extraites). Cette option vous permet d'équilibrer votre besoin en informations à jour par rapport aux performances des rapports, ainsi qu'aux quotas ou aux coûts potentiels liés aux requêtes. Chaque type de source de données a son propre seuil de fraîcheur des données par défaut, mais vous pouvez l'ajuster si nécessaire. Par exemple, si vous mesurez les performances des annonces sur votre site ou dans votre application, vous constaterez peut-être qu'une mise à jour quotidienne des données suffit. En revanche, si vos rapports sont basés sur des données analytiques sur les réseaux sociaux, il peut être nécessaire de mettre à jour leurs données plusieurs fois par jour.

En savoir plus sur la gestion de la fraîcheur des données.

Utiliser une source de données extraite

Une source de données extraite est un instantané statique de 100 Mo maximum de données. Une fois créé, cet instantané (et non l'ensemble de données sous-jacent) est utilisé pour les requêtes de données de votre rapport. Utiliser une source de données extraite peut améliorer les temps de chargement de vos rapports et de vos explorations, et leur réactivité, par rapport à l'utilisation d'une connexion en direct à vos données.

Les sources de données extraites ne disposent pas d'option de fraîcheur des données. Vous pouvez plutôt planifier la mise à jour des données de la source de données extraite.

En savoir plus sur l'extraction de données.

Comprendre la simultanéité et la mise à l'échelle

Data Studio est conçu avec une architecture sans serveur, ce qui signifie qu'il n'impose pas de limites strictes au nombre d'utilisateurs simultanés qui consultent des rapports. Les performances et la mise à l'échelle sont principalement déterminées par la capacité et la réactivité des sources de données sous-jacentes auxquelles vos rapports sont connectés.

Spécificités des sources de données

  • BigQuery: lorsque vous utilisez BigQuery, la simultanéité et les performances des rapports dépendent de facteurs tels que la disponibilité des emplacement BigQuery, la complexité des requêtes, la taille des données et la mise en cache. Surveillez l'utilisation des emplacement BigQuery et les performances des requêtes.

    Pour optimiser, tenez compte des bonnes pratiques BigQuery, telles que le partitionnement, le clustering et l'utilisation de BI Engine.

  • Autres sources de données: Pour les autres connecteurs (par exemple, Google Sheets ou les bases de données tierces), les limites de simultanéité sont soumises aux limites de débit de l'API du système source, aux pools de connexions de base de données et à la capacité globale de traitement des requêtes.

Des recommandations concrètes

  • Optimiser les requêtes de sources de données : assurez-vous que vos requêtes sont aussi efficaces que possible.
  • Exploiter la mise en cache : utilisez les paramètres de fraîcheur des données de Data Studio pour mettre en cache les données et réduire les requêtes directes à la source.
  • Déploiement progressif : pour les très grands groupes d'utilisateurs (par exemple, des milliers d'utilisateurs), envisagez un déploiement progressif tout en surveillant l'impact sur la source de données sous-jacente.
  • Surveiller les systèmes sous-jacents : vérifiez les performances et l'utilisation des quotas de vos sources de données (par exemple, les emplacements BigQuery ou les quotas d'API).

Améliorations pour les sources de données BigQuery

Les sections suivantes présentent des conseils pour améliorer les performances des rapports qui utilisent des données BigQuery.

Accélérer les sources de données BigQuery grâce à BI Engine

BigQuery BI Engine est un service d'analyse en mémoire rapide. En utilisant BI Engine, vous pouvez analyser les données stockées dans BigQuery avec un temps de réponse aux requêtes inférieur à une seconde et une simultanéité élevée.

BI Engine s'intègre à Data Studio afin d'accélérer l'exploration et l'analyse des données. Avec BI Engine, vous pouvez créer des tableaux de bord et des rapports interactifs riches dans Data Studio sans compromettre les performances, l'échelle, la sécurité ou la fraîcheur des données.

Premiers pas avec Data Studio et BI Engine.

Utiliser des tables matérialisées pour les requêtes complexes sur de grands ensembles de données

La connexion de Data Studio à une vue BigQuery peut être lente si cette vue effectue des calculs ou des transformations complexes au moment de l'exécution, en particulier avec de grands ensembles de données. Bien que les vues puissent être utiles pour restructurer les données, elles peuvent entraîner des délais d'attente dans Data Studio si elles effectuent des calculs en temps réel, comme la génération dynamique d'URL signées pour des millions d'enregistrements.

Au lieu d'utiliser une vue qui effectue un traitement intensif, matérialisez le résultat de la requête de la vue dans une table à l'aide de l'une des options suivantes :

Connectez ensuite Data Studio à la vue ou à la table matérialisée au lieu de la vue standard. Cela évite de réexécuter les calculs complexes pour chaque requête de Data Studio. Pour des performances encore plus rapides sur les données matérialisées, utilisez BI Engine.

Activer l'API BigQuery Storage Read

Pour les requêtes qui utilisent des résultats paginés, l'activation de l'API BigQuery Storage Read peut améliorer les temps de requête. Data Studio utilise automatiquement l'API Storage Read lorsque cela améliore les durées d'exécution des requêtes.

Pour activer l'API BigQuery Storage Read, accordez les autorisations suivantes à votre utilisateur BigQuery connecté à Data Studio :

  • bigquery.readsessions.create
  • bigquery.readsessions.getData