Point de vue des services financiers : optimisation des performances

Last reviewed 2025-07-28 UTC

Ce document de la Google Cloud perspective Services financiers (SF) du framework Well-Architected fournit une présentation des principes et des recommandations permettant d'optimiser les performances de vos charges de travail SF dans Google Cloud. Les recommandations de ce document sont conformes au pilier d'optimisation des performances du Well-Architected Framework.

L'optimisation des performances est une pratique courante dans le secteur des services financiers. Elle a aidé les organisations SF à surmonter les défis techniques et a presque toujours été un catalyseur pour la création de nouveaux modèles économiques. Par exemple, les distributeurs automatiques de billets (introduits en 1967) ont automatisé le processus de distribution d'argent et ont aidé les banques à réduire le coût de leur activité principale. Des techniques telles que le contournement du noyau du système d'exploitation et l'épinglage des threads d'application aux cœurs de calcul ont permis d'obtenir une latence déterministe et faible pour les applications de trading. La réduction de la latence a facilité une liquidité plus élevée et plus ferme avec des spreads plus serrés sur les marchés financiers.

Le cloud crée de nouvelles opportunités d'optimisation des performances. Il remet également en question certains des schémas d'optimisation historiquement acceptés. Plus précisément, les compromis suivants sont plus transparents et contrôlables dans le cloud :

  • Délai de mise sur le marché par rapport au coût
  • Performances de bout en bout au niveau du système par rapport aux performances au niveau du nœud
  • Disponibilité des talents par rapport à l'agilité de la prise de décision liée à la technologie

Par exemple, l'adaptation du matériel et des ressources informatiques à des exigences de compétences spécifiques est une tâche simple dans le cloud. Pour prendre en charge la programmation GPU, vous pouvez créer des VM basées sur des GPU. Vous pouvez faire évoluer la capacité dans le cloud pour répondre aux pics de demande sans surprovisionner les ressources. Cette fonctionnalité permet de s'assurer que vos charges de travail peuvent gérer les pics de charge, par exemple les jours de paie non agricole et lorsque les volumes de trading sont nettement supérieurs aux niveaux historiques. Au lieu de dépenser de l'argent pour écrire du code hautement optimisé au niveau des serveurs individuels (comme du code hautement réglé en langage C) ou pour écrire du code pour des environnements de calcul hautes performances (HPC) conventionnels, vous pouvez effectuer un scaling horizontal de manière optimale en utilisant un système distribué basé sur Kubernetes bien conçu.

Les recommandations d'optimisation des performances de ce document sont associées aux principes fondamentaux suivants :

Aligner les métriques de performances technologiques sur les indicateurs clés de l'entreprise

Vous pouvez associer l'optimisation des performances aux résultats de valeur commerciale de plusieurs manières. Par exemple, dans un bureau de recherche côté acheteur, un objectif d'entreprise peut être d'optimiser le rendement par heure de recherche ou de donner la priorité aux expériences des équipes qui ont fait leurs preuves, par exemple avec des ratios de Sharpe plus élevés. Côté vendeur, vous pouvez utiliser des analyses pour suivre l'intérêt des clients et, par conséquent, donner la priorité au débit des modèles d'IA qui prennent en charge les recherches les plus intéressantes.

Il est également important d'associer les objectifs de performances aux indicateurs clés de performance (KPI) de l'entreprise pour financer les améliorations des performances. Les initiatives d'innovation et de transformation de l'entreprise (parfois appelées efforts de modification de la banque) ont des budgets différents et peuvent avoir des degrés d'accès différents aux ressources par rapport aux opérations habituelles ou aux opérations de gestion de la banque. Par exemple, Google Cloud a aidé les équipes de gestion des risques et de technologie d'un établissement financier d'importance systémique mondiale à collaborer avec les analystes quantitatifs du front office sur une solution permettant d'effectuer des calculs d'analyse des risques (tels que XVA) en quelques minutes au lieu de quelques heures ou jours. Cette solution a aidé l'organisation à respecter les exigences de conformité pertinentes. Elle a également permis aux traders d'avoir des conversations de meilleure qualité avec leurs clients, ce qui leur a permis de proposer des spreads plus serrés, une liquidité plus ferme et une couverture plus rentable.

Lorsque vous alignez vos métriques de performances sur les indicateurs commerciaux, tenez compte des recommandations suivantes :

  • Associez chaque initiative technologique aux objectifs commerciaux et aux résultats clés (OKR), tels que l'augmentation des revenus ou des bénéfices, la réduction des coûts et l'atténuation des risques de manière plus efficace ou holistique.
  • Concentrez-vous sur l'optimisation des performances au niveau du système. Allez au-delà de la séparation conventionnelle entre la modification de la banque et la gestion de la banque, ainsi que des silos entre le front office et le back office.

Prioriser la sécurité sans sacrifier les performances pour des risques non prouvés

La sécurité et la conformité réglementaire dans les organisations SF doivent être sans équivoque d'un niveau élevé. Il est essentiel de maintenir un niveau élevé pour éviter de perdre des clients et d'empêcher des dommages irréparables à la marque d'une organisation. Souvent, la valeur la plus élevée est obtenue grâce à des innovations technologiques telles que l'IA générative et des services gérés uniques comme Spanner. Ne rejetez pas automatiquement ces options technologiques en raison d'une idée fausse générale concernant un risque opérationnel prohibitif ou une posture de conformité réglementaire inadéquate.

Google Cloud a travaillé en étroite collaboration avec les établissements financiers d'importance systémique mondiale pour s'assurer qu'une approche basée sur l'IA pour la lutte contre le blanchiment d'argent (LBA) peut être utilisée dans les juridictions où les établissements servent des clients. Par exemple, HSBC a considérablement amélioré les performances de son unité de lutte contre la criminalité financière (Fincrime) avec les résultats suivants :

  • Près de deux à quatre fois plus d'activités suspectes confirmées
  • Réduction des coûts opérationnels grâce à l'élimination de plus de 60 % des faux positifs et à la concentration du temps d'investigation uniquement sur les alertes exploitables à haut risque
  • Résultats vérifiables et explicables pour soutenir la conformité réglementaire

Tenez compte des recommandations suivantes :

  • Vérifiez que les produits que vous comptez utiliser peuvent vous aider à répondre aux exigences de sécurité, de résilience et de conformité des juridictions dans lesquelles vous opérez. Pour atteindre cet objectif, collaborez avec Google Cloud les équipes de gestion de compte, de gestion des risques et de produit.
  • Créez des modèles plus puissants et assurez la transparence pour les clients en tirant parti de l'explicabilité de l'IA (par exemple, l'attribution de la valeur de Shapley). Des techniques telles que l'attribution de la valeur de Shapley peuvent attribuer des décisions de modèle à des caractéristiques particulières au niveau de l'entrée.
  • Assurez la transparence des charges de travail d'IA générative en utilisant des techniques telles que les citations de sources, l'ancrage, et RAG.

  • Lorsque l'explicabilité ne suffit pas, séparez les étapes de prise de décision dans vos flux de valeur et utilisez l'IA pour automatiser uniquement les étapes qui ne nécessitent pas de prise de décision. Dans certains cas, l'IA explicable peut ne pas être suffisante ou un processus peut nécessiter une intervention humaine en raison de problèmes réglementaires (par exemple, le RGPD, article 22). Dans ce cas, présentez toutes les informations dont l'agent humain a besoin pour prendre une décision dans un seul panneau de contrôle, mais automatisez les tâches de collecte, d'ingestion, de manipulation et de résumé des données.

Repenser votre architecture pour l'adapter aux nouvelles opportunités et exigences

L'augmentation de vos architectures actuelles avec des fonctionnalités basées sur le cloud peut apporter une valeur significative. Pour obtenir des résultats plus transformateurs, vous devez repenser régulièrement votre architecture en adoptant une approche axée sur le cloud.

Tenez compte des recommandations suivantes pour repenser régulièrement l'architecture de vos charges de travail afin d'optimiser davantage les performances.

Utiliser des alternatives basées sur le cloud aux systèmes et planificateurs HPC sur site

Pour profiter d'une plus grande élasticité, d'une meilleure posture de sécurité et de fonctionnalités de surveillance et de gouvernance étendues, vous pouvez exécuter des charges de travail HPC dans le cloud ou transférer des charges de travail sur site vers le cloud. Toutefois, pour certains cas d'utilisation de modélisation numérique , tels que la simulation de stratégies d'investissement ou la modélisation XVA, la combinaison de Kubernetes et de Kueue peut offrir une solution plus puissante.

Passer à la programmation basée sur des graphiques pour les simulations

Les simulations de Monte-Carlo peuvent être beaucoup plus performantes dans un système d'exécution basé sur des graphiques tel que Dataflow. Par exemple, HSBC utilise Dataflow pour exécuter des calculs de risque 16 fois plus rapidement qu'avec son approche précédente.

Exécuter des plates-formes d'échange et de trading basées sur le cloud

Les conversations avec Google Cloud les clients révèlent que le principe de Pareto 80/20 s'applique aux exigences de performances des marchés et des applications de trading.

  • Plus de 80 % des applications de trading n'ont pas besoin d'une latence extrêmement faible. Toutefois, elles bénéficient considérablement des fonctionnalités de résilience, de sécurité et d'élasticité du cloud. Par exemple, BidFX, une plate-forme multi-négociants de change, utilise le cloud pour lancer rapidement de nouveaux produits et augmenter considérablement leur disponibilité et leur empreinte sans augmenter les ressources.
  • Les applications restantes (moins de 20 %) ont besoin d'une faible latence (moins d'une milliseconde), d'un déterminisme et d'une équité dans la diffusion des messages. En règle générale, ces systèmes s'exécutent dans des installations de colocation rigides et coûteuses. De plus en plus, même cette catégorie d'applications est replatformée sur le cloud, soit en périphérie soit en tant qu' applications cloud-first.

Préparer l'avenir de votre technologie pour répondre aux besoins actuels et futurs de votre entreprise

Historiquement, de nombreuses organisations SF ont développé des technologies propriétaires pour obtenir un avantage concurrentiel. Par exemple, au début des années 2000, les banques d'investissement et les sociétés de trading prospères avaient leurs propres implémentations de technologies fondamentales telles que les systèmes pub-sub et les courtiers de messages. Avec l'évolution des technologies Open Source et du cloud, ces technologies sont devenues des produits de base et n'offrent pas de valeur commerciale supplémentaire.

Tenez compte des recommandations suivantes pour préparer l'avenir de votre technologie.

Adopter une approche de données en tant que service (DaaS) pour accélérer le délai de mise sur le marché et assurer la transparence des coûts

Les organisations SF évoluent souvent grâce à une combinaison de croissance organique, de fusions et d'acquisitions. Par conséquent, les organisations doivent intégrer des technologies disparates. Elles doivent également gérer les ressources en double, telles que les fournisseurs de données, les licences de données et les points d'intégration. Google Cloud offre des opportunités de créer une valeur différenciée dans les intégrations post-fusion.

Par exemple, vous pouvez utiliser des services tels que le partage BigQuery pour créer une plate-forme de données en tant que service (DaaS) prête à l'analyse. La plate-forme peut fournir à la fois des données de marché et des entrées provenant de sources alternatives. Cette approche élimine le besoin de créer des pipelines de données redondants et vous permet de vous concentrer sur des initiatives plus intéressantes. De plus, les entreprises fusionnées ou acquises peuvent rapidement et efficacement rationaliser leurs besoins en matière de licences de données et d'infrastructure post-fusion. Au lieu de s'efforcer d'adapter et de fusionner les opérations et les domaines de données existants, l'entreprise combinée peut se concentrer sur de nouvelles opportunités commerciales.

Créer une couche d'abstraction pour isoler les systèmes existants et répondre aux nouveaux modèles économiques

De plus en plus, l'avantage concurrentiel des banques n'est pas le système bancaire principal, mais leur couche d'expérience client. Toutefois, les systèmes bancaires existants utilisent souvent des applications monolithiques développées dans des langages tels que Cobol et intégrées à l'ensemble de la chaîne de valeur bancaire. Cette intégration a rendu difficile la séparation des couches de la chaîne de valeur, de sorte qu'il était presque impossible de mettre à niveau et de moderniser ces systèmes.

Une solution à ce problème consiste à utiliser une couche d'isolation telle qu'un système de gestion des API ou une couche de préparation comme Spanner qui duplique le livre de référence et facilite la modernisation des services avec des analyses avancées et l'IA. Par exemple, Deutsche Bank a utilisé Spanner pour isoler son domaine bancaire principal existant et commencer son parcours d'innovation.