Este documento no Google Cloud Well-Architected Framework: perspectiva de serviços financeiros (FS, na sigla em inglês) oferece uma visão geral dos princípios e recomendações para otimizar a performance das cargas de trabalho de FS no Google Cloud. As recomendações neste documento estão alinhadas ao pilar de otimização de performance do Well-Architected Framework.
A otimização de performance tem uma longa história nos serviços financeiros. Ela ajudou as organizações de FS a superar desafios técnicos e quase sempre foi um facilitador ou acelerador para a criação de novos modelos de negócios. Por exemplo, os caixas eletrônicos (introduzidos em 1967) automatizaram o processo de dispensação de dinheiro e ajudaram os bancos a diminuir o custo dos negócios principais. Técnicas como ignorar o kernel do SO e fixar linhas de execução de aplicativos em núcleos de computação ajudaram a alcançar uma latência determinística e baixa para aplicativos de negociação. A redução na latência facilitou uma liquidez maior e mais firme com spreads mais apertados nos mercados financeiros.
A nuvem cria novas oportunidades para a otimização de performance. Ela também desafia alguns dos padrões de otimização historicamente aceitos. Especificamente, as seguintes compensações são mais transparentes e controláveis na nuvem:
- Tempo de lançamento no mercado versus custo.
- Performance de ponta a ponta no nível do sistema versus performance no nível do nó.
- Disponibilidade de talentos versus agilidade da tomada de decisões relacionadas à tecnologia.
Por exemplo, adaptar o hardware e os recursos de TI a requisitos de habilidades específicas é uma tarefa trivial na nuvem. Para oferecer suporte à programação de GPU, é possível criar VMs baseadas em GPU. É possível escalonar a capacidade na nuvem para acomodar picos de demanda sem provisionar recursos em excesso. Esse recurso ajuda a garantir que suas cargas de trabalho possam lidar com cargas de pico, como em dias de folha de pagamento não agrícola e quando os volumes de negociação são significativamente maiores do que os níveis históricos. Em vez de gastar na gravação de código altamente otimizado no nível de servidores individuais (como código altamente ajustado na linguagem C) ou na gravação de código para ambientes convencionais de computação de alto desempenho (HPC), é possível escalonar horizontalmente de maneira ideal usando um sistema distribuído baseado em Kubernetes bem arquitetado.
As recomendações de otimização de performance neste documento são mapeadas para os seguintes princípios básicos:
- Alinhar as métricas de performance de tecnologia com os principais indicadores de negócios
- Priorizar a segurança sem sacrificar a performance para riscos não comprovados
- Repensar a arquitetura para se adaptar a novas oportunidades e requisitos
- Preparar sua tecnologia para o futuro para atender às necessidades de negócios atuais e futuras
Alinhar as métricas de performance de tecnologia com os principais indicadores de negócios
É possível mapear a otimização de performance para resultados de valor comercial de várias maneiras. Por exemplo, em uma mesa de pesquisa de compra, um objetivo de negócio pode ser otimizar a produção por hora de pesquisa ou priorizar experimentos de equipes que têm um histórico comprovado, como índices de Sharpe mais altos. No lado da venda, é possível usar a análise para acompanhar o interesse do cliente e, assim, priorizar a capacidade de processamento para modelos de IA que oferecem suporte à pesquisa mais interessante.
Conectar metas de performance aos indicadores principais de desempenho (KPIs) de negócios também é importante para financiar melhorias de performance. As iniciativas de inovação e transformação de negócios (às vezes chamadas de esforços de mudança de banco) têm orçamentos diferentes e podem ter graus de acesso diferentes aos recursos quando comparadas às operações normais (BAU) ou de execução de banco. Por exemplo, Google Cloud ajudou as equipes de gerenciamento de riscos e tecnologia de um G-SIFI a colaborar com os analistas quantitativos de front-office em uma solução para realizar cálculos de análise de risco (como XVA) em minutos em vez de horas ou dias. Essa solução ajudou a organização a atender aos requisitos de conformidade relevantes. Ela também permitiu que os traders tivessem conversas de maior qualidade com os clientes, oferecendo spreads mais apertados, liquidez mais firme e hedge mais econômico.
Ao alinhar as métricas de performance com indicadores de negócios, considere as seguintes recomendações:
- Conecte cada iniciativa de tecnologia aos objetivos de negócios e resultados principais (OKRs) relevantes, como aumentar a receita ou o lucro, reduzir custos e mitigar riscos de maneira mais eficiente ou holística.
- Concentre-se na otimização da performance no nível do sistema. Vá além da separação convencional de mudança de banco versus execução de banco e dos silos de front-office versus back-office.
Priorizar a segurança sem sacrificar a performance para riscos não comprovados
A segurança e a conformidade regulatória nas organizações de FS precisam ser inequivocamente de alto padrão. Manter um padrão elevado é essencial para evitar a perda de clientes e impedir danos irreparáveis à marca de uma organização. Muitas vezes, o maior valor é derivado de inovações tecnológicas, como IA generativa e serviços gerenciados exclusivos, como o Spanner. Não descarte automaticamente essas opções de tecnologia devido a um equívoco geral sobre o risco operacional proibitivo ou a uma postura inadequada de compliance regulatório.
Google Cloud trabalhou em estreita colaboração com G-SIFIs para garantir que uma abordagem baseada em IA para combate à lavagem de dinheiro (AML, na sigla em inglês) possa ser usada em todas as jurisdições em que as instituições atendem clientes. Por exemplo, HSBC melhorou significativamente a performance da unidade de crimes financeiros (Fincrime) com os seguintes resultados:
- Quase duas a quatro vezes mais atividades suspeitas confirmadas.
- Custos operacionais mais baixos devido à eliminação de mais de 60% dos falsos positivos e tempo de investigação focado apenas em alertas acionáveis de alto risco.
- Saídas auditáveis e explicáveis para oferecer suporte à conformidade regulatória.
Veja estas recomendações:
- Confirme se os produtos que você pretende usar podem ajudar a atender aos requisitos de segurança, resiliência e conformidade das jurisdições em que você opera. Para alcançar esse objetivo, trabalhe com Google Cloud equipes de contas, de risco e de produtos.
- Crie modelos mais avançados e ofereça transparência aos clientes aproveitando a explicabilidade da IA (por exemplo, a atribuição de valor de Shapley). Técnicas como a atribuição de valor de Shapley podem atribuir decisões de modelo a recursos específicos no nível de entrada.
Alcance a transparência para cargas de trabalho de IA generativa usando técnicas como citações de fontes, grounding, e RAG.
Quando a explicabilidade não for suficiente, separe as etapas de tomada de decisão nos fluxos de valor e use a IA para automatizar apenas as etapas que não são de tomada de decisão. Em alguns casos, a IA explicável pode não ser suficiente ou um processo pode exigir intervenção humana devido a preocupações regulatórias (por exemplo, GDPR, artigo 22). Nesses casos, apresente todas as informações de que o agente humano precisa para a tomada de decisão em um único painel de controle, mas automatize as tarefas de coleta, ingestão, manipulação e resumo de dados.
Repensar a arquitetura para se adaptar a novas oportunidades e requisitos
Aumentar as arquiteturas atuais com recursos baseados na nuvem pode gerar um valor significativo. Para alcançar resultados mais transformadores, é necessário repensar periodicamente a arquitetura usando uma abordagem de priorização da nuvem.
Considere as seguintes recomendações para repensar periodicamente a arquitetura das cargas de trabalho para otimizar ainda mais a performance.
Usar alternativas baseadas na nuvem para sistemas e programadores de HPC locais
Para aproveitar a maior elasticidade, a postura de segurança aprimorada e os recursos abrangentes de monitoramento e governança, é possível executar cargas de trabalho de HPC na nuvem ou transferir cargas de trabalho locais para a nuvem. No entanto, para determinados casos de uso de modelagem numérica como simulação de estratégias de investimento ou modelagem XVA, a combinação do Kubernetes com o Kueue pode oferecer uma solução mais avançada.
Mudar para a programação baseada em gráficos para simulações
As simulações de Monte Carlo podem ter muito mais performance em um sistema de execução baseado em gráficos, como o Dataflow. Por exemplo, HSBC usa o Dataflow para executar cálculos de risco 16 vezes mais rápido em comparação com a abordagem anterior.
Executar plataformas de negociação e exchanges baseadas na nuvem
Conversas com Google Cloud clientes revelam que o princípio de Pareto 80/20 se aplica aos requisitos de performance dos mercados e aplicativos de negociação.
- Mais de 80% dos aplicativos de negociação não precisam de latência extremamente baixa. No entanto, eles recebem benefícios significativos dos recursos de resiliência, segurança e elasticidade da nuvem. Por exemplo, BidFX, uma plataforma de vários negociadores de câmbio, usa a nuvem para lançar novos produtos rapidamente e aumentar significativamente a disponibilidade e a presença deles sem aumentar os recursos.
- Os aplicativos restantes (menos de 20%) precisam de baixa latência (menos de um milissegundo), determinismo e imparcialidade na entrega de mensagens. Convencionalmente, esses sistemas são executados em instalações de colocation rígidas e caras. Cada vez mais, até mesmo essa categoria de aplicativos está sendo replataformada na nuvem, na borda ou como aplicativos de nuvem em primeiro lugar.
Preparar sua tecnologia para o futuro para atender às necessidades de negócios atuais e futuras
Historicamente, muitas organizações de FS criaram tecnologias proprietárias para ganhar uma vantagem competitiva. Por exemplo, no início dos anos 2000, bancos de investimento e empresas de negociação bem-sucedidos tinham as próprias implementações de tecnologias fundamentais, como sistemas de publicação/assinatura e corretores de mensagens. Com a evolução das tecnologias de código aberto e da nuvem, essas tecnologias se tornaram commodities e não oferecem valor comercial incremental.
Considere as seguintes recomendações para preparar sua tecnologia para o futuro.
Adotar uma abordagem de dados como serviço (DaaS) para um tempo de lançamento mais rápido e transparência de custos
As organizações de FS geralmente evoluem por meio de uma combinação de crescimento orgânico e fusões e aquisições (M&A). Como resultado, as organizações precisam integrar tecnologias diferentes. Elas também precisam gerenciar recursos duplicados, como fornecedores de dados, licenças de dados e pontos de integração. Google Cloud oferece oportunidades para criar valor diferenciado em integrações pós-fusão.
Por exemplo, é possível usar serviços como o BigQuery Sharing para criar uma plataforma de dados como serviço (DaaS) pronta para análise. A plataforma pode fornecer dados de mercado e entradas de fontes alternativas. Essa abordagem elimina a necessidade de criar pipelines de dados redundantes e permite que você se concentre em iniciativas mais valiosas. Além disso, as empresas mescladas ou adquiridas podem racionalizar de maneira rápida e eficiente as necessidades de licenciamento de dados e infraestrutura pós-fusão. Em vez de gastar esforços na adaptação e mesclagem de operações e patrimônios de dados legados, a empresa combinada pode se concentrar em novas oportunidades de negócios.
Criar uma camada de abstração para isolar sistemas atuais e abordar modelos de negócios emergentes
Cada vez mais, a vantagem competitiva dos bancos não é o sistema bancário principal, mas a camada de experiência do cliente. No entanto, os sistemas bancários legados geralmente usam aplicativos monolíticos desenvolvidos em linguagens como Cobol e são integrados em toda a cadeia de valor bancária. Essa integração dificultou a separação das camadas da cadeia de valor, então foi quase impossível fazer upgrade e modernizar esses sistemas.
Uma solução para resolver esse desafio é usar uma camada de isolamento, como um sistema de gerenciamento de API ou uma camada de preparação, como o Spanner, que duplica o livro de registros e facilita a modernização de serviços com análise avançada e IA. Por exemplo, o Deutsche Bank usou o Spanner para isolar o patrimônio bancário principal legado e iniciar a jornada de inovação.