GKE 和 GKE On-Prem 的多區域部署

本主題說明在 GKE 和 Anthos GKE On-Prem 上部署的 Apigee Hybrid 多區域部署。

多區域部署的拓撲包括:

  • Active-Active:當您在多個地理位置部署應用程式,且需要低延遲的 API 回應來部署應用程式時,您可以選擇在最靠近客戶的多個地理位置部署混合式雲端,例如:美國西岸、美國東岸、歐洲、亞太地區。
  • 主動-被動:當您有主要區域和容錯移轉或災難復原區域時。

如下圖所示,多區域混合式部署中的區域會透過 Cassandra 通訊:

負載平衡 MART 連線

每個區域叢集都必須有自己的 MART IP 和主機名稱,但您只需要將管理平面連線至其中一個叢集。Cassandra 會將資訊傳播至所有叢集。如要確保 MART 的高可用性,最佳做法是平衡個別 MART IP 位址的負載,並設定貴機構與負載平衡的 MART URL 通訊。

必要條件

為多個區域設定混合式連線前,請先完成下列先決條件:

  • 在多個區域設定 Kubernetes 叢集,並使用不同的 CIDR 區塊
  • 設定跨區域通訊
  • Cassandra 多區域規定:
    • 確認 Pod 網路命名空間在各個區域之間具有連線能力,包括防火牆、VPN、虛擬私有雲對等互連和虛擬網路對等互連。大多數 GKE 安裝作業都是如此。
    • 如果 Pod 網路命名空間無法在不同叢集中的 Pod 之間建立連線 (例如叢集以「孤島網路模式」執行,如 GKE On-Prem 安裝作業),請在 Apigee Hybrid 多區域安裝作業的所有區域中,於覆寫檔案中設定 cassandra.hostNetwork: true,啟用 Kubernetes hostNetwork 功能。

      如要瞭解 Kubernetes hostNetwork 功能,請參閱 Kubernetes 說明文件中的「主機命名空間」。

    • 在將多區域設定擴展至新區域之前,請先在現有叢集上啟用「hostNetwork」。
    • 啟用 hostNetwork 時,請確保工作節點可以執行反向 DNS 查詢。Apigee Cassandra 會使用正向和反向 DNS 查詢,在啟動時取得主機 IP。
    • 在所有區域的 Kubernetes 叢集之間開啟 Cassandra 連接埠 7000 和 7001,讓不同區域和資料中心的工作站節點能夠通訊。請參閱「設定通訊埠」。

詳情請參閱 Kubernetes 說明文件。

設定多區域種子主機

本節說明如何將現有 Cassandra 叢集擴展至新區域。完成這項設定後,新區域就能啟動叢集並加入現有資料中心。如果沒有這項設定,多區域 Kubernetes 叢集就無法互相瞭解。

  1. 執行下列 kubectl 指令,找出目前區域中 Cassandra 的種子主機位址。

    種子主機位址可讓新的區域執行個體在首次啟動時找到原始叢集,瞭解叢集的拓撲。種子主機位址會指定為叢集中的聯絡點。

    kubectl get pods -o wide -n apigee
    
    NAME                      READY   STATUS      RESTARTS   AGE   IP          NODE                                          NOMINATED NODE
    apigee-cassandra-default-0        1/1     Running     0          5d    10.0.0.11   gke-k8s-dc-2-default-pool-a2206492-p55d
    apigee-cassandra-default-1        1/1     Running     0          5d    10.0.2.4    gke-k8s-dc-2-default-pool-e9daaab3-tjmz
    apigee-cassandra-default-2        1/1     Running     0          5d    10.0.3.5    gke-k8s-dc-2-default-pool-e589awq3-kjch
  2. 決定要將先前指令傳回的哪個 IP 做為多區域種子主機。
  3. 這個步驟的設定取決於您使用的是 GKE 還是 GKE On-Prem:

    僅限 GKE: 在資料中心 2 中,於「Manage runtime plane components」(管理執行階段平面元件) 中設定 cassandra.multiRegionSeedHostcassandra.datacenter,其中 multiRegionSeedHost 是上一個指令傳回的 IP 之一:

    cassandra:
      multiRegionSeedHost: seed_host_IP
      datacenter: data_center_name
      rack: rack_name
      hostNetwork: false # Set this to true for Non GKE platforms.

    例如:

    cassandra:
      multiRegionSeedHost: 10.0.0.11
      datacenter: "dc-2"
      rack: "ra-1"
      hostNetwork: false

    僅限 GKE On-Prem: 在資料中心 2 中,於覆寫檔案中設定 cassandra.multiRegionSeedHost,其中 multiRegionSeedHost 是上一個指令傳回的 IP 之一:

    cassandra:
      hostNetwork: true
      multiRegionSeedHost: seed_host_IP
      datacenter: data_center_name
    

    例如:

    cassandra:
      hostNetwork: true
      multiRegionSeedHost: 10.0.0.11
      datacenter: "dc-2"
    
  4. 在新的資料中心/區域中,安裝混合式服務前,請在 overrides.yaml 中設定與第一個區域相同的 TLS 憑證和憑證。

設定新區域

設定種子主機後,即可設定新區域。

如要設定新區域,請按照下列步驟操作:

  1. 將現有叢集的憑證複製到新叢集。Cassandra 和其他混合式元件會使用新的 CA 根憑證進行 mTLS。因此,叢集中的憑證必須一致。
    1. 將環境定義設為原始命名空間:
      kubectl config use-context original-cluster-name
    2. 將目前的命名空間設定匯出至檔案:
      kubectl get namespace namespace -o yaml > apigee-namespace.yaml
    3. apigee-ca 密鑰匯出至檔案:
      kubectl -n cert-manager get secret apigee-ca -o yaml > apigee-ca.yaml
    4. 將環境設為新區域的叢集名稱:
      kubectl config use-context new-cluster-name
    5. 將命名空間設定匯入新叢集。如果您在新區域中使用其他命名空間,請務必更新檔案中的「namespace」:
      kubectl apply -f apigee-namespace.yaml
    6. 將密鑰匯入新叢集:

      kubectl -n cert-manager apply -f apigee-ca.yaml
  2. 在新區域中安裝混合式服務。請確認 overrides-DC_name.yaml 檔案包含在第一個區域中設定的相同 TLS 憑證,如上一節所述。

    執行下列兩項指令,在新區域中安裝混合式服務:

    apigeectl init -f overrides/overrides-DC_name.yaml
    apigeectl apply -f overrides/overrides-DC_name.yaml
  3. 執行下列指令,確認混合式安裝作業是否成功:
    apigeectl check-ready -f overrides_your_cluster_name.yaml
  4. 執行下列指令,驗證 Cassandra 叢集設定。輸出內容應顯示現有和新的資料中心。
    kubectl exec apigee-cassandra-default-0 -n apigee  \
      -- nodetool -u JMX_user -pw JMX_password status

    成功設定的範例:

    Datacenter: dc-1
    ====================
    Status=Up/Down
    |/ State=Normal/Leaving/Joining/Moving
    --  Address        Load       Tokens  Owns  Host ID                               Rack
    UN  10.132.87.93   68.07 GiB  256     ?     fb51465c-167a-42f7-98c9-b6eba1de34de  c
    UN  10.132.84.94   69.9 GiB   256     ?     f621a5ac-e7ee-48a9-9a14-73d69477c642  b
    UN  10.132.84.105  76.95 GiB  256     ?     0561086f-e95b-4232-ba6c-ad519ff30336  d
    
    Datacenter: dc-2
    ====================
    Status=Up/Down
    |/ State=Normal/Leaving/Joining/Moving
    --  Address        Load       Tokens  Owns  Host ID                               Rack
    UN  10.132.0.8     71.61 GiB  256     ?     8894a98b-8406-45de-99e2-f404ab10b5d6  c
    UN  10.132.9.204   75.1 GiB   256     ?     afa0ffa3-630b-4f1e-b46f-fc3df988092e  a
    UN  10.132.3.133   68.08 GiB  256     ?     25ae39ab-b39e-4d4f-9cb7-de095ab873db  b
  5. 在新資料中心的所有 Pod 中設定 Cassandra。
    1. 使用下列指令從叢集取得 apigeeorg
      kubectl get apigeeorg -n apigee -o json | jq .items[].metadata.name
      

      例如:

      Ex: kubectl get apigeeorg -n apigee -o json | jq .items[].metadata.name
      "rg-hybrid-b7d3b9c"
      
    2. 建立 Cassandra 資料複製自訂資源 (YAML) 檔案。檔案名稱不限。在下列範例中,檔案名稱為 datareplication.yaml

      檔案必須包含下列內容:

      apiVersion: apigee.cloud.google.com/v1alpha1
      kind: CassandraDataReplication
      metadata:
        name: REGION_EXPANSION
        namespace: NAMESPACE
      spec:
        organizationRef: APIGEEORG_VALUE
        force: false
        source:
          region: SOURCE_REGION

      其中:

      • REGION_EXPANSION 是您要為這項中繼資料指定的名稱。你可以使用任何名稱。
      • NAMESPACEoverrides.yaml 中提供的命名空間相同。這通常是「apigee」。
      • APIGEEORG_VALUE 是上一個步驟中 kubectl get apigeeorg -n apigee -o json | jq .items[].metadata.name 指令輸出的值。例如:rg-hybrid-b7d3b9c
      • SOURCE_REGION 是來源區域中的資料中心名稱。這是您在 overrides.yaml 中為 cassandra:datacenter: 設定的值。

      例如:

      apiVersion: apigee.cloud.google.com/v1alpha1
      kind: CassandraDataReplication
      metadata:
        name: region-expansion
        namespace: apigee
      spec:
        organizationRef: rg-hybrid-b7d3b9c
        force: false
        source:
          region: "dc-1"
    3. 使用下列指令套用 CassandraDataReplication
      kubectl apply -f datareplication.yaml
    4. 使用下列指令驗證重建狀態。
      kubectl -n apigee get apigeeds -o json | jq .items[].status.cassandraDataReplication

      結果應如下所示:

      {
        "rebuildDetails": {
          "apigee-cassandra-default-0": {
            "state": "complete",
            "updated": 1623105760
          },
          "apigee-cassandra-default-1": {
            "state": "complete",
            "updated": 1623105765
          },
          "apigee-cassandra-default-2": {
            "state": "complete",
            "updated": 1623105770
          }
        },
        "state": "complete",
        "updated": 1623105770
      }
  6. 從記錄檔驗證重建程序。此外,請使用 nodetool status 指令驗證資料大小:
    kubectl logs apigee-cassandra-default-0 -f -n apigee
    kubectl exec apigee-cassandra-default-0 -n apigee  -- nodetool -u JMX_user -pw JMX_password status

    以下範例顯示記錄項目:

    INFO  01:42:24 rebuild from dc: dc-1, (All keyspaces), (All tokens)
    INFO  01:42:24 [Stream #3a04e810-580d-11e9-a5aa-67071bf82889] Executing streaming plan for Rebuild
    INFO  01:42:24 [Stream #3a04e810-580d-11e9-a5aa-67071bf82889] Starting streaming to /10.12.1.45
    INFO  01:42:25 [Stream #3a04e810-580d-11e9-a5aa-67071bf82889, ID#0] Beginning stream session with /10.12.1.45
    INFO  01:42:25 [Stream #3a04e810-580d-11e9-a5aa-67071bf82889] Starting streaming to /10.12.4.36
    INFO  01:42:25 [Stream #3a04e810-580d-11e9-a5aa-67071bf82889 ID#0] Prepare completed. Receiving 1 files(0.432KiB), sending 0 files(0.000KiB)
    INFO  01:42:25 [Stream #3a04e810-580d-11e9-a5aa-67071bf82889] Session with /10.12.1.45 is complete
    INFO  01:42:25 [Stream #3a04e810-580d-11e9-a5aa-67071bf82889, ID#0] Beginning stream session with /10.12.4.36
    INFO  01:42:25 [Stream #3a04e810-580d-11e9-a5aa-67071bf82889] Starting streaming to /10.12.5.22
    INFO  01:42:26 [Stream #3a04e810-580d-11e9-a5aa-67071bf82889 ID#0] Prepare completed. Receiving 1 files(0.693KiB), sending 0 files(0.000KiB)
    INFO  01:42:26 [Stream #3a04e810-580d-11e9-a5aa-67071bf82889] Session with /10.12.4.36 is complete
    INFO  01:42:26 [Stream #3a04e810-580d-11e9-a5aa-67071bf82889, ID#0] Beginning stream session with /10.12.5.22
    INFO  01:42:26 [Stream #3a04e810-580d-11e9-a5aa-67071bf82889 ID#0] Prepare completed. Receiving 3 files(0.720KiB), sending 0 files(0.000KiB)
    INFO  01:42:26 [Stream #3a04e810-580d-11e9-a5aa-67071bf82889] Session with /10.12.5.22 is complete
    INFO  01:42:26 [Stream #3a04e810-580d-11e9-a5aa-67071bf82889] All sessions completed
  7. 更新種子主機。從 overrides-DC_name.yaml 移除 multiRegionSeedHost: 10.0.0.11,然後重新套用。
    apigeectl apply -f overrides/overrides-DC_name.yaml

檢查 Cassandra 叢集狀態

下列指令有助於查看叢集是否已在兩個資料中心成功設定。這項指令會檢查兩個區域的 nodetool 狀態。

kubectl exec apigee-cassandra-default-0 -n apigee  -- nodetool -u JMX_user -pw JMX_password status


Datacenter: dc-1
================
Status=Up/Down
|/ State=Normal/Leaving/Joining/Moving
--  Address     Load       Tokens       Owns (effective)  Host ID                               Rack
UN  10.12.1.45  112.09 KiB  256          100.0%            3c98c816-3f4d-48f0-9717-03d0c998637f  ra-1
UN  10.12.4.36  95.27 KiB  256          100.0%            0a36383d-1d9e-41e2-924c-7b62be12d6cc  ra-1
UN  10.12.5.22  88.7 KiB   256          100.0%            3561f4fa-af3d-4ea4-93b2-79ac7e938201  ra-1
Datacenter: dc-2
================
Status=Up/Down
|/ State=Normal/Leaving/Joining/Moving
--  Address     Load       Tokens       Owns (effective)  Host ID                               Rack
UN  10.0.4.33   78.69 KiB  256          0.0%              a200217d-260b-45cd-b83c-182b27ff4c99  ra-1
UN  10.0.0.21   78.68 KiB  256          0.0%              9f3364b9-a7a1-409c-9356-b7d1d312e52b  ra-1
UN  10.0.1.26   15.46 KiB  256          0.0%              1666df0f-702e-4c5b-8b6e-086d0f2e47fa  ra-1

疑難排解

請參閱「Cassandra 資料複寫失敗」。