버전 정보는 연결된 Distributed Cloud 출시 노트를 참고하세요.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

워크로드 배포

이 페이지에서는 Google Distributed Cloud(연결형) 하드웨어에 워크로드를 배포하는 단계와 워크로드를 구성할 때 준수해야 하는 제한사항을 설명합니다.

이 단계를 완료하기 전에 Distributed Cloud(연결형) 설치 요구사항을 충족하고 Distributed Cloud 하드웨어를 주문해야 합니다.

선택한 대상에 Google Distributed Cloud(연결형) 하드웨어가 도착하면 Distributed Cloud(연결형)를 주문할 때 지정한 하드웨어 Google Cloud및 일부 네트워크 설정으로 사전 구성됩니다.

Google 설치 프로그램이 실제 설치를 완료하고 시스템 관리자가 Distributed Cloud(연결형)를 로컬 네트워크에 연결합니다.

하드웨어가 로컬 네트워크에 연결되면 소프트웨어 업데이트를 다운로드하고 프로젝트Google Cloud 에 연결하기 위해 와 Google Cloud 통신합니다. 그런 다음 노드 풀을 프로비저닝하고 Distributed Cloud(연결형)에 워크로드를 배포할 수 있습니다.

배포 개요

Distributed Cloud(연결형) 하드웨어에 워크로드를 배포하려면 다음 단계를 완료하세요.

선택사항: Distributed Cloud Edge Network API를 사용 설정합니다.
선택사항: Distributed Cloud(연결형) 영역의 네트워크 구성을 초기화합니다.
선택사항: Distributed Cloud 네트워킹을 구성합니다.
Distributed Cloud(연결형) 클러스터를 만듭니다.
선택사항: Cloud Key Management Service와 통합하여 워크로드 데이터에 CMEK 지원을 사용 설정하려면 로컬 저장소에 고객 관리 암호화 키 (CMEK) 지원을 사용 설정합니다. Distributed Cloud(연결형)에서 워크로드 데이터를 암호화하는 방법에 대한 자세한 내용은 로컬 저장소 보안을 참조하세요.
노드 풀을 만듭니다. 이 단계에서는 노드를 노드 풀에 할당하고 선택적으로 Cloud KMS를 사용하여 워크로드 데이터를 암호화하기 위한 Linux 통합 키 설정 (LUKS) 비밀번호를 래핑 및 래핑 해제하도록 노드 풀을 구성합니다.
클러스터의 사용자 인증 정보를 가져옵니다. 클러스터를 테스트하기 위해
프로젝트에서 Edge 컨테이너 뷰어 역할 (roles/edgecontainer.viewer) 또는 Edge 컨테이너 관리자 역할 (roles/edgecontainer.admin)을 할당하여 사용자에게 클러스터에 대한 액세스 권한을 부여합니다.
사용자에게 RoleBinding 및 ClusterRoleBinding을 사용하여 클러스터 리소스에 대한 세분화된 역할 기반 액세스 권한을 할당합니다.
선택사항: Google Distributed Cloud의 VM 런타임 지원을 사용 설정하여 Distributed Cloud(연결형)의 가상 머신에서 워크로드를 실행합니다.
선택사항: GPU 지원을 사용 설정하여 Distributed Cloud(연결형)에서 GPU 기반 워크로드를 실행합니다.

NGINX 부하 분산기를 서비스로 배포

다음 예에서는 NGINX 서버를 배포하고 Distributed Cloud(연결형) 클러스터에서 서비스로 노출하는 방법을 보여줍니다.

다음 콘텐츠로 nginx-deployment.yaml이라는 YAML 파일을 만듭니다.

apiVersion: apps/v1
kind: Deployment
metadata:
name: nginx
labels:
  app: nginx
spec:
replicas: 1
selector:
  matchLabels:
     app: nginx
template:
  metadata:
     labels:
     app: nginx
  spec:
     containers:
     - name: nginx
     image: nginx:latest
     ports:
     - containerPort: 80

다음 명령어를 사용하여 YAML 파일을 클러스터에 적용합니다.
```
kubectl apply -f nginx-deployment.yaml
```

다음 콘텐츠로 nginx-service.yaml이라는 YAML 파일을 만듭니다.

apiVersion: v1
kind: Service
metadata:
name: nginx-service
spec:
type: LoadBalancer
selector:
  app: nginx
  ports:
     - protocol: TCP
       port: 8080
       targetPort: 80

다음 명령어를 사용하여 YAML 파일을 클러스터에 적용합니다.
```
kubectl apply -f nginx-deployment.yaml
```

다음 명령어를 사용하여 MetalLB 부하 분산기가 서비스에 할당한 외부 IP 주소를 가져옵니다.

kubectl get services

이 명령어는 다음과 유사한 출력을 반환합니다.

NAME            TYPE           CLUSTER-IP     EXTERNAL-IP     PORT(S)          AGE
nginx-service   LoadBalancer   10.51.195.25   10.100.68.104   8080:31966/TCP   11d

`NodeSystemConfigUpdate` 리소스 구성

다음과 같이 클러스터의 각 노드에 대해 NodeSystemConfigUpdate 네트워크 함수 연산자 리소스를 구성합니다.

다음 명령어를 사용하여 대상 클러스터의 노드 풀에서 실행 중인 노드를 나열합니다.
```
kubectl get nodes | grep -v master
```
이 명령어는 다음과 유사한 출력을 반환합니다.
```
NAME                                 STATUS   ROLES       AGE     VERSION
pool-example-node-1-01-b2d82cc7      Ready    <none>      2d      v1.22.8-gke.200
pool-example-node-1-02-52ddvfc9      Ready    <none>      2d      v1.22.8-gke.200
```
반환된 노드 이름을 기록하고 짧은 이름을 파생시킵니다. 예를 들어 pool-example-node-1-01-b2d82cc7 노드의 닉네임은 node101입니다.

이전 단계에서 기록한 각 노드에 대해 다음 콘텐츠가 포함된 전용 NodeSystemConfigUpdate 리소스 파일을 만듭니다.

apiVersion: networking.gke.io/v1
kind: NodeSystemConfigUpdate
metadata:
name: nodesystemconfigupdate-NODE_SHORT_NAME
namespace: nf-operator
spec:
kubeletConfig:
  cpuManagerPolicy: Static
  topologyManagerPolicy: SingleNumaNode
nodeName: NODE_NAME
osConfig:
  hugePagesConfig:
     ONE_GB: 2
     TWO_MB: 0
  isolatedCpusPerSocket:
     "0": 40
     "1": 40
sysctls:
  nodeLevel:
     net.core.rmem_max: "8388608"
     net.core.wmem_max: "8388608"

다음을 바꿉니다.

NODE_NAME: 대상 노드의 전체 이름입니다. 예를 들어 pool-example-node-1-01-b2d82cc7입니다.
NODE_SHORT_NAME: 전체 이름에서 파생된 대상 노드의 닉네임입니다. 예를 들어 node101입니다.

각 파일의 이름을 node-system-config-update-NODE_SHORT_NAME.yaml으로 지정합니다.

다음 명령어를 사용하여 각 NodeSystemConfigUpdate 리소스 파일을 클러스터에 적용합니다.
```
kubectl apply -f node-system-config-update-NODE_SHORT_NAME.yaml
```
NODE_SHORT_NAME을 해당 대상 노드의 닉네임으로 바꿉니다.

리소스를 클러스터에 적용하면 영향을 받는 각 노드가 재부팅되며 최대 30분이 걸릴 수 있습니다.
1. 영향을 받는 노드의 상태를 모두 재부팅될 때까지 모니터링합니다.
```
kubectl get nodes | grep -v master
```
각 노드의 상태는 재부팅이 완료되면 not-ready에서 ready로 전환됩니다.

이미지 캐싱을 위한 포드 구성

Distributed Cloud(연결형) 클러스터에서 실행되는 포드를 구성하여 이미지를 캐시할 수 있습니다. 포드는 저장소에서 처음 가져온 후 캐시된 이미지를 사용하기 시작합니다. 포드를 호스팅하는 노드의 저장용량이 부족하면 새 이미지가 캐시되지 않고 워크로드가 중단 없이 계속 실행되도록 기존 이미지 캐시가 삭제됩니다.

포드 구성은 다음 기본 요건을 충족해야 합니다.

포드에 gdce.baremetal.cluster.gke.io/cache-image: true 라벨을 설정해야 합니다.
비공개 이미지 저장소를 사용하는 경우 ImagePullSecret 리소스는 kubernetes.io/dockerconfigjson 유형이어야 합니다.
캐시된 대상 이미지 사본이 항상 사용되도록 포드의 가져오기 정책을 IfNotPresent로 설정해야 합니다. 캐시된 사본을 로컬에서 사용할 수 없는 경우 이미지가 저장소에서 가져옵니다.

다음 예에서는 캐싱이 사용 설정된 포드 구성을 보여줍니다.

apiVersion: v1
kind: Pod
metadata:
  name: cached-image-pod
  labels:
    gdce.baremetal.cluster.gke.io/cache-image: "true"
spec:
  containers:
    - name: my-container
      image: your-private-image-repo/your-image:tag
      imagePullPolicy: IfNotPresent
  imagePullSecrets:
    - name: my-image-secret  # If using a private registry

다음 예에서는 캐싱이 사용 설정된 배포 구성을 보여줍니다.

apiVersion: apps/v1
kind: Deployment
metadata:
  name: cached-image-deployment
spec:
  template:
    metadata:
      labels:
        gdce.baremetal.cluster.gke.io/cache-image: "true"
    spec:
      containers:
        - name: my-container
          image: your-private-image-repo/your-image:tag
          imagePullPolicy: IfNotPresent
      imagePullSecrets:
        - name: my-image-secret  # If using a private registry

Distributed Cloud 워크로드 제한사항

Distributed Cloud(연결형) 워크로드를 구성할 때는 이 섹션에 설명된 제한사항을 준수해야 합니다. 이러한 제한사항은 Distributed Cloud(연결형) 하드웨어에 배포하는 모든 워크로드에 Distributed Cloud(연결형)에서 적용됩니다.

Linux 워크로드 제한사항

Distributed Cloud(연결형)는 워크로드에 다음 Linux 기능 만 지원합니다.

AUDIT_READ
AUDIT_WRITE
CHOWN
DAC_OVERRIDE
FOWNER
FSETID
IPC_LOCK
IPC_OWNER
KILL
MKNOD
NET_ADMIN
NET_BIND_SERVICE
NET_RAW
SETFCAP
SETGID
SETPCAP
SETUID
SYS_CHROOT
SYS_NICE
SYS_PACCT
SYS_PTRACE
SYS_RESOURCE
SYS_TIME

네임스페이스 제한사항

Distributed Cloud(연결형)는 다음 네임스페이스를 지원하지 않습니다.

hostPID
hostIPC
hostNetwork

리소스 유형 제한사항

Distributed Cloud(연결형)는 클라이언트가 서명 요청을 기반으로 X.509 인증서 발급을 요청할 수 있는 CertificateSigningRequest 리소스 유형을 지원하지 않습니다.

보안 컨텍스트 제한사항

Distributed Cloud(연결형)는 권한 있는 모드 보안 컨텍스트를 지원하지 않습니다.

포드 바인딩 제한사항

Distributed Cloud(연결형)는 HostNetwork 네임스페이스의 호스트 포드에 포드를 바인딩하는 것을 지원하지 않습니다. 또한 HostNetwork 네임스페이스를 사용할 수 없습니다.

`hostPath` 볼륨 제한사항

Distributed Cloud(연결형)는 읽기/쓰기 액세스 권한이 있는 다음 hostPath 볼륨만 허용합니다.

/dev/hugepages
/dev/infiniband
/dev/vfio
/dev/char
/sys/devices

`PersistentVolumeClaim` 리소스 유형 제한사항

Distributed Cloud(연결형)는 다음 PersistentVolumeClaim 리소스 유형만 허용합니다.

csi
nfs
local

볼륨 유형 제한사항

Distributed Cloud(연결형)는 다음 볼륨 유형만 허용합니다.

configMap
csi
downwardAPI
emptyDir
hostPath
nfs
persistentVolumeClaim
projected
secret

포드 톨러레이션(toleration) 제한사항

Distributed Cloud(연결형)는 컨트롤 플레인 노드에서 사용자가 만든 포드를 허용하지 않습니다. 특히 Distributed Cloud(연결형)는 다음 톨러레이션(toleration) 키가 있는 포드의 예약을 허용하지 않습니다.

""
node-role.kubernetes.io/master
node-role.kubernetes.io/control-plane

가장 제한사항

Distributed Cloud 연결형은 사용자 또는 그룹 가장을 지원하지 않습니다.

관리 네임스페이스 제한사항

Distributed Cloud(연결형)는 다음 네임스페이스에 대한 액세스를 허용하지 않습니다.

ai-system
ai-speech-system
ai-ocr-system
ai-translation-system
anthos-identity-service
cert-manager
dataproc-system
dataproc-PROJECT_ID
dns-system
g-istio-system
gke-connect
gke-managed-metrics-server
gke-operators
g-ospf-servicecontrol-system
g-ospf-system
g-pspf-system
gke-system
gpc-backup-system
iam-system
kube-node-lease
kube-public
kube-system(단, ippools.whereabouts.cni.cncf.io 삭제는 예외)
metallb-system (단, 부하 분산 IP 주소 범위를 설정하기 위해 configMap 리소스 수정은 예외)
nf-operator
oclcm-system
prediction
rm-system
robinio
saas-system
vm-system

PROJECT_ID는 대상 Google Cloud 프로젝트의 ID를 나타냅니다.

이름에 g- 프리픽스가 있는 네임스페이스는 사용하지 마세요. 이러한 네임스페이스는 일반적으로 Distributed Cloud(연결형)에서 사용하는 예약된 네임스페이스입니다.

웹훅 제한사항

Distributed Cloud(연결형)는 다음과 같이 웹훅을 제한합니다.

만드는 모든 변형 웹훅은 kube-system 네임스페이스를 자동으로 제외합니다.
변형 웹훅은 다음 리소스 유형에 대해 사용 중지됩니다.
- nodes
- persistentvolumes
- certificatesigningrequests
- tokenreviews

포드의 런타임 클래스 구성

Distributed Cloud(연결형)를 사용하면 runtimeClassName 필드를 사용하여 구성에서 포드의 런타임 클래스를 지정할 수 있습니다. 이렇게 하면 클러스터 수준에서 지정된 기본 런타임 클래스가 재정의됩니다. 사용 가능한 런타임 클래스는 runc 및 gvisor입니다. 예를 들면 다음과 같습니다.

apiVersion: v1
kind: Pod
metadata:
  name: myPod
spec:
  runtimeClassName: gvisor
  containers:
  - name: myPod
    image: myPodImage
  restartPolicy: OnFailure

포드 구성에서 이를 생략하면 포드는 클러스터 수준에서 지정된 클래스를 사용합니다. 클러스터 수준의 기본 런타임 클래스는 기본 런타임 클래스 를 구성하지 않는 한 runc입니다. --default-container-runtime 매개변수를 사용하는 방법은 클러스터 만들기 및 관리에 설명되어 있습니다.

포드 또는 클러스터 수준에서 런타임 클래스를 변경하는 경우 변경사항을 적용하려면 영향을 받는 포드를 다시 시작해야 합니다.

`gvisor` 런타임 클래스

gvisor 런타임 클래스를 지정하면 포드가 gVisor를 기반으로 하는 OCI (Open Container Initiative) 보안 런타임 으로 전환됩니다. gVisor는 워크로드와 호스트 간에 강력한 격리를 도입하는 샌드박스 솔루션 입니다.

VPC 서비스 제어 통합 구성

이 섹션의 단계에 따라 Distributed Cloud Edge Container API와 VPC 서비스 제어의 통합을 구성합니다. 자세한 내용은 다음을 참조하세요.

포드의 런타임 우선순위 지정

Distributed Cloud(연결형)를 사용하면 priorityClassName 필드를 사용하여 구성에서 포드의 우선순위 클래스를 지정할 수 있습니다. 이 필드는 대상 우선순위를 지정하는 PriorityClass 리소스의 이름을 허용합니다. 예를 들면 다음과 같습니다.

kind: PriorityClass
metadata:
  name: high-priority-class
value: 5100000
globalDefault: false
description: "High priority class for user workloads."

다음 예와 같이 포드 구성에서 우선순위 클래스의 이름을 지정합니다.

apiVersion: v1
kind: Pod
metadata:
  name: myPod
spec:
  priorityClassName: high-priority-class
  containers:
  - name: myPod
    image: myPodImage 
  restartPolicy: OnFailure

우선순위 클래스를 지정하면 기본 포드 우선순위 0이 재정의됩니다. 중요한 워크로드의 경우 우선순위를 5000001에서 1000000000 사이의 값으로 설정합니다. Distributed Cloud(연결형)는 우선순위가 낮은 워크로드를 자동으로 선점합니다.

필수 이그레스 규칙

Distributed Cloud Edge Container API를 VPC 서비스 제어와 통합하려면 이 섹션에 설명된 이그레스 규칙을 구성해야 합니다. 이그레스 규칙 구문에 대한 자세한 내용은 이그레스 규칙 참조를 확인하세요.

머신 영역 및 Google Cloud 프로젝트에 대한 액세스

이 규칙을 사용하면 호출 ID가 Distributed Cloud Edge Container API를 사용하여 호출할 때 머신 영역 및 Google Cloud 프로젝트에 액세스할 수 있습니다. 이 규칙은 머신과 클러스터가 동일한 Google Cloud 프로젝트에 없고 머신 Google Cloud 프로젝트가 경계 외부에 있는 경우에 적용됩니다. VPC 서비스 제어를 사용하여 경계 내에서 Distributed Cloud Edge Container API를 제한한 경우 이 규칙이 필요합니다.

다음은 JSON 형식으로 이 규칙의 egressFrom 구성 예시입니다.

egressFrom:
  identityType: ANY_SERVICE_ACCOUNT
  sources:
    - accessLevel: "*"

다음은 이 규칙의 egressTo 구성 예시입니다.

egressTo:
 resources:
 - "projects/280968151686"
 operations:
   - serviceName: "edgecontainer.googleapis.com"
     methodSelectors:
       - method: "*"

필수 인그레스 규칙

Distributed Cloud Edge Container API를 VPC 서비스 제어와 통합하려면 이 섹션에 설명된 인그레스 규칙을 구성해야 합니다. 인그레스 규칙 구문에 대한 자세한 내용은 인그레스 규칙 참조를 확인하세요.

Distributed Cloud Edge Container API에 대한 액세스

이 규칙을 사용하면 특정 ID가 Distributed Cloud Edge Container API에 액세스하고 상호작용할 수 있습니다. VPC 서비스 제어를 사용하여 경계 내에서 Distributed Cloud Edge Container API를 제한하고 Distributed Cloud Edge Container API를 호출하는 ID가 경계 외부에 있는 경우 이 규칙을 구성해야 합니다.

다음은 이 규칙의 ingressFrom 구성 예시입니다.

ingressFrom:
   sources:
     - accessLevel: '*'
   identities:
     - serviceAccount:testuser@kubernetesedge-e2e-testing.iam.gserviceaccount.com

다음은 이 규칙의 ingressTo 구성 예시입니다.

ingressTo:
 resources:
 - "*"
 operations:
   - serviceName: "edgecontainer.googleapis.com"
     methodSelectors:
       - method: "*"

Connect API 및 Security Token Service API에 대한 액세스

이 규칙을 사용하면 워크로드가 Connect API 및 Security Token Service API에 액세스할 수 있습니다. VPC 서비스 제어를 사용하여 경계 내에서 Connect API 및 Security Token Service API에 대한 액세스를 제한한 경우 이 규칙을 구성해야 합니다. IP 주소 수준에서 액세스 정책을 설정하는 방법에 대한 자세한 내용은 IP 주소를 참조하세요.