빠른 시작: Python (LangChain) 웹 앱 빌드 및 Cloud Run에 배포

Cloud Run과 Gemini를 사용하여 도시 수도에 관한 질문에 답변하는 LangChain 애플리케이션을 빌드하고 배포하는 방법을 알아봅니다.

이 빠른 시작의 단계를 따르면 소스 코드에서 배포할 때 Cloud Run에서 Dockerfile을 자동으로 빌드합니다.

시작하기 전에

  1. Google Cloud 계정에 로그인합니다. Google Cloud를 처음 사용하는 경우 계정을 만들고 Google 제품의 실제 성능을 평가해 보세요. 신규 고객에게는 워크로드를 실행, 테스트, 배포하는 데 사용할 수 있는 $300의 무료 크레딧이 제공됩니다.
  2. Google Cloud CLI를 설치합니다.

  3. 외부 ID 공급업체(IdP)를 사용하는 경우 먼저 제휴 ID로 gcloud CLI에 로그인해야 합니다.

  4. gcloud CLI를 초기화하려면, 다음 명령어를 실행합니다.

    gcloud init
  5. Google Cloud 프로젝트를 만들거나 선택합니다.

    프로젝트를 선택하거나 만드는 데 필요한 역할

    • 프로젝트 선택: 프로젝트를 선택하는 데는 특정 IAM 역할이 필요하지 않습니다. 역할이 부여된 프로젝트를 선택하면 됩니다.
    • 프로젝트 만들기: 프로젝트를 만들려면 resourcemanager.projects.create 권한이 포함된 프로젝트 생성자 역할(roles/resourcemanager.projectCreator)이 필요합니다. 역할 부여 방법 알아보기
    • Google Cloud 프로젝트를 만듭니다.

      gcloud projects create PROJECT_ID

      PROJECT_ID를 만들려는 Google Cloud 프로젝트의 이름으로 바꿉니다.

    • 생성한 Google Cloud 프로젝트를 선택합니다.

      gcloud config set project PROJECT_ID

      PROJECT_ID을 Google Cloud 프로젝트 이름으로 바꿉니다.

  6. 이 가이드에 기존 프로젝트를 사용하는 경우 이 가이드를 완료하는 데 필요한 권한이 있는지 확인합니다. 새 프로젝트를 만든 경우에는 이미 필요한 권한이 있습니다.

  7. Google Cloud 프로젝트에 결제가 사용 설정되어 있는지 확인합니다.

  8. Google Cloud CLI를 설치합니다.

  9. 외부 ID 공급업체(IdP)를 사용하는 경우 먼저 제휴 ID로 gcloud CLI에 로그인해야 합니다.

  10. gcloud CLI를 초기화하려면, 다음 명령어를 실행합니다.

    gcloud init
  11. Google Cloud 프로젝트를 만들거나 선택합니다.

    프로젝트를 선택하거나 만드는 데 필요한 역할

    • 프로젝트 선택: 프로젝트를 선택하는 데는 특정 IAM 역할이 필요하지 않습니다. 역할이 부여된 프로젝트를 선택하면 됩니다.
    • 프로젝트 만들기: 프로젝트를 만들려면 resourcemanager.projects.create 권한이 포함된 프로젝트 생성자 역할(roles/resourcemanager.projectCreator)이 필요합니다. 역할 부여 방법 알아보기
    • Google Cloud 프로젝트를 만듭니다.

      gcloud projects create PROJECT_ID

      PROJECT_ID를 만들려는 Google Cloud 프로젝트의 이름으로 바꿉니다.

    • 생성한 Google Cloud 프로젝트를 선택합니다.

      gcloud config set project PROJECT_ID

      PROJECT_ID을 Google Cloud 프로젝트 이름으로 바꿉니다.

  12. 이 가이드에 기존 프로젝트를 사용하는 경우 이 가이드를 완료하는 데 필요한 권한이 있는지 확인합니다. 새 프로젝트를 만든 경우에는 이미 필요한 권한이 있습니다.

  13. Google Cloud 프로젝트에 결제가 사용 설정되어 있는지 확인합니다.

  14. 프로젝트에서 인증되지 않은 호출을 제한하는 도메인 제한 조직 정책이 적용되는 경우 비공개 서비스 테스트의 설명대로 배포된 서비스에 액세스해야 합니다.

  15. Cloud Run Admin API 및 Cloud Build API를 사용 설정합니다.

    API 사용 설정에 필요한 역할

    API를 사용 설정하려면 serviceusage.services.enable 권한이 포함된 서비스 사용량 관리자 IAM 역할 (roles/serviceusage.serviceUsageAdmin)이 필요합니다. 역할 부여 방법 알아보기

    gcloud services enable run.googleapis.com cloudbuild.googleapis.com

    Cloud Run Admin API를 사용 설정하면 Compute Engine 기본 서비스 계정이 자동으로 생성됩니다.

  16. Cloud Run 가격 책정을 검토하거나 가격 계산기로 비용을 추정합니다.
  17. Gemini 모델로 LangChain 앱을 배포하려면 Google AI Studio의 API 키가 필요합니다. Google AI Studio를 사용하여 API 키를 생성하려면 Gemini API 문서의 Gemini API 키 사용을 참고하세요. 서비스를 배포할 때 이 키를 참조합니다.

필요한 역할

이 빠른 시작을 완료하는 데 필요한 권한을 얻으려면 관리자에게 다음의 IAM 역할을 부여해 달라고 요청하세요.

역할 부여에 대한 자세한 내용은 프로젝트, 폴더, 조직에 대한 액세스 관리를 참조하세요.

커스텀 역할이나 다른 사전 정의된 역할을 통해 필요한 권한을 얻을 수도 있습니다.

Cloud Build 서비스 계정에 프로젝트에 대한 액세스 권한 부여

이 동작을 재정의하지 않는 한 Cloud Build는 자동으로 Compute Engine 기본 서비스 계정을 기본 Cloud Build 서비스 계정으로 사용하여 소스 코드와 Cloud Run 리소스를 빌드합니다.

Cloud Build에서 소스를 빌드할 수 있게 하려면 Cloud Build 서비스 계정에 프로젝트에 대한 Cloud Run 빌더(roles/run.builder) 역할을 부여하세요.

gcloud projects add-iam-policy-binding PROJECT_ID \
    --member=serviceAccount:SERVICE_ACCOUNT_EMAIL_ADDRESS \
    --role=roles/run.builder

PROJECT_ID를 Google Cloud프로젝트 ID로 바꾸고 SERVICE_ACCOUNT_EMAIL_ADDRESS를 Cloud Build 서비스 계정의 이메일 주소로 바꿉니다. Compute Engine 기본 서비스 계정을 Cloud Build 서비스 계정으로 사용하는 경우 서비스 계정 이메일 주소에 다음 형식을 사용합니다.

PROJECT_NUMBER-compute@developer.gserviceaccount.com

여기에서 PROJECT_NUMBER를 Google Cloud프로젝트 번호로 바꿉니다.

프로젝트 ID와 프로젝트 번호를 찾는 방법에 대한 자세한 내용은 프로젝트 만들기 및 관리를 참조하세요.

Cloud Run 빌더 역할을 부여하면 전파되는 데 몇 분 정도 걸립니다.

샘플 애플리케이션 작성

Python으로 애플리케이션을 작성하려면 다음을 수행합니다.

  1. langchain-gemini-fastapi-app라는 새 디렉터리를 만들고 이 디렉터리로 이동합니다.

    mkdir langchain-gemini-fastapi-app
    cd langchain-gemini-fastapi-app
    
  2. main.py라는 파일을 만들고 이 파일에 다음 코드를 붙여넣습니다.

    import os
    import uvicorn
    from fastapi import FastAPI, HTTPException
    from pydantic import BaseModel
    from langchain_google_genai import ChatGoogleGenerativeAI
    from langchain_core.prompts import ChatPromptTemplate
    from langchain_core.output_parsers import StrOutputParser
    
    # Initialize FastAPI
    app = FastAPI(title="LangChain Gemini Cloud Run App")
    
    # 1. Setup Gemini Model
    # We expect GOOGLE_API_KEY to be set in the environment variables
    llm = ChatGoogleGenerativeAI(
      model="gemini-2.5-flash",
      temperature=0.7
    )
    
    # 2. Define the Chain
    prompt = ChatPromptTemplate.from_template("You are a helpful assistant. Answer the following question concisely: {topic}")
    output_parser = StrOutputParser()
    
    # Chain: Prompt -> Model -> String Parser
    chain = prompt | llm | output_parser
    
    # 3. Define Request Model
    class QueryRequest(BaseModel):
      topic: str
    
    # 4. Define Endpoint
    @app.post("/chat")
    async def chat(request: QueryRequest):
      try:
          response = await chain.ainvoke({"topic": request.topic})
          return {"response": response}
      except Exception as e:
          raise HTTPException(status_code=500, detail=str(e))
    
    @app.get("/")
    def health_check():
      return {"status": "ok", "service": "Gemini-FastAPI"}
    
  3. requirements.txt라는 파일을 만들고 이 파일에 다음 코드를 붙여넣습니다.

    fastapi
    uvicorn
    langchain
    langchain-google-genai
    python-dotenv
    

소스에서 Cloud Run에 배포

소스에서 배포는 소스 코드에서 컨테이너 이미지를 자동으로 빌드하고 이를 배포합니다.

다음 명령어를 사용하여 소스에서 배포합니다.

  gcloud run deploy gemini-fastapi-service \
    --source . \
    --region us-central1 \
    --no-allow-unauthenticated \
    --set-env-vars GEMINI_API_KEY=API_KEY

API_KEYGoogle AI Studio API 키로 바꿉니다. 프로덕션의 경우 일반 환경 변수 대신 Secret Manager를 사용하여 API 키를 처리하는 것이 좋습니다.

앱을 성공적으로 배포하면 Cloud Run에 https://gemini-fastapi-service-xyz-uc.a.run.app과 같은 서비스 URL이 표시됩니다.

Cloud Run 서비스 테스트

다음 curl 명령어를 사용하여 에이전트에 쿼리를 전송하여 서비스를 테스트합니다.

  curl -X POST YOUR-SERVICE-URL/chat \
    -H "Content-Type: application/json" \
    -H "Authorization: Bearer $(gcloud auth print-identity-token)" \
    -d '{"topic": "What is the capital of France?"}'

YOUR-SERVICE-URL을 서비스의 URL로 바꿉니다.

에이전트가 다음 응답을 보냅니다.

  {
  "response": "Paris"
  }

서비스가 올바르게 작동하는지 확인하려면 Cloud Run 서비스의 로그 탭을 확인합니다.

삭제

이 페이지에서 사용한 리소스 비용이 Google Cloud 계정에 청구되지 않도록 하려면 리소스가 포함된 Google Cloud 프로젝트를 삭제하세요.

Google Cloud 계정에 추가 비용이 청구되지 않게 하려면 이 빠른 시작으로 배포한 모든 리소스를 삭제합니다.

저장소 삭제

배포된 서비스를 사용하지 않으면 Cloud Run에서 요금을 청구하지 않습니다. 하지만 Artifact Registry에 컨테이너 이미지를 저장하는 요금이 부과될 수 있습니다. Artifact Registry 저장소를 삭제하려면 Artifact Registry 문서의 저장소 삭제 단계를 따르세요.

서비스 삭제

Cloud Run 서비스는 요청을 수신할 때까지 비용을 청구하지 않습니다. Cloud Run 서비스를 삭제하려면 다음 단계 중 하나를 수행합니다.

콘솔

서비스를 삭제하려면 다음 안내를 따르세요.

  1. Google Cloud 콘솔에서 Cloud Run 서비스 페이지로 이동합니다.

    Cloud Run으로 이동

  2. 서비스 목록에서 삭제할 서비스를 찾은 다음 체크박스를 클릭하여 선택합니다.

  3. 삭제를 클릭합니다. 이렇게 하면 서비스의 모든 버전이 삭제됩니다.

gcloud

서비스를 삭제하려면 다음 명령어를 실행합니다.

gcloud run services delete SERVICE --region REGION

다음을 바꿉니다.

  • SERVICE: 서비스 이름
  • REGION: 서비스의 Google Cloud 리전

테스트 프로젝트 삭제

Google Cloud 프로젝트를 삭제하면 해당 프로젝트의 모든 리소스에 대한 비용 청구가 중단됩니다. 프로젝트의 모든 Google Cloud 리소스를 해제하려면 다음 단계를 따르세요.

    Google Cloud 프로젝트를 삭제합니다.

    gcloud projects delete PROJECT_ID

다음 단계

코드 소스에서 컨테이너를 빌드하고 저장소로 푸시하는 방법에 대한 자세한 내용은 다음을 참조하세요.