Study Programming/Google AI기초공부(with CloudSkillBoost)

[Imagen1/4] 1. Build an AI Image Recognition app using Gemini on Vertex (Vertex AI의 Gemini를 사용하여 AI 이미지 인식 앱 구축)

네모메모 2025. 9. 15. 09:55
반응형

 

 

 

Build an AI Image Recognition app using Gemini on Vertex AI

(Vertex AI의 Gemini를 사용하여 AI 이미지 인식 앱 구축)

 

 

 


목적

Vertex AI의 생성 AI(genAI 또는 gen AI라고도 함)를 사용하면 Google의 대규모 생성 AI 모델을 활용하여 AI 기반 애플리케이션에 테스트, 조정 및 배포할 수 있습니다. 이 랩에서는 다음을 수행합니다.

  • Vertex AI(Google Cloud AI 플랫폼)에 연결: Vertex AI SDK를 사용하여 Google AI 서비스에 연결하는 방법을 알아보세요.
  • 사전 훈련된 생성 AI 모델 로드 - 제미니: 처음부터 모델을 구축하지 않고도 강력하고 사전 훈련된 AI 모델을 사용하는 방법을 알아보세요.
  • AI 모델에 이미지 + 텍스트 질문 보내기: AI가 처리할 입력을 제공하는 방법을 알아보세요.
  • AI로부터 텍스트 기반 답변을 추출합니다. AI 모델이 생성한 텍스트 응답을 처리하고 해석하는 방법을 배웁니다.
  • AI 애플리케이션 구축의 기본 사항을 이해합니다. 소프트웨어 프로젝트에 AI를 통합하는 핵심 개념에 대한 통찰력을 얻습니다.

 


Working with Vertex AI Python SDK

 

이번 과정은 랩을 시작하면 왼쪽에는 코드 편집기가, 오른쪽에는 랩 지침이 분할 창으로 표시됩니다.

 

그리고 genai라서 좋습니다 :)

 

+) projectId와 location은 상단 아래 버튼 클릭 시 다시 보여집니다.

 

 

 


과정

  1. File > New File 파일 생성
  2. 아래 코드 복붙
from google import genai
from google.genai.types import HttpOptions, Part

client = genai.Client(http_options=HttpOptions(api_version="v1"))
response = client.models.generate_content(
    model="gemini-2.0-flash-001",
    contents=[
        "What is shown in this image?",
        Part.from_uri(
            file_uri="https://storage.googleapis.com/cloud-samples-data/generative-ai/image/scones.jpg",
            mime_type="image/jpeg",
        ),
    ],
)
print(response.text)

ㄴ> 코드 설명

  • Gemini(gemini-2.0-flash-001)라는 사전 학습된 AI 모델을 로드합니다.
  • `generate_content`로 로드된 Gemini 모델의 메서드를 호출합니다.
  • 이미지에 대해 설명하라고 prompt로 전달하고 있습니다. 이미지는 아래와 같습니다.

 

  • 이 코드는 Gemini가 이미지와 텍스트를 함께 이해하는 능력을 활용합니다. 프롬프트에 제공된 텍스트를 사용하여 이미지의 내용을 설명합니다.

 

 

3. genai.py 이름으로 파일 저장

  - 주의) 이때 경로는 따로 설정하지 않습니다. 그래야 5번이 실행됩니다.

 

4. 아래 코드에 project-id값과 location값을 적어준 후,
     하단 터미널창에 아래 "환경 변수를 설정" 코드 복붙하고 Enter키 입력하면, "환경 변수를 설정"완료

export GOOGLE_CLOUD_PROJECT='"project-id"'
export GOOGLE_CLOUD_LOCATION='"REGION"'
export GOOGLE_GENAI_USE_VERTEXAI=True

 

5. 터미널의 코드 편집기 창에서 아래 명령을 복붙하고 Enter키 입력  

/usr/bin/python3 /genai.py
 
6. Python 파일을 실행하면 출력을 볼 수 있습니다.
   - 터미널창에 아래와 같이 prompt에 대한 답변이 응답됨
root@e09b477483db:/home/student# /usr/bin/python3 /genai.py
The image displays an overhead shot of a food arrangement featuring blueberry scones, a cup of coffee (both black and with milk), fresh blueberries in a small bowl, and a spoon engraved with "LET'S JAM". The arrangement is presented on a sheet of paper with a blueberry-themed print or stain, and pink peonies add a floral element to the composition.
답변 번역 내용)
이 이미지는 블루베리 스콘, 커피 한 잔(블랙과 우유), 작은 그릇에 담긴 신선한 블루베리, 그리고 "LET'S JAM"이라고 새겨진 숟가락으로 구성된 음식 장식을 위에서 찍은 사진입니다. 이 장식은 블루베리를 주제로 한 프린트나 스테인이 있는 종이에 담겨 있으며, 분홍색 모란이 꽃무늬를 더합니다.

 

 

 

 

 

 

 

 

 

 

 

 

 

반응형