[Imagen1/4] 1. Build an AI Image Recognition app using Gemini on Vertex (Vertex AI의 Gemini를 사용하여 AI 이미지 인식 앱 구축)

Study Programming/Google AI기초공부(with CloudSkillBoost)

[Imagen1/4] 1. Build an AI Image Recognition app using Gemini on Vertex (Vertex AI의 Gemini를 사용하여 AI 이미지 인식 앱 구축)

네모메모 2025. 9. 15. 09:55

Build an AI Image Recognition app using Gemini on Vertex AI

(Vertex AI의 Gemini를 사용하여 AI 이미지 인식 앱 구축)

목적

Vertex AI의 생성 AI(genAI 또는 gen AI라고도 함)를 사용하면 Google의 대규모 생성 AI 모델을 활용하여 AI 기반 애플리케이션에 테스트, 조정 및 배포할 수 있습니다. 이 랩에서는 다음을 수행합니다.

Vertex AI(Google Cloud AI 플랫폼)에 연결: Vertex AI SDK를 사용하여 Google AI 서비스에 연결하는 방법을 알아보세요.
사전 훈련된 생성 AI 모델 로드 - 제미니: 처음부터 모델을 구축하지 않고도 강력하고 사전 훈련된 AI 모델을 사용하는 방법을 알아보세요.
AI 모델에 이미지 + 텍스트 질문 보내기: AI가 처리할 입력을 제공하는 방법을 알아보세요.
AI로부터 텍스트 기반 답변을 추출합니다. AI 모델이 생성한 텍스트 응답을 처리하고 해석하는 방법을 배웁니다.
AI 애플리케이션 구축의 기본 사항을 이해합니다. 소프트웨어 프로젝트에 AI를 통합하는 핵심 개념에 대한 통찰력을 얻습니다.

Working with Vertex AI Python SDK

이번 과정은 랩을 시작하면 왼쪽에는 코드 편집기가, 오른쪽에는 랩 지침이 분할 창으로 표시됩니다.

그리고 genai라서 좋습니다 :)

+) projectId와 location은 상단 아래 버튼 클릭 시 다시 보여집니다.

과정

File > New File 파일 생성
아래 코드 복붙

from google import genai
from google.genai.types import HttpOptions, Part

client = genai.Client(http_options=HttpOptions(api_version="v1"))
response = client.models.generate_content(
    model="gemini-2.0-flash-001",
    contents=[
        "What is shown in this image?",
        Part.from_uri(
            file_uri="https://storage.googleapis.com/cloud-samples-data/generative-ai/image/scones.jpg",
            mime_type="image/jpeg",
        ),
    ],
)
print(response.text)

ㄴ> 코드 설명

Gemini(gemini-2.0-flash-001)라는 사전 학습된 AI 모델을 로드합니다.
`generate_content`로 로드된 Gemini 모델의 메서드를 호출합니다.
- 입력은 이미지 URI와 이미지에 대한 질문이 포함된 프롬프트입니다.
- https://ai.google.dev/api/generate-content
이미지에 대해 설명하라고 prompt로 전달하고 있습니다. 이미지는 아래와 같습니다.

이 코드는 Gemini가 이미지와 텍스트를 함께 이해하는 능력을 활용합니다. 프롬프트에 제공된 텍스트를 사용하여 이미지의 내용을 설명합니다.

3. genai.py 이름으로 파일 저장

- 주의) 이때 경로는 따로 설정하지 않습니다. 그래야 5번이 실행됩니다.

4. 아래 코드에 project-id값과 location값을 적어준 후,
하단 터미널창에 아래 "환경 변수를 설정" 코드 복붙하고 Enter키 입력하면, "환경 변수를 설정"완료

export GOOGLE_CLOUD_PROJECT='"project-id"'
export GOOGLE_CLOUD_LOCATION='"REGION"'
export GOOGLE_GENAI_USE_VERTEXAI=True

5. 터미널의 코드 편집기 창에서 아래 명령을 복붙하고 Enter키 입력

/usr/bin/python3 /genai.py

6. Python 파일을 실행하면 출력을 볼 수 있습니다.

- 터미널창에 아래와 같이 prompt에 대한 답변이 응답됨

root@e09b477483db:/home/student# /usr/bin/python3 /genai.py
The image displays an overhead shot of a food arrangement featuring blueberry scones, a cup of coffee (both black and with milk), fresh blueberries in a small bowl, and a spoon engraved with "LET'S JAM". The arrangement is presented on a sheet of paper with a blueberry-themed print or stain, and pink peonies add a floral element to the composition.

답변 번역 내용)
이 이미지는 블루베리 스콘, 커피 한 잔(블랙과 우유), 작은 그릇에 담긴 신선한 블루베리, 그리고 "LET'S JAM"이라고 새겨진 숟가락으로 구성된 음식 장식을 위에서 찍은 사진입니다. 이 장식은 블루베리를 주제로 한 프린트나 스테인이 있는 종이에 담겨 있으며, 분홍색 모란이 꽃무늬를 더합니다.

출처

https://www.cloudskillsboost.google/course_templates/1076/labs/584318

Introduction to Building Real-World AI Applications with Gemini and Imagen - Vertex AI의 Gemini를 사용하여 AI 이미지

이 실습에서는 Google의 Vertex AI SDK를 사용하여 강력한 Gemini 생성형 AI 모델과 상호작용하는 방법을 알아봅니다. 이를 통해 이미지에 대해 질문하고 유용한 텍스트 기반 대답을 받을 수 있습니다.

www.cloudskillsboost.google

저작자표시 비영리 (새창열림)

현재글[Imagen1/4] 1. Build an AI Image Recognition app using Gemini on Vertex (Vertex AI의 Gemini를 사용하여 AI 이미지 인식 앱 구축)

Android Databinding, git 브랜치, 안드로이드 코루틴, 안드로이드 컴포즈, android compose, 안드로이드 build 설정, gemini rag, SOLID 원칙, google skill boost, ai rag, SOLID 규칙, 코루틴, git branch, rxjava, git commit, git 원격, 안드로이드 build gradle, google skill boost image, google skill boost imagen, gemini code,

Today :
Yesterday :

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

nemo's dev memos