Study Programming/Google AI기초공부(with CloudSkillBoost)

[RAG 0/4] Inspect Rich Documents with Gemini Multimodality and Multimodal RAG (Gemini 멀티모달 및 멀티모달 RAG로 리치 문서 검사하기)

네모메모 2025. 8. 30. 12:40
반응형

 

 

 

Inspect Rich Documents with Gemini Multimodality and Multimodal RAG 

(Gemini 멀티모달 및 멀티모달 RAG로 리치 문서 검사하기)

 

https://www.cloudskillsboost.google/course_templates/981

 

 


멀티모달 프롬프트를 사용하여 텍스트 및 시각적 데이터에서 정보 추출, 동영상 설명 생성, Gemini의 멀티모달 기능을 사용하여 동영상은 물론 그 밖의 추가 정보 검색, 텍스트와 이미지가 포함된 문서의 메타데이터 구축, 모든 관련 텍스트 청크 가져오기, Gemini의 멀티모달 검색 증강 생성(RAG)을 사용하여 인용 문구 인쇄 등이 있습니다.

 

 

총 실습 4개 

1) Multimodality with Gemini (Gemini의 멀티모달리티)

  • 이 실습에서는 결합된 텍스트, 이미지, 기타 데이터 유형을 이해하고 처리하는 Gemini의 기능을 다양한 실제 시나리오에서 적용하는 방법을 알아봅니다.

 

2)  Using Gemini for Multimodal Retail Recommendations
        (소매업을 위한 멀티모달 추천에 Gemini 사용)

  • 실습내용 설명 
  • 이 실습에서는 소매업을 위한 멀티모달 추천에 Gemini 2.0 Flash 모델을 사용하는 방법을 알아봅니다

 

3)  Multimodal Retrieval Augmented Generation (RAG) using the Gemini API in Vertex AI
       (Vertex AI의 Gemini API를 사용하는 멀티모달 검색 증강 생성(RAG))

  • 이 실습에서는 Vertex AI의 Gemini API를 사용하여 멀티모달 검색 증강 생성(RAG)을 수행하는 방법을 알아봅니다.

 

4) Inspect Rich Documents with Gemini Multimodality and Multimodal RAG: Challenge Lab
       (Gemini 멀티모달 및 멀티모달 RAG로 리치 문서 검사하기: 챌린지 실습)

  • 이 실습에서는 멀티모달 프롬프트를 사용하여 텍스트 및 시각적 데이터에서 정보를 추출하고 Gemini로 멀티모달 검색 증강 생성(RAG) 기능을 사용하여 모든 관련 텍스트를 찾고 인용 문구를 인쇄하는 방법에 대한 지식을 테스트합니다.

 

 

 


https://www.cloudskillsboost.google/course_templates/981 

 

Gemini 멀티모달 및 멀티모달 RAG로 리치 문서 검사하기 | Google Cloud Skills Boost

중급 <b>Gemini 멀티모달 및 멀티모달 RAG로 리치 문서 검사하기</b> 기술 배지 과정을 완료하여 다음 기술 역량을 입증하세요. 멀티모달 프롬프트를 사용하여 텍스트 및 시각적 데이터에서 정보 추

www.cloudskillsboost.google

 

 

 

 

 

반응형