'Multimodal' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

목록Multimodal (1)

Nathaniel

1-1. GPT-4o 멀티모달 모델로 이미지 인식하여 답변 출력

GPT-4o 모델로 이미지 인식시켜서 답변을 출력해보려고 한다.GPT-4o는 이미지를 인식하는 기능이 들어가있다! Image_url 주소에 이미지 주소값을 넣으면Invoke 했을 때 출력되는 부분이 있는데 이때 사진의 표제목을 "LREM IPSUM DOLOR AMIS ENIMA ACCUMER TUNA"라고 읽어준다. OCR 기능이 제대로 작동 되고 있고, 그 외에 열 값에 해당하는 제목들을 읽어서 표에 해당하는 수치값들도 나타내준다. ※ 참고 이미지는 가급적 고해상도의 이미지를 넣어주면 OCR 기능이 제대로 동작하여 해당 텍스트를 잘 읽어들이는 것을 느낄 수 있다. 이미지가 웹 주소로 되어있지 않고 로컬에서의 가진 이미지로 해당 Invoke를 받았을 때 아래와 같이 OCR 처리 하는 것을 볼 수 있다..

AI 2025. 2. 25. 17:41

이전 Prev 1 Next 다음

목록Multimodal (1)

Nathaniel

티스토리툴바