스타트업뉴스AI타임스
"그리는 것이 곧 이해하는 것"…구글, 생성 AI로 비전 AI 역할까지 하는 '비전 바나나' 공개
2026년 4월 26일0 조회
프리세일즈 활용 메모
이 IT피드는 공공조달 제안서 작성 시 시장동향, 기술 트렌드, 정책 환경 근거로 참고할 수 있도록 수집한 자료입니다.
이미지 생성 모델이 단순히 ‘그림을 잘 만드는 AI’를 넘어, 시각 정보를 이해하는 범용 모델로 진화하고 있다는 연구 결과가 나왔다. 비전 AI와 생성 AI가 통합되는 신호로 해석된다.구글 딥마인드 연구진은 24일(현지시간) 이미지 생성 능력을 유지하면서도 의미론적 분할, 객체 분할, 단안 깊이 추정, 표면 법선 추정 등 다양한 시각 이해 작업을 수행하는 통합 모델 ‘비전 바나나(Vision Banana)’를 온라인 아카이브를 통해 공개했다. 연구진은 비전 바나나를 통해 이미지 생성 학습이 대형언어모델(LLM)의 사전 학습과 동일한