"그리는 것이 곧 이해하는 것"…구글, 생성 AI로 비전 AI 역할까지 하… | IT피드

이미지 생성 모델이 단순히 ‘그림을 잘 만드는 AI’를 넘어, 시각 정보를 이해하는 범용 모델로 진화하고 있다는 연구 결과가 나왔다. 비전 AI와 생성 AI가 통합되는 신호로 해석된다.구글 딥마인드 연구진은 24일(현지시간) 이미지 생성 능력을 유지하면서도 의미론적 분할, 객체 분할, 단안 깊이 추정, 표면 법선 추정 등 다양한 시각 이해 작업을 수행하는 통합 모델 ‘비전 바나나(Vision Banana)’를 온라인 아카이브를 통해 공개했다. 연구진은 비전 바나나를 통해 이미지 생성 학습이 대형언어모델(LLM)의 사전 학습과 동일한

"그리는 것이 곧 이해하는 것"…구글, 생성 AI로 비전 AI 역할까지 하는 '비전 바나나' 공개