스타트업뉴스AI타임스
[4월24일] "GPT-5.5가 더 정직해서 클로드 4.7를 이겼다?"...'벤딩벤치'가 보여준 전략의 차이
2026년 4월 25일0 조회
프리세일즈 활용 메모
이 IT피드는 공공조달 제안서 작성 시 시장동향, 기술 트렌드, 정책 환경 근거로 참고할 수 있도록 수집한 자료입니다.
샘 알트먼 오픈AI CEO는 'GPT-5.5'를 출시한 직후 X를 통해 앤돈 랩스(Andon Labs)의 게시물을 공유했습니다. 새로운 모델이 안돈 랩스의 '벤딩벤치 아레나(Vending-Bench Arena)'에서 앤트로픽의 '클로드 오퍼스 4.7'을 이겼다는 내용이었습니다.벤딩벤치는 AI에게 벤딩머신 운영을 맡겼을 경우, 얼마나 많은 수익을 낼 수 있는지 테스트하는 것입니다. 앤돈 랩스는 지난해 앤트로픽 매점 운영을 '클로드'에게 맡긴 실험으로 잘 알려져 있습니다.이에 따르면, GPT-5.5는 이 실험에서 7980달러를 벌어,