[4월24일] "GPT-5.5가 더 정직해서 클로드 4.7를 이겼다?"..… | IT피드

샘 알트먼 오픈AI CEO는 'GPT-5.5'를 출시한 직후 X를 통해 앤돈 랩스(Andon Labs)의 게시물을 공유했습니다. 새로운 모델이 안돈 랩스의 '벤딩벤치 아레나(Vending-Bench Arena)'에서 앤트로픽의 '클로드 오퍼스 4.7'을 이겼다는 내용이었습니다.벤딩벤치는 AI에게 벤딩머신 운영을 맡겼을 경우, 얼마나 많은 수익을 낼 수 있는지 테스트하는 것입니다. 앤돈 랩스는 지난해 앤트로픽 매점 운영을 '클로드'에게 맡긴 실험으로 잘 알려져 있습니다.이에 따르면, GPT-5.5는 이 실험에서 7980달러를 벌어,

[4월24일] "GPT-5.5가 더 정직해서 클로드 4.7를 이겼다?"...'벤딩벤치'가 보여준 전략의 차이