'클로드 오퍼스 4.8' 딥SWE 벤치마크에 첫 등장...1위는 여전히 '… | IT피드

앤트로픽의 최신 모델 '클로드 오퍼스 4.8'이 새로운 코딩 벤치마크에 처음 포함됐지만, 'GPT-5.5'를 제치지는 못했다.스타트업 데이터커브는 30일(현지시간) AI 코딩 평가 시스템 ‘딥SWE(DeepSWE)’의 업데이트를 통해 클로드 오퍼스 4.8을 포함했다.이에 따르면, 클로드 오퍼스 4.8은 58%의 정답률을 기록, 이전 버전인 '클로드 오퍼스 4.7'의 54%와 'GPT-5.4'의 56%를 뛰어 넘었다. 그러나 기존 1위인 GPT-5.5의 70%와는 12%포인트 격차를 보였다.특히 GPT-5.5는 정답률뿐 아니라 비용과

'클로드 오퍼스 4.8' 딥SWE 벤치마크에 첫 등장...1위는 여전히 'GPT-5.5'