스타트업뉴스AI타임스
아티피셜 애널리시스, ‘딥SWE’ 벤치마크 도입...'페이블 5' 코딩 1위 등극
2026년 6월 14일0 조회
프리세일즈 활용 메모
이 IT피드는 공공조달 제안서 작성 시 시장동향, 기술 트렌드, 정책 환경 근거로 참고할 수 있도록 수집한 자료입니다.
AI 성능 분석 기관 아티피셜 애널리시스(AA)가 ‘코딩 에이전트 지수(Coding Agent Index)’를 개편하면서 AI 코딩 에이전트 성능 순위에 큰 변화가 나타났다. 기존 평가 기준으로 사용되던 'SWE-벤치 프로'를 새로운 벤치마크인 ‘딥SWE(DeepSWE)’로 교체한 결과, 일부 모델의 순위가 뒤바뀌었으며 새롭게 출시된 클로드 페이블 5(Claude Fable 5)는 첫 평가에서 곧바로 정상에 올랐다.아티피셜 애널리시스는 12일(현지시간) 코딩 에이전트 지수에서 SWE-벤치 프로 대신 데이터커브(Datacurve)가
