스타트업뉴스AI타임스
미소스, METR 자율성 평가서 '16시간' 기록..."측정 한계 돌파"
2026년 5월 11일0 조회
프리세일즈 활용 메모
이 IT피드는 공공조달 제안서 작성 시 시장동향, 기술 트렌드, 정책 환경 근거로 참고할 수 있도록 수집한 자료입니다.
AI의 자율성이 빠르게 향상되면서, 이제 AI가 인간 전문가의 ‘하루짜리 업무’를 독립적으로 수행할 수 있는 수준에 도달했다는 연구 결과가 나왔다. 비영리 AI 연구기관 METR는 8일(현지시간) 최근 '클로드 미소스 프리뷰(Claude Mythos Preview)' 초기 버전이 인간 전문가 기준 약 16시간이 걸리는 작업을 50% 성공률로 수행했다고 밝혔다.METR의 평가는 단순 벤치마크 점수가 아니라, AI가 얼마나 오랜 시간 인간 개입 없이 자율적으로 작업을 수행할 수 있는지를 측정하는 새로운 지표인 ‘작업 완료 시간 지평(t