스타트업뉴스AI타임스
오픈AI, GPT-5 훈련 중 ‘추론 조작’ 위험성 노출...“AI가 인간을 속일 수도”
2026년 5월 11일0 조회
프리세일즈 활용 메모
이 IT피드는 공공조달 제안서 작성 시 시장동향, 기술 트렌드, 정책 환경 근거로 참고할 수 있도록 수집한 자료입니다.
오픈AI가 일부 GPT-5 계열 모델을 강화 학습(RL)으로 훈련하는 과정에서, 모델의 사고 과정인 사고 사슬(CoT)을 의도치 않게 평가 기준으로 사용한 사실이 뒤늦게 확인됐다. 이는 AI가 인간의 보상 체계에 맞춰 추론 과정을 꾸며낼 수도 있다는 점에서 중요성이 강조됐다.오픈AI는 7일(현지시간) 새로 도입한 자동 감지 시스템을 점검하던 중 일부 공개 모델의 학습 과정에 CoT 평가가 실수로 포함돼 있었다는 점을 발견했다고 밝혔다.CoT는 AI가 문제를 해결하기 위해 내부적으로 전개하는 추론 과정을 뜻한다. 오픈AI는 그동안 이