오픈AI, GPT-5 훈련 중 ‘추론 조작’ 위험성 노출...“AI가 인간… | IT피드

오픈AI가 일부 GPT-5 계열 모델을 강화 학습(RL)으로 훈련하는 과정에서, 모델의 사고 과정인 사고 사슬(CoT)을 의도치 않게 평가 기준으로 사용한 사실이 뒤늦게 확인됐다. 이는 AI가 인간의 보상 체계에 맞춰 추론 과정을 꾸며낼 수도 있다는 점에서 중요성이 강조됐다.오픈AI는 7일(현지시간) 새로 도입한 자동 감지 시스템을 점검하던 중 일부 공개 모델의 학습 과정에 CoT 평가가 실수로 포함돼 있었다는 점을 발견했다고 밝혔다.CoT는 AI가 문제를 해결하기 위해 내부적으로 전개하는 추론 과정을 뜻한다. 오픈AI는 그동안 이

오픈AI, GPT-5 훈련 중 ‘추론 조작’ 위험성 노출...“AI가 인간을 속일 수도”