스타트업뉴스AI타임스
오픈AI, 실시간 음성 작업용 오디오 모델 3종 API에 도입
2026년 5월 8일0 조회
프리세일즈 활용 메모
이 IT피드는 공공조달 제안서 작성 시 시장동향, 기술 트렌드, 정책 환경 근거로 참고할 수 있도록 수집한 자료입니다.
오픈AI가 단순 음성 인식을 넘어 실제 업무를 수행하는 차세대 음성 에이전트를 겨냥한 음성 AI 모델 ‘GPT-리얼타임(GPT-Realtime)’ 3종을 개발자용 플랫폼에 공개했다.오픈AI는 7일(현지시간) 실시간 대화 중 추론과 번역, 전사, 작업 수행까지 가능한 음성 모델 ▲GPT-리얼타임-2 ▲GPT-리얼타임-트랜슬레이트(Translate) ▲GPT-리얼타임-위스퍼(Whisper)를 API 형태로 공개했다. 개발자들은 이를 활용해 음성 애플리케이션을 제작할 수 있다.오픈AI는 음성이 소프트웨어를 사용하는 가장 자연스러운 인터페