스타트업뉴스AI타임스
"코딩은 29배, 추론은 7배"…세레브라스, '키미' 서비스로 GPU 압도
2026년 5월 25일0 조회
프리세일즈 활용 메모
이 IT피드는 공공조달 제안서 작성 시 시장동향, 기술 트렌드, 정책 환경 근거로 참고할 수 있도록 수집한 자료입니다.
AI 칩 전문 세레브라스가 문샷 AI의 1조 매개변수 오픈웨이트 모델 ‘키미 K2.6’을 기업 고객 대상으로 서비스하기 시작했다. 초당 약 1000토큰에 달하는 추론 속도를 달성하며 GPU 기반 AI 인프라 대비 압도적인 성능 우위를 내세우고 있다. 세레브라스는 최근 키미 K2.6을 기업 고객 시험 운영 환경에서 구동한 결과, 벤치마크 기업 아티피셜 애널리시스 기준 초당 981개 출력 토큰을 기록했다고 밝혔다.이는 GPU 기반 클라우드 서비스 가운데 가장 빠른 경쟁사보다 6.7배, 업계 평균 대비 23배 빠른 수치다.특히, 에이전트
