오픈AI, API에 새 음성 인텔리전스 기능 출시

OpenAI는 목요일 자사의 API에 개발자가 사용자와 대화하고, 기록하고, 번역할 수 있는 앱을 만드는 데 도움이 되도록 설계된 여러 가지 새로운 음성 인텔리전스 기능이 포함될 것이라고 밝혔습니다.

회사의 새로운 GPT‑Realtime‑2는 사용자와 대화할 수 있는 사실적인 음성 시뮬레이션을 만들기 위해 제작된 또 다른 음성 모델입니다.그러나 이전 버전(GPT-Realtime-1.5)과 달리 이 버전은 OpenAI가 말하는 GPT-5급 추론을 기반으로 구축되어 사용자의 더 복잡한 요청을 처리하기 위해 만들어졌습니다.

이 회사는 또한 말 그대로 사용자와 대화하면서 "속도를 맞추는" 실시간 번역 서비스를 제공하도록 설계된 GPT-Realtime-Translate를 출시할 예정입니다.이 기능에는 70개 이상의 입력 언어(이해할 수 있는 언어)와 13개 이상의 출력 언어(화자에게 전달하는 언어)가 포함되어 있습니다.

마지막으로 회사는 상호 작용이 발생할 때 캡처되는 실시간 음성-텍스트 기능을 사용자에게 제공하는 새로운 전사 기능인 GPT-Realtime-Whisper도 출시했습니다.

"우리가 출시하는 모델은 함께 실시간 오디오를 간단한 통화 및 응답에서 실제로 작업할 수 있는 음성 인터페이스로 이동합니다. 대화가 진행됨에 따라 듣고, 추론하고, 번역하고, 기록하고, 조치를 취합니다."라고 회사는 말했습니다.

이번 업데이트는 누구에게 유용할까요?고객 서비스 역량을 확장하려는 기업은 분명한 목표입니다.그러나 OpenAI는 또한 새로운 기능이 교육, 미디어, 이벤트, 제작자 플랫폼 등 다양한 영역에 도움이 될 것이라고 지적합니다.

이러한 도구는 기업의 관점에서 유용해 보이지만 잘못 사용될 수도 있습니다.회사는 스팸, 사기 또는 기타 형태의 온라인 남용을 생성하기 위해 새로운 기능이 남용되는 것을 방지하기 위해 가드레일을 구축했다고 말했습니다.OpenAI는 “유해한 콘텐츠 지침을 위반하는 것으로 감지되면 대화가 중단될 수 있도록 특정 트리거가 시스템에 내장되어 있습니다.”라고 말했습니다.

오픈AI, API에 새 음성 인텔리전스 기능 출시

관련 글