유튜브 라이브 방송을 시청하신 적이 있다면, 시청자들이 후원(도네)하는 것을 보신 경험이 있을 것입니다.  이 때, 후원과 함께 짧은 메시지가 전달되고, 이를 읽는 일관된 성우의 음성을 들을 수 있습니다. 매번 다른 내용으로 후원을 보내는데, 어떻게 같은 성우의 음성으로 이것을 읽을 수 있을까요? 텍스트를 입력하면 이를 음성으로 바꾸어 주는 ‘TTS(Text-To-Speech)’기술을 통해 성우의 합성된 음성을 생성하기 때문에 이러한 경험이 가능했던 것입니다.

이 TTS기술을 적용한 서비스를 네이버에서 출시했습니다. 클로바 보이스CLOVA Voice는 원하는 목소리를 선택하고, 텍스트를 입력하면 이를 합성된 음성으로 들려줍니다. 주목하여 볼 만한 점은 HDTS(High-quality DNN Text-to-Speech)와 NES(Natural End-to-End Speech Synthesis)라는 기술이 적용되었다는 점입니다. 기존의 UTS(Unit-selection Text-to-Speech)방식은 합성음 생성을 위해 최소 40시간 이상의 음성 녹음이 필요했습니다. 반면, HDTS는 4시간, NES는 40분의 음성 녹음만으로도 높은 수준의 합성음을 생성할 수 있습니다. HDTS 방식으로 배우 유인나씨와 아나운서 오상진씨의 합성음을 재현하기도 했다고 하는데, CLOVA Voice 사이트에서 이 기술로 만든 합성음을 들어 보실 수 있습니다. 클로바 보이스는 네이버 뉴스, 오디오 북 등 음성기반 서비스들에 활용되고 있는데요, 영상 더빙과 관련한 서비스에도 적용되었습니다.

클로바 더빙CLOVA Dubbing은 텍스트를 입력하여 더빙 음성을 만들고, 이를 영상 속에 삽입할 수 있는 영상 편집 툴입니다.

사용 방법은 다음과 같습니다.
[STEP 1] ‘클로바 더빙 시작하기’를 누르고, 네이버에 로그인합니다.
[STEP 2] ‘새 프로젝트 시작하기’를 누릅니다.
[STEP 3] 더빙을 추가하려면 원하는 음성을 설정한 후, 텍스트를 입력하고 더빙 추가를 누릅니다. 동영상이나 이미지 등을 추가하여 자유롭게 영상을 편집합니다.
(Tip. N보이스 설정을 눌러 더 많은 보이스 옵션을 확인할 수 있습니다.)

더빙뿐만 아니라 효과음도 추가할 수 있고, 더빙 추가 전에 생성될 음성을 미리 듣는 것도 가능합니다. 한국어와 더불어 영어, 일본어, 중국어, 대만어를 지원하고 있습니다. 성별, 어조, 나이 등 다양한 옵션이 조합되어 있는 캐릭터들 중 원하는 캐릭터를 골라 합성음을 생성할 수 있습니다. 외국어로 영상 자료를 만들 때, 정확한 발음으로 정보전달을 원할 때, 본인 음성을 영상에 삽입하는 것이 부담스러울 때 등 다양한 상황에서 유용하게 사용하실 수 있을 것으로 생각합니다.

무료 체험버전은 최대 15,000자를 음성으로 전환할 수 있고, 20회까지 다운로드가 가능합니다. 더 긴 내용의 더빙이 필요하거나, 많은 동영상이 필요하다면 월 19,900원으로 스탠다드 버전 구독이 가능합니다. 상업적 활용을 원하시면 월 89,900원으로 프리미엄 버전을 구독해야 한다는 점 참고하시길 바랍니다.

인쇄하기

이전
다음
1+

소요 사이트를 방문해주셔서 고맙습니다. 액수에 관계없이 여러분의 관심과 후원이 소요 사이트를 유지하는 데 큰 힘이 됩니다. 후원금은 협동조합 소요 국민은행 037601-04-047794 계좌(아래 페이팔을 통한 신용카드결제로도 가능)로 후원하실 수 있습니다.