안녕하세요, 비즈니스노트입니다. 이번 포스팅에서는 인공지능 기술을 활용한 AI 더빙 서비스를 비교해보려고 합니다. 지난번 AI를 활용한 쇼츠 만들기 포스팅에서도 말씀드렸듯이, ‘한국어’로 더빙하는데는 약간의 아쉬움이 있었죠. 아무래도 주요 개발사들이 외국계 기업들이다보니 상대적으로 한국어에 대한 학습이 많이 진행되지 않아서 그런 것 같아요.
한국어로 최대한 자연스러운 더빙을 제공하는 서비스를 찾아보다가, 기존에 자동자막생성기술로 알려진 VREW 역시 더빙기능을 제공한다는 것을 알게되었습니다.
그래서 이번 포스팅에서는 이 두 가지 AI 더빙서비스를 직접 비교해볼까 합니다.
1. AI 더빙 대본 작성
우선 테스트에 사용될 대본을 작성해보겠습니다. 실제로 쇼츠를 만들어본다고 생각하고, 그냥 생각나는 관심사를 중심으로 챗GPT에 대본 작성을 요청했습니다.
이렇게 요청했습니다. 60초, 쇼츠, 논문 연구결과, 간단한 팁. 이게 핵심 키워드입니다. 결과는?
오, 그냥 ‘대본’만 기대했는데, 대략적인 스크립트를 만들어줬네요. 이제 챗GPT의 성능은 정말 신뢰가 갑니다!
이 스크립트에서 대괄호로 설명하는 부분을 제외하고 순수하게 대본만 따로 정리한 후에 ‘발표시간 계산기’에 넣고 대략적인 플레이 시간을 확인해보겠습니ㅏㄷ.
43초!
이 정도 시간이면 BGM 깔고 쇼츠 앞뒤로 약간씩 여유를 두면 60초 이내 영상을 만들기 충분할 듯 합니다.
그럼 이렇게 만들어진 대본으로 AI서비스 두 곳에서 직접 결과물을 생성해보겠습니다. 문장 단위로 잘라서 하면 좀 더 완성도가 높아진다고는 하지만, 객관적인 비교를 위해 작성된 대본을 통째로 입력해서 결과물을 비교해보겠습니다.
2. 일레븐랩스 더빙
이렇게 세팅해놓고, 제작 시작!!
여성 성우의 목소리로 제작을 했습니다. 순식간에 완성!! 결과는 아래와 같습니다.
깨끗하게 잘 녹음되기는 했는데, 약간 부자연스러운 느낌은 있습니다. 마치 한국어를 오랫동안 공부한 외국인이 더빙한 것 같은 느낌입니다. 많은 분들이 현존하는 최고의 AI더빙 서비스라고 하는데, 이게 최고 성능이라 가정하고 VREW의 결과물과 비교해봐야겠네요.
3. VREW 더빙
다음은 VREW로 테스트 해보겠습니다. 최대한 비슷한 환경에서 결과물을 만들기 위해 ‘여성’목소리를 선택했고, 역시나 문장 단위가 아니라 전체 대본을 통째로 올려서 제작했습니다.
일단 VREW는 약간은 사용자 친화적으로 구성되어 있습니다. 성우들의 이름도 있고, 각 성우들의 목소리톤이나 분위기 등도 간단하게 표시되어 있습니다. 가장 마음에 드는 여성 성우의 목소리를 선택한 후 제작 시작! 결과물은 다음과 같습니다.
오! 주관적인 만족도일 수 도 있지만, 저는 개인적으로 VREW의 결과물이 훨씬 더 자연스럽게 느껴집니다. 단어 발음이나 연음 등의 처리가 좀 더 자연스럽게 되어 있습니다. 별도로 수정작업을 할 필요없이 바로 사용해도 될 정도의 완성도네요!
4. 결론
이번 포스팅에서는 AI더빙서비스의 대표주자인 일레븐랩스와 자동자막생성을 시작으로 영상관련 다양한 서비스를 제공하는 VREW간 한글더빙 성능을 테스트 해봤습니다. 위에서 다들 들으셨겠지만, 둘 다 모두 훌륭한 서비스이기는 하지만, 한글 발음을 자연스럽게 구현하는 것은 VREW쪽이 좀 더 낫지 않았나 싶습니다.
일단 저는 앞으로 한글로된 콘텐츠를 생성할 때는 VREW의 AI 더빙 기능을 활용하지 싶습니다. 저처럼 인공지능을 활용해서 콘텐츠를 만들고 싶은 분은 참고해주세요~ AI를 활용해서 더 좋은 컨텐츠들이 많이 만들어지기를 바라며, 이번 포스팅 마치겠습니다. 끝까지 읽어주셔서 감사합니다!