TTS
-
어설픈 인공지능 개발자(?)의 TTS 만들기Tech/머신러닝 2020. 4. 20. 09:40
텍스트만을 가지고 음성을 합성 해야 하는 일이 생겼다. 아직 인공지능 개발자라고 하기엔 남부끄러운 수준이고, 석사 박사들 처럼 전문가 스럽지 못하기 때문에 이 상황을 어떻게 해야할지 고민이 많아 졌다. Tacotron 2 tacotron 이라는 프로젝트가 있다. 간단하게 말하면 오디오 멜스펙토그램을 학습하여 유사한 음파를 합성하여 마치 말하는것과 같은 음성을 보여 주는것이다. 보통 tactron 관련된 블로그를 보면 아래 그림같은것들과 함께 네트워크 모델에 대한 설명들을 기본적으로 하고 있다. 하지만 , 난 솔직히 말하면 음성쪽 전문가가 될 생각도 없고 딱 필요한 부분까지만 사용할 예정이다. 그리고 아직 이 내용들을 이해할 노하우나 지식이 없다. 나중에 좀더 공부를 해야 하겠지만 그건 나중일 인거 같다...