DEV

TTS(Text-To-Speech )

MasterJ 2013. 9. 4. 15:15

TTS(Text-To-Speech )



* 텍스트 를 음성으로 변환 하여  소리로 들려주는기능


* MS 에서 Win os에서 탑재가 되어있는 SAPI 를 사용할수 도 있다.

   이것은 win 내부에 엔진이 기본을 탑제 되어있는데  국적 별 음성 지원에 대해서는 음성  음원 패키지를 따로 다운로드 받아 설치하면 된다.

  window 버전에 따라서 내부에 기본으로 들어 있는 녀석들이 있는데 기본 eng 이고 win8 은 kor 도 포함되어있다.


많은 프로그램들이 ms 제공 기본 api 를 가지고 자사 개발 음원을 연결하여 좀더 부드러운 음성을 제공하기도한다.


Balabolka   와 같은 프로그램 등이 대표적  엔진 사용 프로그램과 음원은 별도 구매인경우가 많다.



* 로컬 엔진에만 의존보다는 웹을 통해서 하는 방법도 있다. 구글에서 tts 를 지원 하여 입력 한문자를 서버에서 처리하여 wav 형식의 파일로 제공하는 방법인데 써봐야알듯하다.



---- 자 tts 를 local 자사 프로그램에 추가를 해야 하는 상황이다.  ---


local win api SAPI 를 사용하고싶은데 xp~win8 가지 지원해야 하는상황에 음원은 서로 동일해야한다.

그럴려면 패키지 설치시 필요시 런타인 라이브러리와 음원 까지 설치해야되는데 용량도 클것같고 같은 엔진 버전으로 xp 도 사용가능할지 일단 의문.


xp 에서도 sp3 버전 이지만 sapi4 버전 까지 지원 가능하다   한국 음성 을 지원함.


wikipedia 에서 보니 microsoft speech api  sapi - 5.4 까지 나와있음

내가 사용하려는것은 sapi 4 이다.  하위 버전 호환 때문에 안전하게 ㅋㅋ 

생각 해보니 5.0 도 xp 를 지원하니  음질이 너무 구려서 5.0 으로 해야겟다 


웹 api 를 통해서 google 이나 ms 나 있긴 한것같은데   지역특성상 공인 인터넷망이 안되면 도루묵이니

로컬 패키지 형식으로 접근


speech api overview


The SAPI API provides a high-level interface between an application and speech engines. SAPI implements all the low-level details needed to control and manage the real-time operations of various speech engines.

The two basic types of SAPI engines are text-to-speech (TTS) systems and speech recognizers. TTS systems synthesize text strings and files into spoken audio using synthetic voices. Speech recognizers convert human spoken audio into readable text strings and files.

ms720151.SAPI5_Overview_Layers(en-us,VS.85).jpg



이렇다. ㅋㅋ  내용은 알아서 이해하고 시작


패키지 설치시 runtime lib 과 speech 음원을 설치 해줘야함 ㅋㅋ 꽤구림..


api 대충 보니 com 객체 를 사용하는 듯


일단 sdk 5.3 다운로드.   http://www.microsoft.com/downloads/details.aspx?FamilyID=5e86ec97-40a7-453f-b0ee-6583171b4530&DisplayLang=en



1. sdk 설치

2. 샘플확인


샘플을 빌드해본다.. 근데 sdk 에서 빌드에러가 엄청난다  으잉??????  일단 수정해주고


오  된다.  근데 xp 에서 될까 ...해보니 안된다.  난 xp~win8 까지지원해야된다  .. 드러워 우씨 .

xp 에서 지원 하기위해 서버 버전을 설치 한놈이있다. 근데 그럼 xp 에서 된다.  근데 내가 가지고 있는 기본샘플로 안되는것같다  그리고 구린게 dot.net framework 3.0이상 깔아주어야함 ㅡㅡㅡ; ...


* dotnet 3.0

http://www.microsoft.com/ko-kr/download/confirmation.aspx?id=25150    . all

* runtime framework   v11

http://www.microsoft.com/en-us/download/details.aspx?id=27225

* speech lib yumi

ㅡㅡ;....



5.0 이 괜찮긴한데  음성구하기가빡시구 xp 에서 안되 띠부럴 ... ㅡㅡ;


xp 는 버리겟다 .



참고 : http://jmnote.com/wiki/%EA%B5%AC%EA%B8%80_TTS_API#wget.EC.9C.BC.EB.A1.9C_mp3_.EB.8B.A4.EC.9A.B4.EB.A1.9C.EB.93.9C


http://en.wikipedia.org/wiki/Microsoft_Speech_API#SAPI_5.0


http://msdn.microsoft.com/en-us/library/ms720151(v=vs.85).aspx


블로그 참고 http://13blog.tistory.com/410

http://www.sysnet.pe.kr/Default.aspx?mode=2&sub=0&detail=1&wid=1228


'DEV' 카테고리의 다른 글

GIT REPO to GIT REPO 이사가기  (0) 2020.12.14
SVN 저장소를 GIT 으로 변환하기  (0) 2020.11.26
갑자기 다가온 그대 ZSH 지쉘 for mac  (0) 2020.07.13
화끈해진 라즈베리파이4  (0) 2019.12.11
라즈베리파이 git server 설치  (0) 2016.07.15