SF / 과학 포럼
SF 작품의 가능성은 어떻게 펼쳐질 수 있을까요? 그리고 어떤 상상의 이야기가 가능할까요?
SF에 대한 가벼운 흥미거리에서부터 새로운 창작을 위한 아이디어에 이르기까지...
여기는 과학 소식이나 정보를 소개하고, SF 속의 아이디어나 이론에 대한 의견을 나누며, 상상의 꿈을 키워나가는 곳입니다.
( 이 게시판은 최근에 의견이나 덧글이 추가된 순서대로 정렬됩니다. )
출처:
https://google.github.io/tacotron/publications/tacotron2/index.html
이번에 구글에서 공개한 문장 - 음성 변환기 타코트론 2의 모델 개요도
이번에 구글에서 공개한 문장 - 음성 변환기 타코트론 2는 다음의 특징을 가진다.
1. 다양한 분야에서 쓰이는 용어와
복잡한 단어들을 정확하게 발음한다.
“Generative adversarial network or variational auto-encoder.”
https://google.github.io/tacotron/publications/tacotron2/demos/gan_or_vae.wav
“Basilar membrane and otolaryngology are not auto-correlations.”
https://google.github.io/tacotron/publications/tacotron2/demos/basilar.wav
2. 어구의 의미에 따라 단어의 발음이
달라진다.
(아래 예제에서 타코트론 2가 영어단어 read를 어떻게 발음하는지 주목)
“He has read the whole thing.”
https://google.github.io/tacotron/publications/tacotron2/demos/read_past.wav
“He reads books.”
https://google.github.io/tacotron/publications/tacotron2/demos/reads.wav
“Don't desert me here in the desert!”
https://google.github.io/tacotron/publications/tacotron2/demos/desertdesert.wav
“He thought it was time to present the present.”
https://google.github.io/tacotron/publications/tacotron2/demos/presentpresent.wav
또한 타코트론 2는 오타가 난 단어도 올바르게 발음한다.
“Thisss isrealy awhsome.”
https://google.github.io/tacotron/publications/tacotron2/demos/awhsome.wav
타코트론 2은 구두점에 반응한다.
(아래 예제에서 쉼표의 위치에
따라 타코트론 2의 운율이 바뀜에 주목)
“This is your personal assistant, Google Home.”
https://google.github.io/tacotron/publications/tacotron2/demos/ghome_comma.wav
“This is your personal assistant Google Home.”
https://google.github.io/tacotron/publications/tacotron2/demos/ghome_nocomma.wav
타코트론 2는 강조와 억양을 학습한다.
(대문자로 시작하는 단어의 경우
강조를 하도록 가르쳤다. 따라서 어떤 단어를 대문자로 바꾸면 전체적인 억양이 바뀐다)
“The buses aren't the problem, they actually provide a solution.”
https://google.github.io/tacotron/publications/tacotron2/demos/bus_nostress.wav
“The buses aren't the PROBLEM, they actually provide a SOLUTION.”
https://google.github.io/tacotron/publications/tacotron2/demos/bus_stress.wav
문장을 질문으로 바꿀 경우에는
타코트론 2의 운율도 같이 바뀐다.
“The quick brown fox jumps over the lazy dog.”
https://google.github.io/tacotron/publications/tacotron2/demos/fox_period.wav
“Does the quick brown fox jump over the lazy dog?”
https://google.github.io/tacotron/publications/tacotron2/demos/fox_question.wav
타코트론 2는 잰말놀이(tongue twister)에 능숙하다.
“Peter Piper picked a peck of pickled peppers. How many pickled
peppers did Peter Piper pick?”
https://google.github.io/tacotron/publications/tacotron2/demos/peterpiper.wav
“She sells sea-shells on the sea-shore. The shells she sells are sea-shells I'm sure.”
https://google.github.io/tacotron/publications/tacotron2/demos/seashells.wav
추가예제
“Talib
Kweli confirmed to AllHipHop that he will be releasing an album in the next
year.”
https://google.github.io/tacotron/publications/tacotron2/demos/kweli.wav
“The blue lagoon is a nineteen eighty American romance adventure film.”
https://google.github.io/tacotron/publications/tacotron2/demos/bluelagoon.wav
“Tajima Airport serves Toyooka.”
https://google.github.io/tacotron/publications/tacotron2/demos/tajima.wav
오래전에 TTS 기계 음성을 처음 접해보고 SF 영화속 인공지능이나 전격 Z 작전의 수준까지 가려면 시간이 많이 필요할 것 같다고 생각했는데...
이제 그게 현실로 다가왔다는 걸 느끼게 되는군요.