Muokataan sivua Text2wave

Siirry navigaatioon Siirry hakuun
Varoitus: Et ole kirjautunut sisään. IP-osoitteesi näkyy julkisesti kaikille, jos muokkaat. Jos kirjaudut sisään tai luot tunnuksen, muokkauksesi yhdistetään käyttäjänimeesi ja saat paremman käyttökokemuksen.

Kumoaminen voidaan suorittaa. Varmista alla olevasta vertailusta, että haluat saada aikaan tämän lopputuloksen, ja sen jälkeen julkaise alla näkyvät muutokset.

Nykyinen versio Oma tekstisi
Rivi 25: Rivi 25:
Luo esimerkkitekstitiedosto seuraavalla komentorivikäskyllä:
Luo esimerkkitekstitiedosto seuraavalla komentorivikäskyllä:


  echo "Tämä teksti muutetaan puheäänitiedostoksi. Nythän tämä parani huomattavasti. Jos minut joskus opetetaan laulamaan. Niin teen teille sitten biiisin. Sitä ennen minun täytyy oppia kirjoittamaan ja puhumaan vielä paremmin. Huomaa minulla on tässä myös pieni ärrä vika. " > minuntekstini.txt
  echo "Tämä teksti muutetaan puheäänitiedostoksi" > minuntekstini.txt


Muuntaa tekstitiedoston [[wav]]-ääneksi. Huomaa, että tässä ei toimi äät, ööt ja erikoismerkit.
Muuntaa tekstitiedoston [[wav]]-ääneksi. Huomaa, että tässä ei toimi äät, ööt ja erikoismerkit.
Rivi 31: Rivi 31:
  text2wave -o minunääneni.wav minuntekstini.txt
  text2wave -o minunääneni.wav minuntekstini.txt


==Wav-muoto==
==Mp3 muoto==
Paras laatu
Luetaan ''minuntekstini.txt'' tiedostosta rivit, putkitaa ne muuta UTF-8 ISO-muotoon. Ajetaan '[[text2wave]] ohjelman läpi wav-muotoon ja pakataan [[lame]]lla mp3-muotoon. Tämä ensimmäinen esimerkki käyttää nais-ääntä. Ja tässä toimivat erikoismerkit.
 
Luetaan minuntekstini.txt tiedostosta rivit, putkitaa ne muuta UTF-8 ISO-muotoon. Ajetaan ''text2wave'' ohjelman läpi wav-muotoon.
cat minuntekstini.txt | iconv -f UTF-8 -t ISO8859-1 -c | text2wave -otype wav -eval '(language_finnish)' -o mies_ääni.wav
 
Parannetaan tiedoston laatua ajamalla se [[SoX]]-äänenmuuntimen läpi ja pakkaamalla se [[FLAC]]-tiedostoksi
 
[[sox]] mies_ääni.wav mies_ääni1.flac remix - norm -3 highpass 22 gain -3 rate 48k norm -3 dither
 
Todettu että äänisuotimien ja muuntimien läpi viety ääni, parantaa puhesynteesin laatua. Jää napsaudukset ja räsähdykset pois.
 
[[sox]] mies_ääni.wav mies_ääni2.flac remix - norm -7 highpass 10 gain -2 treble -40 rate 48k norm -5 dither contrast 4 echos 0.8 0.7 7 0.25 7 0.3
 
Lisää ohjaus komentoja löytyy [http://sox.sourceforge.net/sox.pdf SoX -oppasta].
 
Tungetaan kaikki nyt yhteen, kuuntele.flac tidostosta voit kuunnella sitten tulokset..
 
<syntaxhighlight lang="bash">
#!/bin/bash
cat minuntekstini.txt | iconv -f UTF-8 -t ISO8859-1 -c | text2wave -otype wav -eval '(language_finnish)' -o /tmp/ttv > /tmp/ttv2 && sox /tmp/ttv kuuntele.flac remix - norm -7 highpass 10 gain -2 treble -40 rate 48k norm -5 dither contrast 4 echos 0.8 0.7 7 0.25 7 0.3
</syntaxhighlight>
 
==Mp3-muoto==
Kelvollinen laatu. (Ääni räsähtää lopussa).
 
Luetaan ''minuntekstini.txt'' tiedostosta rivit, putkittaa ne muuta UTF-8 ISO-muotoon. Ajetaan '[[text2wave]] ohjelman läpi wav-muotoon ja pakataan [[lame]]lla mp3-muotoon. Tämä ensimmäinen esimerkki käyttää nais-ääntä. Ja tässä toimivat erikoismerkit.
   
   
  [[cat]] minuntekstini.txt | [[iconv]] -f UTF-8 -t ISO8859-1 -c | text2wave -otype wav -eval '(voice_suo_fi_lj_diphone)' -o - | [[lame]] - minun_nais_ääni.mp3
  [[cat]] minuntekstini.txt | [[iconv]] -f UTF-8 -t ISO8859-1 -c | text2wave -otype wav -eval '(voice_suo_fi_lj_diphone)' -o - | [[lame]] - minun_nais_ääni.mp3
Rivi 67: Rivi 42:
  [[cat]] *.mp3 > kaikki_yhteen.mp3
  [[cat]] *.mp3 > kaikki_yhteen.mp3
Kuunnellaan tiodosto käyttämällä komentorivillä toimivaa [[vlc]]:tä
Kuunnellaan tiodosto käyttämällä komentorivillä toimivaa [[vlc]]:tä
  [[nvlc]] kaikki_yhteen.mp3
  [[nvlc]] kaikki_yhteen.mp3  
 
==OGG Vorbis-muoto==
Huonoin laatu. (Liian nopea, orava ääni)


==OGG Vorbis muoto==
Nainen
Nainen
cat minuntekstini.txt | iconv -f UTF-8 -t ISO8859-1 -c | text2wave -otype wav -eval '(voice_suo_fi_lj_diphone)' -o - | [[oggenc]] -r -R 16000 -B 16 -C 2 - > recording.ogg
cat minuntekstini.txt | iconv -f UTF-8 -t ISO8859-1 -c | text2wave -otype wav -eval '(voice_suo_fi_lj_diphone)' -o - | [[oggenc]] -r -R 16000 -B 16 -C 2 - > recording.ogg


Mies
Mies
cat minuntekstini.txt | iconv -f UTF-8 -t ISO8859-1 -c | text2wave -otype wav -eval '(voice_hy_fi_mv_diphone)' -o - | oggenc -r -R 16000 -B 16 -C 2 - > recording.ogg
cat minuntekstini.txt | iconv -f UTF-8 -t ISO8859-1 -c | text2wave -otype wav -eval '(voice_hy_fi_mv_diphone)' -o - | oggenc -r -R 16000 -B 16 -C 2 - > recording.ogg


* Huomautuksia jos bitrate eli bittitaajuutta muuttaa suuremmaksi kuin -R 16000, ääni menee oravaksi ja nopeaksi. Äänenlaatua en vielä keksinyt miten sitä saisi parannettua, ogg koodekki ainakin muuttaa ääntä, tässä tapauksessa. Kokeilin myös reitittää sen jackille, mutta tietämys stdout reitittämisestä on liian vähäinen. En tiedä onnistuisiko se reitittää ja käsitellä lennosta.  
* Huomautuksia jos bitrate eli bittitaajuutta muuttaa suuremmaksi kuin -R 16000, ääni menee oravaksi ja nopeaksi. Äänenlaatua en vielä keksinyt miten sitä saisi parannettua, ogg koodekki ainakin muuttaa ääntä, tässä tapauksessa. Kokeilin myös reitittää sen jackille, mutta tietämys stdout reitittämisestä on liian vähäinen. En tiedä onnistuisiko se reitittää ja käsitellä lennosta.  


==Katso myös==
[[Luokka: Multimedia]]
* [[Esteettömyys]]
 
==Aiheesta muualla==
* [https://github.com/lahtis/SuoPuhe käyttäjä Lahtiksen] GitHub arkisto ja kokeilut.
 
[[Luokka:Puhesyntetisaattorit]]
Wikin materiaali on kaikkien vapaasti käytettävissä Creative Commons 3.0 - nimi mainittava -lisenssin alaisuudessa. TEKIJÄNOIKEUDEN ALAISEN MATERIAALIN KÄYTTÄMINEN ILMAN LUPAA ON EHDOTTOMASTI KIELLETTYÄ!

Muokataksesi tätä sivua vastaa alla olevaan kysymykseen (lisätietoja):

Peruuta Muokkausohjeet (avautuu uuteen ikkunaan)

Tällä sivulla käytetty malline:

Tämä sivu kuuluu seuraavaan piilotettuun luokkaan:

Noudettu kohteesta ”https://www.linux.fi/wiki/Text2wave