Синтез речи в Linux (2020)

Основные параметры: espeak , Gnuspeech , spd-say , MBROLA, PicoTTS и проект festvox который фестиваль и флит являются частью. Я обнаружил, что espeak – самая простая в использовании система, но Festival дает наилучшие результаты при использовании правильных голосов. В этом посте будут описаны различные способы использования фестиваля и шаги, необходимые для достижения хороших результатов.

Использование

Фестиваль установки:

   sudo  apt-get  установить  фестиваль festvox-us-slt-hts  

Используйте интерактивный режим фестиваля:

  фестиваль  - я  фестиваль>  ( voice.list )  фестиваль>  ( voice_cmu_us_slt_arctic_hts )  фестиваль>  ( SayText  «Не ненавидь меня.  е, я просто делаю свою работу! " )  фестиваль> (вступление)   

Запускать команды из файла:

  фестиваль> (нагрузка  "hello.scm"  )   

Использовать пакетный режим фестиваля:

  фестиваль  - b   '(voice_cmu_us_slt_arctic_hts)'      '(SayText «Температура 22 градусов по Цельсию и легкий ветерок с запада. ") '  

Используйте пакетный режим фестиваля для запуска файл:

  фестиваль  -b  hello.scm  

Вставьте текст в режим tts фестиваля:

   эхо  привет |  фестиваль  - tts    

Передать текст в режим tts фестиваля из Python с подпроцессом:

 из  подпроцесс  Импортировать ТРУБКА ,   Popen   текст   знак равно  «Мы любим Raspberry».  процесс  знак равно  Popen   ( ,   stdin  знак равно ТРУБКА )  процесс .   stdin  .  записывать (  текст   +   '   n   ' )  процесс .   stdin  .  близко() процесс  . ждать  ()   

Используйте Python-оболочку фестиваля C ++ API:

   sudo  apt  install  festival-dev pip  install  git + https: //github.com/krisfris/pyfestival  
 Импортировать  фестиваль   фестиваль  .   sayText   ( 'Привет')    

Festival также имеет C, C ++ и клиент-серверный API. См. API .

Голоса

voice_cmu_us_slt_arctic_hts голос (использованный выше) может быть установлен легко и неплохо, но голоса Nitech HTS лучше. HTS означает система синтеза речи на основе скрытой модели Маркова , а Nitech - Технологический институт Нагои.

На момент написания этого поста голоса не были доступны на исходном сайте, поэтому я загрузил их в репозиторий GitHub.

   # Клонируйте репозиторий github с голосами  git clone git@github.com: krisfris / nitech-hts-voices.git  # Войдите в каталог   cd  nitech-hts-voices  # Извлечь файлы   для банка  `  ls   ` ;   делать   tar  xvf  $ t  ;  сделано  # Установить голоса   sudo mkdir   - p  / usr / поделиться / фестиваль / голоса / нас  sudo mv  lib / voices / us /   / usr / share / festival / voices / us /  sudo mv  lib / hts.scm /usr/share/festival/hts.scm  # Список всех доступных голосов   для  d  в   `  ls  / usr / share / festival / voices  ` ;  делать  ls   «https://darkshadow.io/usr/share/festival/voices/ $ {  d  }   " ;  сделано  

Чтобы установить голос в качестве голоса по умолчанию, отредактируйте / etc / festival.scm и добавьте следующую строку:

   ( установленный!  voice_default  'voice_nitech_us_rms_arctic_hts)   

Примечание: Голоса Nitech несовместимы с фестивальными версиями выше 2.1, которые из 2010. Версия фестиваля по умолчанию в Ubuntu 28. 04 равно 2,5.

Flite

Flite небольшой , быстрый и более портативный (хотя и менее настраиваемый) механизм синтеза речи для фестивальных голосов. Установите его с помощью sudo apt install flite . Загрузить другие голоса:

   cd mkdir  .config / flite && CD  .config / flite wget  -r   - нет -parent   - нет -каталоги   - принять  flitevox http://www.festvox.org/flite/packed/flite-2.0/voices/  эхо   «Привет, мир!»  |  flite  - голос  ./ cmu_us_axb.flitevox   

Обратной стороной является то, что вы не можете использовать голоса с фестиваля с помощью flite. напрямую. Вместо этого вам нужно будет преобразовать их вручную, что потребует времени и знаний программирования. См.

Преобразование голосов FestVox .

Лично я бы придерживался фестиваля, если на самом деле не требуются скорость и небольшой размер флайта.

Emacs

В руководстве по фестивалю упоминается простой способ использования фестиваля из emacs. См.

Интерфейс Emacs .

Существует также пакет ubuntu под названием eflite , который является сервером emacspeak, основанным на flite.

Заключение

Поскольку голоса Nitech не работают с более новыми версиями фестиваля, вам придется довольствоваться cmu_us_slt_arctic_hts голос . Если вы не против коммерческого использования, используйте

AWS Polly , вероятно, лучший выбор.

https://askubuntu.com/questions/ 53896 / преобразование текста в речь с естественным звуком

http://www.cstr.ed.ac.uk/projects/festival/manual/festival_t oc.html

https://ubuntuforums.org/showthread. php? t =

Leave a comment

Your email address will not be published. Required fields are marked *

10 + sixteen =