Синтезатор речи голос. Синтезаторы речи Text to Speech (TTS)

Синтезаторы речи, или преобразователи текста в голос, — специальные сервисы, позволяющие автоматически воспроизводить написанный текст на выбранном языке. Работать с такими сайтами просто, достаточно скопировать либо ввести вручную нужный текст в окно и выбрать язык – сервис автоматически преобразует написанное в звук.

Синтезаторы речи онлайн

Синтезаторы речи часто используются людьми, которые изучают иностранные языки. Довольно сложно найти в сети специальные материалы для аудирования, позволяющие научиться воспринимать устную иностранную речь на слух, куда проще вставить нужный отрывок текста на сайт и прослушать либо скачать преобразованный файл на компьютер.

Способ 1: Acapela

Довольно качественный сервис для синтеза речи с набором нескольких голосов мужского и женского типа. Поддерживает и воспроизводит русский язык. К достоинствам можно отнести отсутствие платы за использование. С сайтом вы легко сможете попрактиковаться в понимании нужного языка на слух. Готовый аудиофайл имеет довольно высокое качество.

Что касается недостатков, то один из них заключается в ограниченном объеме текста, который может быть прочитан синтезатором (всего 300 символов). Для доступа к дополнительным функциям и скачиванию файлов нужно пройти регистрацию на сайте.

Работать с сервисом довольно просто, даже в том случае, если вы не знаете английский язык.

Способ 2: Google Переводчик

Удобный сервис для воспроизведения написанного текста. Способен самостоятельно определять, на каком языке написан текст, кроме того, можно перевести нужный отрывок и воспроизвести его. Из достоинств — полная поддержка русского языка, а также понятный и минималистичный дизайн. Регистрации сервис не требует, синтез текста занимает считанные секунды. Синтезатор способен читать довольно длинные тексты, ограничение – 5000 символов.


В отличие от прошлого ресурса, в переводчике нельзя выбирать голос синтезатора. Воспроизведение ведется стандартным женским голосом.

Способ 3: Text to speech

Еще один ресурс, который позволит преобразовать написанный текст в устную речь. Сайт полностью на английском языке, однако разобраться в его функционале несложно. К достоинствам можно отнести возможность перевода текста, выбор нужного языка и настройку скорости чтения текста.

Недостатков при использовании обнаружено не было. Есть ограничения на размер текста в размере 100 символов.


Сайт работает быстро, без задержек и позволяет быстро преобразовать написанный текст в голос. Синтезатор иногда делает ошибки в словах и неправильно расставляет ударения. Логические паузы, как и на других подобных сайтах, отсутствуют.

Мы рассмотрели наиболее функциональные и удобные сервисы для преобразования текста в голосовые файлы. Если вы хотите порекомендовать какой-то другой сайт с синтезатором речи онлайн, обязательно напишите об этом в комментариях.

Сегодня синтезаторы речи, применяемые в стационарных компьютерных системах или мобильных устройствах, чем-то необычным уже не кажутся. Технологии шагнули далеко вперед и позволили воспроизвести человеческий голос. Как все это работает, где применяется, каков лучший речевой синтезатор и с какими потенциальными проблемами может столкнуться пользователь, смотрите ниже.

Что представляют собой речевые синтезаторы и где они применяются?

Синтезаторы речи представляют собой специальные программы, состоящие из нескольких модулей, которые позволяют переводить набранный на клавиатуре текст в обычную человеческую речь в виде звукового сопровождения.

Было бы наивно полагать, что сопутствующие библиотеки содержат абсолютно все слова или возможные фразы, записанные в студиях реальными людьми. Это просто физически невозможно. К тому же библиотеки фраз имели бы такой размер, что установить их даже на современные винчестеры большого объема, не говоря уже о мобильных девайсах, просто не представлялось бы возможным.

Для этого была разработана технология, получившая название Text-to-Speech (перевод текста в речь).

Наиболее широкое распространение синтезаторы речи получили в нескольких областях, к которым можно отнести самостоятельное изучение иностранных языков (программы нередко имеют поддержку в 50 языков и более), кода нужно услышать правильное произношение слова, прослушивание текстов книг вместо чтения, создание речевых и вокальных партий в музыке, использование их людьми с ограниченными возможностями, выдача поисковых запросов в виде озвученных слов и фраз и т. д.

Разновидности программ

В зависимости от области применения, все программы можно разделить на два основных типа: стандартные, непосредственно преобразующие текст в речь, и речевые или вокальные модули, применяемые в музыкальных приложениях.

Для более полного понимания картины рассмотрим оба класса, но больший упор будет сделан все-таки на синтезаторы речи в их непосредственном назначении.

Плюсы и минусы простейших речевых приложений

Что же касается преимуществ и недостатков программ такого типа, сначала рассмотрим все-таки недостатки.

Прежде всего нужно четко понимать, что компьютер - он и есть компьютер, который на данном этапе развития человеческую речь может синтезировать весьма приблизительно. В простейших программах зачастую наблюдаются проблемы с постановкой ударений в словах, пониженное качество звука, а в мобильных устройствах - повышенное энергопотребление, а иногда и несанкционированная загрузка речевых модулей.

Но и преимуществ хватает, ведь очень многие звуковую информацию воспринимают гораздо лучше, нежели визуальную. Удобство восприятия налицо.

Как пользоваться синтезатором речи?

Теперь несколько слов об основных принципах использования программ такого типа. Установить синтезатор речи любого типа можно без особых проблем. В стационарных системах используется стандартный инсталлятор, где основной задачей станет выбор поддерживаемых языковых модулей. Для мобильных девайсов установочный файл можно скачать из официального магазина или хранилища вроде Google Play или AppStore, после чего приложение инсталлируется в автоматическом режиме.

Как правило, при первом запуске никаких настроек, кроме установки языка по умолчанию, производить не нужно. Правда, иногда программа может предложить выбрать качество звучания (в стандартном варианте, применяемом повсеместно, частота дискретизации 4410 Гц, глубина 16 бит и битрейт 128 кбит/с). В мобильных устройствах эти показатели ниже. Тем не менее за основу берется определенный голос. С использованием стандартного шаблона произношения путем применения фильтров и эквалайзеров достигается звучание именно такого тембра.

В использовании можно выбрать несколько вариантов перевода вручную, озвучивание уже имеющего текста из файла, интеграция в другие приложения (например, веб-браузеры) с активацией выдачи поисковых результатов или прочтения текстового содержимого на страницах онлайн. Достаточно выбрать нужный вариант действий, язык и голос, которым все это будет произноситься. Многие программы имеют несколько разновидностей голосов: как мужских, так и женских. Для активации процесса воспроизведения обычно используется кнопка старта.

Если говорить о том, как отключить синтезатор речи, тут может быть несколько вариантов. В самом простом случае используется кнопка остановки воспроизведения в самой программе. В случае интеграции в браузер деактивация производится в настройках расширений или полным удалением плагина. А вот с мобильными устройствами, несмотря на непосредственное отключение, могут быть проблемы, о которых будет сказано отдельно.

В музыкальных программах настройки и ввод текста намного сложнее. Например, в приложении FL Studio есть свой речевой модуль, в котором можно выбрать несколько изменить настройки тональности, скорости воспроизведения и т. д. Для постановки ударений перед слогом используется символ «_». Но и такой синтезатор годится только для создания роботизированных голосов.

Но вот пакет Vocaloid от Yamaha относится к программам профессионального типа. Технология Text-to-Speech здесь реализована в наиболее полном объеме. В настройках, помимо стандартных параметров, можно выставить артикуляцию, глиссандо, использовать библиотеки с вокалом профессиональных исполнителей, составлять слова и фразы, подгоняя их под ноты, и еще кучу всего. Неудивительно, что пакет только с одним вокалом занимает порядка 4 Гб и более в установочном дистрибутиве, а после распаковки - вдвое-втрое больше.

Синтезаторы речи с русскими голосами: краткий обзор самых популярных

Но вернемся к самым простым приложениям и рассмотрим самые популярные из них.

RHVoice - по мнению большинства экспертов, лучший синтезатор речи, являющийся российской разработкой авторства В стандартном варианте доступно три голоса (Александр, Ирина, Елена). Настройки просты. А само приложение может использоваться и как самостоятельная программа, совместимая с SAPI5, и как экранный модуль.

Acapela - достаточно интересное приложение, главной особенностью которого является почти идеальная озвучка текста более чем на 30 языках мира. В обычной версии, правда, доступен только один голос (Алена).

Vocalizer - мощное приложение с женским голосом Milena. Очень часто эта программа применяется в call-центрах. Имеется множество настроек постановки ударения, громкости, скорости чтения и установки дополнительных словарей. Главное отличие состоит в том, что речевой движок может встраиваться в программы вроде Cool Reader, Moon+ Reader Pro или Full Screen Caller ID.

Festival - мощнейшая утилита синтеза и распознавания речи, созданная для систем Linux и Mac OS X. Приложение поставляется с открытым исходным кодом и, помимо стандартных языковых пакетов, имеет поддержку даже финского языка и хинди.

eSpeak - речевое приложение, поддерживающее более 50 языков. Главным недостатком считается сохранение файлов с синтезированной речью исключительно в формате WAV, который занимает уж очень много места. Зато программа является кроссплатформенной и может использоваться даже в мобильных системах.

Проблемы с синтезатором речи в Google Android

При установке «родного» синтезатора речи от Google, пользователи постоянно жалуются на то, что он самопроизвольно включает загрузку дополнительных языковых модулей, что может не только занимать достаточно длительный промежуток времени, но еще и расходует трафик.

Избавиться от этого в Android-системах можно очень просто. Для этого используем меню настроек, далее переходим в раздел языка и голосового ввода, выбираем голосовой поиск и на параметре распознавания речи оффлайн нажимаем на крестик (отключение). Дополнительно рекомендуется почистить кэш приложений и перезагрузить устройство. Иногда может потребоваться в самом приложении отключить показ уведомлений.

Что в итоге?

Поводя некий итог, можно сказать, что в большинстве случаев рядовым пользователям подойдут самые простые программы. Во всех рейтингах лидирует RHVoice. Но для музыкантов, которые хотят добиться естественного звучания голоса, чтобы разница между живым вокалом и компьютерным синтезом не ощущалась на слух, лучше отдать предпочтение программам типа Vocaloid, тем более что для них выпускается множество дополнительных голосовых библиотек, а настройки имеют столько возможностей, что примитивные приложения, как говорится, и рядом не стояли.

На сегодняшний день называется технология, способная преобразовывать текстовую информацию в обычную речь. С развитием "умных машин" эта технология становится всё более актуальной, и с каждым днём требует всё большего совершенства. Собственно, на данный момент разработан целый ряд методов синтеза речи, о которых мы и будем говорить.

Синтезаторы речи могут применяться в абсолютно различных сферах, и используются для решения множества задач, начиная от "начитывания" книг, производства "говорящих" детских игрушек, объявления остановок в общественном транспорте или в системах сервисных служб, и заканчивая медициной (тут стоит вспомнить о Стивене Хокинге , пользующемся синтезатором речи для связи с миром).

Итак, рассмотрим подробнее технологию и методы синтеза речи. Как уже упоминалось, существует несколько методов синтеза речи. Таким образом, можно выделить несколько основных подходов:

  • параметрический синтез;
  • конкатенативный (компиляционный) синтез;
  • синтез по правилам (по печатному тексту);

Параметрический синтез позволяет записывать речь для любого языка, однако его нельзя применять для не заданных заранее текстов. Параметрический синтез речи применяют тогда, когда набор сообщений ограничен. Качество же такого метода синтеза может быть очень высоким.

По сути дела, параметрический синтез речи - это реализация принципа работы вокодера . В случае параметрического синтеза звуковой сигнал представлен определённым числом непрерывно изменяющихся параметров. Для формирования гласных звуков используется генератор тонального сигнала, для согласных - генератор шума. Но такой метод обычно применяют для записи голоса в музыкальных композициях, и чаще речь идет даже не о чистом синтезе голоса, а, скорее, о модуляции.

Метод компиляционного синтеза основывается на составлении текстов из заранее записанного "словаря" элементов. Размер элемента системы должен быть не менее слова. Обычно запас элементов ограничивается несколькими сотнями слов, а содержание синтезируемых текстов - объёмом словаря. Этот метод синтеза речи широко используется в повседневной жизни - как правило, в различных справочных службах и технике, требующей оснащения системами речевого ответа.

Полный синтез речи по правилам может воспроизводить речь по заранее неизвестному тексту. Этот метод не использует элементов человеческой речи, а базируется на запрограммированных лингвистических и акустических алгоритмах .

Тут также существует своё разделение - можно выделить два подхода к этому методу синтеза. Первый - это формантный синтез речи по правилам, а второй - артикуляторный синтез. Формантный синтез базируется на формантах - частотных резонансах речевой акустической системы. Алгоритм формантного синтеза моделирует работу речевого тракта человека, работающего как набор резонаторов. Сегодня, к сожалению, большинство синтезаторов , работающих исключительно на формантном синтезе, понять без подготовки сложно, но, несомненно, это универсальная и перспективная технология. Артикуляторный метод пытается доработать недостатки формантного путем добавления в модель фонетических особенностей произнесения отдельных звуков.

Также существует технология синтеза речи по правилам, которая использует записанные отрезки естественной речи. Поскольку всё-таки чаще всего применяются компиляционные методы, скажем о них пару слов подробнее.

В зависимости от того, насколько велики "отрывки" речи, используемые для синтеза, выделяют такие типы синтеза:

  • микросегментный (микроволновый);
  • аллофонический;
  • дифонный;
  • полуслоговой;
  • слоговой;
  • синтез из единиц произвольного размера.

Чаще всего используются аллофонический и дифонный методы. Для дифонного метода синтеза речи базовыми элементами являются всевозможные двучленные комбинации фонем, а для аллофонного - сочетания левого и правого контекста (аллофон - вариант фонемы, который обусловлен её конкретным фонетическим окружением). При этом различные типы контекстов объединяются в классы по степени акустической близости.

Преимущество таких систем состоит в том, что они дают возможность синтезировать текст по не заданному заранее тексту, а недостаток - в том, что качество синтезированной речи несопоставимо с качеством речи естественной (на границах сшивки элементов могут возникать искажения). Также весьма трудно управлять интонационными характеристиками речи, так как характеристики отдельных слов могут изменяться в зависимости от контекста или типа фразы.

Впрочем, это всё в теории. На практике, на современном этапе развития, несмотря на активное продвижение в этой области, разработчики технологии синтеза речи всё-таки испытывают некоторые трудности, в основном связанные с искусственностью синтезируемой речи, отсутствием в ней эмоциональной окраски и с низкой помехоустойчивостью.

Дело в том, что любая синтезированная речь, как правило, воспринимается человеком с трудом. Это связано с тем, что пробелы в синтезированном тексте заполняет человеческий мозг , который задействует для этого дополнительные ресурсы, и человек может нормально воспринимать синтезированную речь только около 20 минут.

На восприятие речи также влияет её эмоциональная окраска. В случае с синтезированной речью она отсутствует. Хотя стоит отметить, что некоторые алгоритмы всё же позволяют в некоторой степени имитировать эмоциональную окраску речи путём изменения длительности фонем, пауз и модуляции тембра, но пока их работа далека от идеала.

Что касается третьей названной проблемы - низкой помехоустойчивости, то эксперименты показывают, что восприятию синтезированного текста мешают любые, даже самые небольшие посторонние шумы. Это опять-таки связано с тем, что для обработки синтезированной речи человеческий мозг задействует дополнительные центры, которые не используются при восприятии речи естественной.

В конце этой статьи мне хотелось бы привести некоторые примеры существующих синтезаторов речи.

Всем известны так называемые "читалки " - программы для более удобного чтения текста с монитора. Многие из нах используют программы речевого синтеза для озвучивания текста, например, Balabolka и Govorilka .

Для того чтобы подобные программы озвучивали тексты, необходимо также установить библиотеку SAPI (Speech API) и голосовые движки. Наиболее распространение две версии Speech API: SAPI4 и SAPI5.Обе библиотеки могут работать на одном компьютере. В операционных системах Windows XP, Windows Vista и Windows 7 уже установлены библиотеки SAPI5.

Помимо читалок, распространены программы экранного доступа. Примерами таких программ являются:

VIRGO 4 . Программа была создана для комфортной работы слепых и слабовидящих пользователей с Windows. Она позволяет выбрать ту информацию, которая будет произноситься голосом и ту, которая будет показываться на брайлевском дисплее. Для слабовидящих пользователей предусмотрена системой увеличения экрана "Галилео".

Программа Кобра 9.1 также упрощает работу с Windows для слепых и слабовидящих пользователей. Эта программа может выводить выводит информацию с компьютерного монитора с помощью речи, брайлевского дисплея и имеет функцию увеличения экрана.

Absinthium

Рубрики:

Теги:

Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!

Комментарии

С технической точки зрения статья правильная. Но там где автор добавляет от себя начинаются проблемы. Понятно, что человеку, который об этом только слышал, и не пользуется постоянно сложно судить. Поэтому не сочтите за претензии, просто хочу кое-что прояснить.

На самом деле уровень синтезаторов речи достаточно приемлемый. Хотя конечно еще продолжают существовать и те, которые были разработаны 10 - 15 лет назад и, именно они попадаются в сети при поверхностном знакомстве с темой. Но есть и другие, более вменяемые. За 20 минут человек не устает от синтезатора - работаю с синтезаторами 15 часов в сутки. И таких как я много. но даже те люди, которые не такие, как я и мои коллеги, а такие как большинство, с удовольствием слушают например аудиокниги записанные из текстовый файлов с помощью синтезаторов речи. Зачастую актеры, начитывающие аудиокнигу, утомляют человека даже быстрее чем за 20 минут, поэтому синтезаторы с их машинной прямотой и бескомпромиссностью, скорее выигрывают, особенно если вы не эстет, а просто получаете информацию. И программы перечисленные в конце, особенно virgo и cobra, в наших широтах все-таки не так известны, даже в кругах тех, для кого они разработаны. Самой известной из программ экранного доступа является jaws for windows. Эта программа лидер среди других решений. Так же у нас пользуется популярностью и несомненно заслуживает внимания программа экранного доступа nvda. Она позволяет незрячим решать большинство повседневных задач и при этом является свободно распространяемой.

Современные технологии позволяют вам генерировать речь прямо из печатного текста. Только представьте, что вы можете набрать текст, который потом будет произнесен выбранным вами голосом, с выбранной вами интонацией и скоростью. И это не фантастика, это реальность.

Что такое синтезатор речи?

Синтезаторы речи Text to Speech (TTS) - специальные программы, позволяющие формировать речевой сигнал (речь, голос) по печатному тексту. Первое упоминание о синтезе речи относится к X веку. В конце XVIII века ученый Христиан Кратценштейн, создал модель речевого тракта человека, способную произносить пять гласных звуков (а, э, и, о, у).

Первые синтезаторы речи на базе вычислительной техники появились в конце 1950-х годов. Они звучали довольно примитивно, и разобрать такую речь можно было с большим трудом. Работы над улучшением качества синтезированной речи продолжаются. Уже сегодня речь, генерируемую современными системами синтеза реча, порой не отличить от реальной человеческой речи.

Зачем нужен синтезатор речи?

Синтезатор речи может вам пригодиться во многих случаях, например:
  • Во время путешествия - просто наберите любую фразу, и программа ее произнесет на нужном вам языке.
  • Чтобы читать электронные книги, тексты, документы - вы занимаетесь своим делом, а программа читает вам вслух.
  • Для изучения иностранных языков - отличная возможность бесплатно тренировать произношение и разговорные навыки.

Синтезатор речи A1 SpeechTRON

A1 SpeechTRON - синтезатор английской речи из текста. Может использоваться для чтения заметок, текстовых документов, электронных книг, и других текстовых материалов (форматы: текст, RTF, DOC). Речевой синтезатор (TTS) можно также использовать при изучении английского языка. Программа полностью поддерживает Microsoft TTS SAPI 4.0, имеет полностью настраиваемый интерфейс, высокое качество звука, настройки скорости чтения, запись в файл. Имеется поддержка пользовательских и дополнительных словарей.

Синтезатор речи ReadPlease

ReadPlease - синтезатор английской речи из текста. Может использоваться для чтения текстов, буфера обмена, текстовых документов, электронных книг, и других текстовых материалов (форматы: текст, RTF, DOC). Речевой синтезатор (TTS) можно также использовать при изучении английского языка. Программа после запуска размещается в трее и управляется горячими клавишами. Может пристыковываться к различным окнам или рабочему столу. В платной версии имеется поддержка дополнительных языков, стандарта AT&T Natural Voices, дополнительных возможностей. Программа существует в двух версиях: бесплатная и платная. Имеется поддержка пользовательских и дополнительных словарей.

Синтезатор речи ReadingBar

ReadingBar - синтезатор речи из любой web-страницы. Это панель для браузера Internet Explorer, которая после установки встраивается в браузер и позволяет читать любые web-страницы. Вы можете записать голос в wav или mp3 файл. Кроме произношения текста, ReadBar позволяет также подсвечивать слова, переводить их на 4 языка, выводить толкование слов из словаря. Будьте внимательны, ReadingBar не будет работать на операционной системе Vista и в браузере Internet Explorer 7.

Синтезатор речи FlameReader

FlameReader - многофункциональный синтезатор речи, который позволяет генерировать речь из любого текста или файла. Достаточно выделить текст в любой программе или в любом документе, и FlameReader сразу же произнесет его. Программа имеет множество возможностей: запись голоса в файл (wav и mp3), чтение e-mail, документов, web-страниц, озвучивание PowerPoint-презентаций, перевод текстов. Вы всегда можете настроить FlameReader удобным для вас образом, выбрав голосовой движок, скорость воспроизведения, и прочие параметры. FlameReader добавляет панель навигации в пакет программ Microsoft Office, упрощая работу с ней. В комплекте с программой поставляется удобный редактор звуковых файлов.

Синтезатор речи Alive Text to Speech

Alive Text to Speech - многофункциональный синтезатор речи, позволяющий не только произносить слова, тексты и файлы, но и записывать (конвертировать) их в звуковые файлы (MP3, WAV, OGG, VOX). В комплект входит панель для браузера Internet Explorer, позволяющая озвучивать любые web-страницы и конвертировать их в звуковые файлы.

Синтезатор речи YeoSoft Text to MP3 Speaker

YeoSoft Text to MP3 Speaker - многофункциональный синтезатор речи, позволяющий озвучивать тексты и создавать аудио-книги в различных звуковых форматах. Это эффективный инструмент для изучения иностранных языков. Поддержка технологий SAPI 4 и 5, файлов DOC и PDF, 10 языков, работы с несколькими файлами одновременно. Возможность добавления xml-тегов в текст для задания управления произношением. Настройки голоса: громкость, скорость, выбор голосового движка.

Синтезатор речи TextAloud

TextAloud - программа для генерации речи из текста и файлов. Генерируемую речь можно как слушать при помощи компьютера, так и записать в виде mp3 или wma файла. Синтезатор поддерживает следующие типы файлов: DOC, PDF, и HTML. В комплект с программой входит также Toolbar для Internet Explorer, Firefox, и Outlook.

Синтезатор речи Verbose

TextSound - конвертер текста в звуковые файлы (wav и mp3). Эта небольшая программа поможет вам быстро сконвертировать текст в речь и сохранить ее в виде звуковых файлов. Программа позволяет обрабатывать сразу несколько файлов и создавать список заданий.

Все чаще в повседневной жизни стали использовать синтезаторы речи. Синтезаторы речи, как становится видно уже по одному названию, осуществляют синтез речи, то есть форматируют письменный текст в устный.

Благодаря этому можно учить новые иностранные слова с правильным произношением, читать книги не отвлекаясь от своих дел или, например, находясь в транспорте. Изначально разработкой таких программ занимались организации, специализирующиеся на технике для людей с проблемами зрения.

Сейчас же, любой пользователь может скачать одну из программ, установить ее на свой компьютер или телефон и синтезировать речь, в том числе и русскую.

Для этого было разработано множество различных программ, приложенный и даже целых систем. К сожалению, не все из них предназначены для русскоязычной аудитории.

1. Acapela

Acapela — один из самых распространенных речевых синтезаторов во всем мире. Программа распознает и озвучивает тексты более, чем на тридцати языках. Русский язык поддерживается двумя голосами: мужской голос — Николай, женский — Алена.
Женский голос появился значительно позднее мужского и является более усовершенствованным.

Установка программы проходит без проблем. Разработаны версии для операционных систем Windows, Linux, Mac, а также для мобильных ОС Android u IOS.

Программа платная, скачать ее можно с официального сайта Acapela.

2. Vokalizer

Вторым в нашем списке, но не по популярности является движок Милена от разработчика программы Vocalizer компании Nuance.
Голос звучит очень естественно, речь чистая. Есть возможность установить различные словари, а также подкорректировать громкость, скорость и ударение, что не маловажно.
Как и в случае с Акапелой, программа имеет различные версии для мобильных, автомобильных и компьютерных приложений. Прекрасно подходит для чтения книг.

Скачать все версии Vokalizer и русскоязычный движок Милена можно на официальном сайте производителя программы.

3. RHVoice

Код синтезатора открыт для всех, программы же абсолютно бесплатны.
RHVoice выпущена в двух вариантах: как отдельная программа, так и как приложение к NVDA.
Все версии можно скачать с официального сайта разработчика.

4. ESpeak

Первая версия бесплатного синтезатора речи eSpeak была выпущена в 2006 году. С тех пор компания-разработчик постоянно выпускает все более усовершенствованные версии. Последняя версия была представлена в конце весны две тысячи тринадцатого года.

eSpeak можно установить под следующие операционные системы:

  • Microsoft Windows,
  • Mac OS X,
  • Linux,
  • RISC OS

Возможна также компиляция кода для Windows Mobile, но делать ее придется самостоятельно.
А вот с мобильной ОС Android программа работает без проблем, хотя русские словари еще не до конца разработаны. Русскоязычных голосов много, можно выбрать на свой вкус.

5. Festival

Festival — это целая система распознавания и синтеза речи, которая была разработана в эдинбургском университете.
Программы и все модули абсолютно бесплатно и распространяются по системе open source. Скачать их и ознакомиться с демо-версиями можно на официальном сайте университета Эдинбурга.

Читайте также: