Озвучка текста голосом. обзор программ

Мы выбрали лучшие программы для чтения голосом. Среди лучших - как российские разработки, так и иностранные. Также мы рассмотрели все плюсы и минусы приложения

Библиотека pyttsx3

PyTTSx3 — удобная кроссплатформенная библиотека для реализации TTS в приложениях на Python 3. Использует разные системы синтеза речи в зависимости от текущей ОС:

  • в Windows — SAPI5,
  • в Mac OS X — nsss,
  • в Linux и на других платформах — eSpeak.

Это очень удобно: пишете код один раз и он работает везде. Кстати, eSpeak NG поддерживается наравне с исходной версией.

А теперь примеры!

Просмотр голосов

У каждого голоса есть несколько параметров, с которыми можно работать:

  • id (идентификатор в операционной системе),
  • name (имя),
  • languages (поддерживаемые языки),
  • gender (пол),
  • age (возраст).

Первый вопрос всегда в том, какие голоса установлены на стороне пользователя. Поэтому создадим скрипт, который покажет все доступные голоса, их имена и ID. Назовем файл, например, list_voices.py:

import pyttsx3

tts = pyttsx3.init() # Инициализировать голосовой движок.

У активного движка есть стандартный параметр ‘voices’, где содержится список всех доступных этому движку голосов. Это нам и нужно:

voices = tts.getProperty(‘voices’)

# Перебрать голоса и вывести параметры каждого

for voice in voices:

print(‘=======’)

print(‘Имя: %s’ % voice.name)

print(‘ID: %s’ % voice.id)

print(‘Язык(и): %s’ % voice.languages)

print(‘Пол: %s’ % voice.gender)

print(‘Возраст: %s’ % voice.age)

Теперь открываем терминал или командную строку, переходим в директорию, куда сохранили скрипт, и запускаем list_voices.py.

Результат будет примерно таким:

В Linux картина будет похожей, но с другими идентификаторами.

Как видите, в Windows для большинства установленных голосов MS SAPI заполнены только «Имя» и ID. Однако этого хватит, чтобы решить следующую нашу задачу: написать код, который выберет русский голос и что-то им произнесет.

Например, у голоса RHVoice Aleksandr есть преимущество — его имя уникально, потому что записано транслитом и в таком виде не встречается у других известных производителей голосов. Но через pyttsx3 этот голос будет работать только в Windows. Для воспроизведения в Linux ему нужен Speech Dispatcher (подробнее чуть позже), с которым библиотека взаимодействовать не умеет. Как общаться с «диспетчером» еще обсудим, а пока разберемся с доступными голосами.

Как выбрать голос по имени

В Windows голос удобно выбирать как по ID, так и по имени. В Linux проще работать с именем или языком голоса. Создадим новый файл set_voice_and_say.py:

import pyttsx3

tts = pyttsx3.init()

voices = tts.getProperty(‘voices’)

# Задать голос по умолчанию

tts.setProperty(‘voice’, ‘ru’)

# Попробовать установить предпочтительный голос

for voice in voices:

if voice.name == ‘Aleksandr’:

tts.setProperty(‘voice’, voice.id)

tts.say(‘Командный голос вырабатываю, товарищ генерал-полковник!’)

tts.runAndWait()

В Windows вы услышите голос Aleksandr, а в Linux — стандартный русский eSpeak. Если бы мы вовсе не указали голос, после запуска нас ждала бы тишина, так как по умолчанию синтезатор говорит по-английски.

Обратите внимание: tts.say() не выводит реплики мгновенно, а собирает их в очередь, которую затем нужно запустить на воспроизведение командой tts.runAndWait(). Выбор голоса по ID

Выбор голоса по ID

Часто бывает, что в системе установлены голоса с одинаковыми именами, поэтому надежнее искать необходимый голос по ID.

Заменим часть написанного выше кода:

for voice in voices:

ru = voice.id.find(‘RHVoice\Anna’)  # Найти Анну от RHVoice

if ru > -1: # Eсли нашли, выбираем этот голос

tts.setProperty(‘voice’, voice.id)

Теперь в Windows мы точно не перепутаем голоса Anna от Microsoft и RHVoice. Благодаря поиску в подстроке нам даже не пришлось вводить полный ID голоса.

Но когда мы пишем под конкретную машину, для экономии ресурсов можно прописать голос константой. Выше мы запускали скрипт list_voices.py — он показал параметры каждого голоса в ОС

Тогда-то вы и могли обратить внимание, что в Windows идентификатором служит адрес записи в системном реестре:

import pyttsx3

tts = pyttsx3.init()

EN_VOICE_ID = «HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\MS-Anna-1033-20DSK»

RU_VOICE_ID = «HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\TokenEnums\RHVoice\Anna»

# Использовать английский голос

tts.setProperty(‘voice’, EN_VOICE_ID)

tts.say(«Can you hear me say it’s a lovely day?»)

# Теперь — русский

tts.setProperty(‘voice’, RU_VOICE_ID)

tts.say(«А напоследок я скажу»)

tts.runAndWait()

Функция «Диктовка» на устройствах Apple

Платформы: macOS, iOS.

Apple встроила функцию голосового ввода в свои операционные системы. Поэтому владельцы iPhone, Mac и iPad могут использовать диктовку без дополнительных программ. Что особенно приятно, технология хорошо справляется с русским языком. О знаках препинания разработчики тоже позаботились. На iPhone 6S и более новых устройствах голосовой ввод работает без интернета.

Чтобы воспользоваться диктовкой в iOS, просто нажмите на значок микрофона на стандартной клавиатуре.

В macOS голосовой ввод сначала нужно активировать. Для этого откройте меню Apple (иконка яблока) и выберите «Системные настройки» → «Клавиатура» → «Диктовка». Поставьте флажок «Включена» и выберите клавишу для перехода в режим голосового ввода. С её помощью вы сможете включать диктовку в любой программе, которая поддерживает текстовый ввод.

Voicebot.su

Voicebot.su — еще один сервис для озвучки текста онлайн реалистичным голосом. Синтезатор речи работает на основе ИИ, содержит более 90 мужских и женских голосов, почти неотличимых от человеческого. Обладает продвинутыми настройками: позволяет выбрать скорость речи, высоту, тембр и громкость голоса, эмоции.

В бесплатной версии можно озвучить текст длиной до 500 символов, использовав для этого как простые, так и премиальные голоса. Простой интерфейс позволяет работать с программой даже неопытным пользователям, а хорошее качество озвучки — обойтись без дополнительной обработки аудиодорожки. 

сервис для озвучки текста онлайн

Хорошая читалка электронных книг – какая она?

Какие требования качества я предъявляю к программам для чтения электронных книг?

Вот такие:

  • Поддержка всех распространенных форматов
    Читалка, которая поддерживает только ePub или только MOBI форматы – не нужна. Нормальное приложение для чтения книг должно поддерживать как минимум ePub, FB2, Mobi, DjVu и PDF. Также желательно чтобы оно умело работать с книгами в архивах, а также .doc, .rtf и .txt файлами – а то до сих пор находятся уникумы, которые оцифровывают книги в форматы офисных документов вместо специализированных книжных форматов.
  • Поддержка разных режимов чтения
    Хорошая книжная читалка должна поддерживать как минимум смену “дневного” и “ночного” режима чтения, а еще лучше – иметь множество скинов, позволяющих выбрать наиболее комфортную цветовую схему под конкретные условия освещения. Черный текст на белом фоне без вариантов – это прошлый век.
  • Поддержка OPDS-каталогов и облачных хранилищ
    Хорошая книжная читалка должна поддерживать как минимум OPDS-каталоги, а желательно еще и облачные хранилища. Я хочу скачивать новые книги на смартфон или планшет в пару тапов по экрану со своего облака или OPDS-каталога Флибусты, а не перекидывать их вручную с компьютера.
  • Интерфейс для людей
    Развиваются технологии, меняются подходы к дизайну интерфейсов приложений. И тот дизайн приложений, который казался уместным в 2009 году, на сегодняшний день уже дико режет глаз. Хорошая книжная читалка имеет не только хорошую функциональность, но и удобный минималистичный интерфейс в духе времени.
  • Ничего лишнего
    Мне не нужно чтобы читалка помимо функции чтения книг предлагала мне зарегистрироваться в каком-нибудь сервисе или навязывала свой книжный магазин. Если в приложении нет никаких лишних функций – это идет ему в плюс. Если есть – соответственно, в минус.

Критериев качества у меня немного, но не так-то просто найти приложение, удовлетворяющее хотя бы 3 критериям из 5.

Онлайн-сервисы для озвучивания

Acapela

Acapela – это иностранный сервис, способный озвучить текст на 35 языках и диалектах. Примечательно, что портал озвучивает иностранные слова с характерным акцентом (например, русские слова читает англичанин). На сайте представлена демонстрационная версия продукта с ограниченным размером до 300 символов. Еще одним минусом послужит требования каждый раз соглашаться с условиями сайта. Для русской локализации предлагается один вариант озвучки текста – голосовой движок Alyona.

Linguatec

Сервис Linguatec предлагает ознакомиться с демонстрационной версией продукта. Здесь также имеется до 40 вариантов озвучки текста голосом. В сравнении с предыдущим сайтом на Linguatec представлено два голоса: женский «Милена» и мужской «Юрий». Ограничение на количество символом в демо-версии 250 знаков.

Text-to-Speech

Text-to-Speech – еще один портал, способный озвучить текст голосом онлайн. Обладает более продвинутыми настройками: скорость речи диктора, размер шрифта, машинный перевод. Для людей с ограниченными возможностями предоставлена экранная клавиатура. К сожалению, для русскоговорящего пользователя предоставлен всего один женский голос.

Google Translator

– фирменный переводчик от корпорации Google. Одной из функций сервиса является озвучивание переведенного или оригинального предложения. При наличии микрофона можно набирать слова голосом. Если вы желаете сохранить результат перевода и его звуковое сопровождение в «избранные», то авторизуйтесь в Gmail. Сервис Google Translator переводит и озвучивает тексты в пределах 5000 символов. Единственный минус – это голосовой движок, который больше походит на речь робота.

IVONA

Сайт IVONA – это презентационная страница, демонстрирующая голосовые движки. Данный сервис является польской разработкой и предлагает четыре варианта озвучки. Во всех язык по 2-3 голоса. В русском сегменте присутствует два голосовых движка «Максим» и «Татьяна». К сожалению, возможность опробовать сервис бесплатно отсутствует. Единственное, что может пользователь без покупки подписки – прослушать шаблонное приветствие голосовых движков.

Яндекс переводчик

Яндекс переводчик – отечественный аналог переводчика от Google. Имеет в распоряжении аналогичные инструменты: перевод, озвучивание перевода, генератор голоса, экранную клавиатуру и сохранение в избранное. Единственно, что отличает Яндекс переводчик от зарубежного аналога – максимальное количество символов, достигающие отметки в 10 000 знаков.

Oddcast

Портал Oddcast – наиболее интересный онлайн синтезатор речи для озвучивания с точки зрения интерфейса. Здесь помимо сухого звука присутствуют анимированные дикторы. Кроме того виртуальные дикторы следят за указателем мышки. Дополнительно на сайте регулируются эффекты речи. Имеется опция частичного изменения звучания. Русский язык в Oddcast представлен тремя движками: «Дмитрий», «Милина» и «Ольга». Из недостатков можно выделить ограничение на максимальное количество символов в 300 знаков и не самый удобный интерфейс для ввода.

ISpeech

Сайт ISpeech обладает минималистским интерфейсом, с которым разберется даже начинающий пользователь. Все что нужно сделать: ввести пару предложений и выбрать язык. Дополнительно регулируется скорость чтения текста голосом и выбор голосового движка. При желании озвученный результат можно сохранить на ПК. Максимальное число символов – 150.

2уха

2уха – интересный отечественный сайт, где помимо узконаправленного форума имеется раздел по преобразованию документа в аудио файл, который записывается в формате mp3 или awb. В настройках перед обработкой запроса настраиваются дополнительные параметры: скорость чтения, высота тона голоса, громкость, тип голосового движка и чтение знаков препинания. Результат конвертации высылается на электронную почту через несколько минут. Рекомендуем пройти авторизацию через социальные сети, чтобы не проходить ввод кода перед отправкой запроса (проверка на робота). Минус портала заключается в невозможность моментально озвучить текст в онлайн режиме.

Мобильные синтезаторы

Синтезатор речи Google

Собственное мультифункциональное приложение Google для перевода текста в речь. Именно оно отвечает за озвучивание текста в переводчике и чтение аудиокниг в Google Play, а также во многих других программах Play Маркета.

SpeechText

Это приложение в первую очередь для тех, кто хочет узнать правильное произношение иностранных слов. Не лучший вариант ввиду ограниченности функционала. Но в качестве подспорья при изучении языка его вполне хватает.

Болтун

Удобное приложение для устройств на Андроиде. Может озвучить текст SMS, электронное письмо, статью в браузере – любые тексты, которые вы скопируете в буфер обмена или введете прямо в приложение.

Voice Aloud Reader

Еще одно приложение, которое можно скачать в Google Play. Программа работает с загруженными текстовыми файлами и сохраненными текстами. Русский язык поддерживается. Можно выбирать интонацию и скорость чтения.

Ещё немного о стандартах голосовых движков

Что относится к имеющимся сегодня основным стандартам голосовых движков, то ныне наиболее распространены два из них – SAPI 4 и SAPI 5 («SAPI» это аббревиатура от «Microsoft Speech API» — в переводе «Интерфейс программирования речи от Microsoft»). SAPI 4 является устаревшим стандартом, созданным ещё в 1998 году, ныне применяется мало, SAPI 5 – более современен, обладает более качественным произношением, последняя модификация — SAPI 5.4 (при этом у SAPI 5 бесплатных голосов меньше, нежели у устаревшего SAPI 4).

Что до программ синтеза речи, то одна из наиболее популярных из них — «Govorilka», позволяет довольно качественно озвучивать объёмные тексты, причём различными вариантами голосов (как мужских, так и женских). В инсталляционной версии продукта обычно находится комплект из нескольких встроенных голосов, если же читателю их будет мало, то на сайте программы можно скачать дополнительные голоса к ней (в том числе качественные платные варианты).

Интерфейс программы Govorilka

Возможные проблемы при записи

Прежде, чем перейти к списку программ, хотелось бы остановиться на распространенной проблеме и рассмотреть случаи, когда программа не может прочитать текст.

Дело в том что есть голосовые движки, они могут быть разных стандартов: SAPI 4, SAPI 5 или Microsoft Speech Platform (в большинстве программ для воспроизведения текста есть выбор этого инструмента). Так вот, логично, что помимо программы для чтения голосом — нужен движок (от него будет зависеть, на каком языке вам будут читать, каким голосом: мужским или женским и пр.).

Речевые движки

Движки могут быть бесплатными и коммерческими (естественно, что лучшее качество воспроизведения звука обеспечивают коммерческие движки).

SAPI 4. Устаревшие версии инструментов. Для современных ПК не рекомендуется использовать устаревшие версии. Лучше присмотреться к SAPI 5 или Microsoft Speech Platform.

SAPI 5. Современные речевые движки, есть как бесплатные, так и платные. В интернете можно найти десятки речевых движков SAPI 5 (и с женским и с мужским голосом).

Чтобы синтезатор речи работал, нужно установить:

Программы для воспроизведения текста голосом

Говорилка

Говорилка – программа для озвучивания текста на русском языке для любителей слушать, к сожалению не доступна в онлайн режиме. Поддерживает загрузку дополнительных речевых движков и языковой библиотеке прямо с официального сайта. Обладает полезными функциями:

  • Запись речи в аудио файл (*.WAV, *.MP3) с регулируемой скоростью воспроизведения.
  • Настройка скорости воспроизведения и тональности голоса в утилите.
  • Обработка текстов с интернет страниц и пакета офисных приложений.
  • Запоминание положения курса при выходе из программы.
  • Неограниченный объем читаемых символов.

Sacrament Talker

Уникальность Sacrament Talker заключается в том, что он работает на собственной системе озвучивания речи TTS Engine 3.0, где доступно шесть русских голосов. Как и другие программы обрабатывает текст из браузера, офисных приложений, а также сохраняет озвучку в MP3 формате.

2nd Speech Center

2nd Speech Center – очередной помощник, оберегающий зрение. Обладает максимально понятным пользовательским интерфейсом. Поддерживает запись произносимого текста в форматах mp3/wav. Обрабатывает форматы: .txt, .doc, .pdf, .eml, .rtf, .htm, .html.

Audiobook Recorder

Audiobook Recorder больше напоминает продвинутую аудиокнигу, чем традиционную говорилку. Утилита специализируется на конвертации текстовых документов в MP3. Отличительной особенностью программы служит наличие функции «Умная пауза», улучшающая качество чтения.

TNR JayJay

Утилита TNR JayJay – развлекательная говорилка, которая поможет узнать, как бы звучала фамилия пользователя на японском языке. Софт ориентирован на поклонников аниме, поскольку функцию голосов исполняют милые 2D девушки. При желании вы можете сохранить записанный материал на компьютере и поделиться полученным каламбуром с друзьями.

Балаболка

Балаболка – универсальная программа для чтения вслух, поддерживающая огромное количество форматов, начиная от страниц в браузере и заканчивая DjVu файлами. Имеет в распоряжении функционал текстового редактора, а также сохраняет озвученный текст на компьютере.

Говорун+

Говорун+ — компактная программа, которая может читать текст вслух на русском. Работает на предустановленном синтезаторе речи и использует встроенные голосовые движки. Читает RTF и TXT файлы. Дополнительно имеется плеер для воспроизведения записанных звуков, система оповещения, работа в трее и редактируемый интерфейс. Приятно порадует анимированные персонажи, выполняющие функции дикторов.

Foxit Reader

Foxit Reader – небольшая утилита для преобразования текста в речь, сосредоточенная на чтении PDF файлов. Отличается оперативной скоростью обработки данных и нетребовательностью к техническим ресурсам ПК. Отдельного внимания заслуживает дружелюбный пользовательский интерфейс, где управление инструментами редактирования осваиваются на интуитивном уровне.

Demagog

Проект Demagog – полезная утилита, которая больше походит на продвинутый текстовый редактор. Благодаря широким возможностям подходить не только для чтения и воспроизведения текстов, но и справляется с литературными произведениями. Порадует аудиалов следующими функциями:

  • Наличие инструментов форматирования, как в стандартных текстовых редакторах.
  • Уникальный алгоритм корректировки произношения.
  • Подсветка орфографических ошибок и омографов.
  • Распознавание многоязычных документов.
  • Поддержка словарей произношения DIC.

ICE Book Reader

ICE Book Reader – многофункциональная говорилка, которая не только озвучивает записанный русский и английский текст, но и конвертирует некоторые файлы. Специализируется на чтении книг. Отлично справляется с большинством известных форматов, а также имеет несколько полезных опций:

  • Пять режимов для пролистывания текста.
  • Оптимизация со всеми версиями ОС Windows.
  • Несколько тем оформления рабочего меню софта.
  • Стильный и удобный пользовательский интерфейс.
  • Корректное распознание не алфавитных символов.
  • Управление книжными коллекциями и автоматическая сортировка информации.

RussAcc

Проект RussAcc специализируется на воспроизведении русской речи. Представленная программа умеет правильно расставлять ударения при произношении, а также выделяет ударение на письме.

Дополнительно RussAcc используется, как текстовый редактор (форматирование текста) и конвертер FB2 в TXT. Имеется система закладок и запоминания читаемого фрагмента при выходе.

Выбор голоса и качество произношения

Каждый голос соответствует модели, обученной на речи диктора, поэтому, выбор голоса определяет тембр голоса, основной язык и пол говорящего, мужской или женский. Список доступных голосов.

Чтобы использовался желаемый голос и было качественное произношение:

  • Указывайте рекомендуемые .
  • Следите за .
  • Попробуйте для сценариев общения с клиентами.

Настройки произношения

Качество произношения и голос зависят от настроек произношения:

  • Язык — каждый голос создавался для определенного языка, на котором разговаривал диктор. Чтобы получить желаемое качество, используйте тот голос из списка, для которого выбранный язык является основным.Если выбрать не основной язык, то качество произношения будет хуже, а также может быть использован другой голос, а не тот, который вы указали.
  • Скорость — слишком быстрое и слишком медленное произношение звучит неестественно, но может быть полезно в рекламе, где каждая секунда эфира стоит дорого.
  • Эмоциональная окраска — поддерживается только при выборе русского языка () и голосов или . Не используйте этот параметр с другими голосами и языками, так как при синтезе отдельных фраз голос может отличаться от ожидаемого.Для этих голосов нейронная сеть обучалась на трех разных датасетах с репликами диктора, в которых фразы произносились с разной интонацией: радостной, раздраженной, нейтральной. Развивать поддержку эмоций для других голосов сейчас не планируется, а в премиум-голосах выбор подходящей интонации осуществляется автоматически.

Качество переданного текста

Причины, по которым при произношении могут быть использованы другие голоса:

  • Длинный текст без пунктуации. Для лучшего качества расставляйте точки и запятые.
  • Специфичные предложения на сложную тему.
  • Много вхождений слов из других языков.

Премиум-голоса

были обучены с использованием новой технологии. Речь, синтезированная по новой технологии звучит естественнее.

Основные отличия:

Понимание контекста. Синтез премиум-голосов перед стартом оценивает весь текст целиком, а не отдельные предложения

Это позволяет получить значительно более уместные интонации, присущие речи живого человека.
Внимание к деталям. Благодаря использованию глубоких нейронных сетей при синтезе премиум-голосов, мы обращаем внимание на гораздо большее количество деталей исходного голоса

Это позволяет получить значительно более чистый и богатый на детали голос и избежать различных искажений, которые могут быть заметны в .

Важно

Сейчас для новой технологии есть голоса только для русского языка. Если выбрать другой язык, качество произношения будет хуже.

Проверка и настройка микрофона

Прежде всего подключите микрофон к компьютеру. Если вы хотите использовать встроенное устройство ноутбука или веб-камеры, то ничего подключать не надо. Затем найдите на панели уведомлений значок динамика. Он может быть спрятан под галочкой.

Кликните по значку динамика правой кнопкой и выберите пункт «Записывающие устройства». Это откроет список оборудования, которое можно использовать для записи звука. В этом списке должен быть и ваш микрофон вне зависимости от того, подключен он отдельно или встроен в ноутбук.

Если в списке записывающих устройств пусто, кликните на свободном месте правой кнопкой мышки и отметьте пункты «Показывать отключенные устройства» и «Показывать отсоединенные устройства». После того как микрофон появится в списке, откройте правым кликом его меню и выберите опцию «Включить». Также убедитесь, что он назначен устройством по умолчанию.

Удостовериться в том, что система воспринимает звук с микрофона, очень просто: скажите в него что-нибудь. Если справа появляются зелёные полосы, значит всё готово к голосовому вводу. Попробуйте говорить тише или громче — вы заметите, как количество зелёных полос меняется в зависимости от громкости голоса.

При желании можно попробовать изменить стандартные параметры микрофона, добившись некоторого улучшения качества записи. Для этого:

  1. Кликните правой кнопкой по микрофону.
  2. Откройте его свойства.
  3. Перейдите на вкладку «Уровни».
  4. Поставьте максимальные значения громкости и усиления.
  5. Откройте вкладку «Улучшения».
  6. Включите подавление шума и эхо.

Количество опций для улучшения зависит от того, какая звуковая карта установлена на вашем компьютере. К сожалению, некоторые из них не имеют вообще никаких параметров для настройки, кроме управления громкостью и усилением. Но для голосового ввода это не критично — главное, чтобы система в принципе воспринимала звук через микрофон.

Онлайн-синтезаторы

Acapela

Один из самых известных синтезаторов речи. Разговаривает на 30 языках. Текст на русском языке вам могут зачитать мужским голосом Николай, а женским – Алёна. На бесплатное использование есть ограничение: в браузерной версии можно воспроизвести не больше 300 символов. Для использования полного функционала необходимо скачать платную программу – она доступна на Windows, Linux, Mac, а также на мобильных OC Android и IOS.

Text-to-Speech

Синтезатор речи с продвинутыми настройками: можно задавать скорость речи, размер шрифта и машинный перевод. Доступна даже экранная клавиатура для людей с ограниченными возможностями. На русском текст может зачитать здесь только женский голос.

Oddcast

На этом портале вам тоже не дадут озвучить более 300 символов разом. Зато русский язык поддерживается тремя голосами: одним мужским (Дмитрием) и двумя женскими (Милиной и Ольгой). Но главная фишка портала в том, что текст вам зачитывают анимированные дикторы. За это можно простить программе даже не самый удобный интерфейс.

Linguatec

Как и в случае с Acapela, больше определенного количества символов (здесь – 250) бесплатная версия вам озвучить не разрешит. Но зато с этой задачей она справляется очень неплохо. Здесь так же доступны два голоса – мужской (Юрий) и женский (Милена).

Ispeech

Простейший бесплатный инструмент для озвучивания коротких текстов размером не больше твита – максимум 150 символов. Зато полученный результат можно сохранить на компьютере. Русский язык поддерживается.

PilliApp

Программа не разговаривает больше 60 секунд, поэтому разработчики рекомендуют делить длинный текст на несколько строк. За русский язык отвечают голоса Юрия и Елены. Сайт программы явно переведен в автоматическом режиме, поэтому не удивляйтесь легкой странности текста на главной странице.

2уха

Отечественный онлайн-софт с возможностью расширенных настроек: можно отрегулировать скорость чтения, высоту тона, громкость и чтение знаков препинания. Выбор невелик – только Александр или Елена. Зато можно не копировать текст в окошко, а сразу загрузить в программу файл Microsoft Word. Минус этого сервиса в том, что мгновенно озвучить текст не получится: придется подождать в очереди на конвертацию.

Acapela – самый известный синтезатор речи онлайн

Сайт Acapela предоставляет огромный выбор языков и голосов для озвучивания текста. Особенно это актуально для английского – его можно услышать в двадцати разных вариантах: женским голосом, мужским, детским, старческим, радостным и т.д.

Удобно, что все параметры настраиваются сразу на главной странице

К сожалению, с русскими текстами дела обстоят похуже – их озвучивают только одним голосом – некой Алены. Но тем не менее, результат получается вполне достойным.

Настройки здесь очень простые – достаточно только выбрать язык и голос, ввести нужный текст, затем согласиться с условиями использования ресурса и нажать кнопку «Listen!».

Интерфейс оформлен на английском, но и без перевода вполне понятно, что и как нажимать

Модуль Google TTS — голоса из интернета

Google предлагает онлайн-озвучку текста с записью результата в mp3-файл. Это не для каждой задачи:

  • постоянно нужен быстрый интернет;
  • нельзя воспроизвести аудио средствами самого gtts;
  • скорость обработки текста ниже, чем у офлайн-синтезаторов.

Что касается голосов, английский и французский звучат очень реалистично. Русский голос Гугла — девушка, которая немного картавит и вдобавок произносит «ц» как «ч». По этой причине ей лучше не доверять чтение аудиокниг, имен и топонимов.

Еще один нюанс. Когда будете экспериментировать с кодом, не называйте файл «gtts.py» — он не будет работать! Выберите любое другое имя, например use_gtts.py.

Простейший код, который сохраняет текст на русском в аудиофайл:

from gtts import gTTS

tts = gTTS(‘Иван Федорович Крузенштерн. Человек и пароход!’, lang=’ru’)

tts.save(‘tts_output.mp3’)

После запуска этого кода в директории, где лежит скрипт, появится запись. Чтобы воспроизвести файл «не отходя от кассы», придется использовать еще какой-то модуль или фреймворк. Годится pygame или pyglet.

Вот листинг приложения, которое построчно читает txt-файлы с помощью связки gtts и PyGame. Я заметила, что для нормальной работы этого скрипта текст из text.txt должен быть в кодировке Windows-1251 (ANSI).

Выводим текст через NVDA

Мы научились озвучивать приложение с помощью установленных в системе синтезаторов. Но что если большинству пользователей эта фишка не нужна, и мы хотим добавить речь исключительно как опцию для слабовидящих? В таком случае не обязательно писать код озвучивания: достаточно передать текст интерфейса другому приложению — экранному диктору.

Одна из самых популярных программ экранного доступа в Windows — бесплатная и открытая NVDA. Для связи с ней к нашему приложению нужно привязать библиотеку nvdaControllerClient (есть варианты для 32- и 64-разрядных систем). Узнавать разрядность системы вы уже умеете.

Еще для работы с экранным диктором нам понадобятся модули ctypes и time. Создадим файл nvda.py, где напишем модуль связи с NVDA:

import time, ctypes, platform

# Загружаем библиотеку клиента NVDA

bit = platform.architecture()

if bit == ’32bit’:

clientLib = ctypes.windll.LoadLibrary(‘nvdaControllerClient32.dll’)

elif bit == ’64bit’:

clientLib = ctypes.windll.LoadLibrary(‘nvdaControllerClient64.dll’)

else:

errorMessage=str(ctypes.WinError(res))

ctypes.windll.user32.MessageBoxW(0,u»Ошибка! Не удалось определить разрядность системы!»,0)

# Проверяем, запущен ли NVDA

res = clientLib.nvdaController_testIfRunning()

if res != 0:

errorMessage=str(ctypes.WinError(res))

ctypes.windll.user32.MessageBoxW(0,u»Ошибка: %s»%errorMessage,u»нет доступа к NVDA»,0)

def say(msg):

clientLib.nvdaController_speakText(msg)

time.sleep(1.0)

def close_speech():

clientLib.nvdaController_cancelSpeech()

Теперь эту заготовку можно применить в коде основной программы:

import nvda

nvda.say(‘Начать игру’)

# … другие реплики или сон

nvda.close_speech()

Если NVDA неактивна, после запуска кода мы увидим окошко с сообщением об ошибке, а если работает — услышим от нее заданный текст.

Плюс подхода в том, что незрячий пользователь будет слышать тот голос, который сам выбрал и настроил в NVDA.

Рейтинг
( Пока оценок нет )
Понравилась статья? Поделитесь с друзьями:
Технарь
Комментарии: 2
  1. Роберт

    Вот еще отличный вариант — https://voicebot.su. Это удобный онлайн-синтезатор речи, который подойдет для преобразования любого текста в аудиодорожку. Можно даже озвучивать текст на нескольких языках.

  2. Роберт

    Нравится сервис https://voicebot.su. Быстро преобразует текст в аудио, и не нужна регистрация. Интересный сервис. Я раньше пользовался другим, но этот более удобный для меня. Кстати, файлы качает в трех форматах. mp3, wav, ogg.

Добавить комментарий

Нажимая на кнопку "Отправить комментарий", я даю согласие на обработку персональных данных и принимаю политику конфиденциальности.