fix(espeak_wrapper): avoid stuck process on windows

Fixes #24
2024-05-28 21:43:35 +02:00 · 2024-05-28 21:43:35 +02:00 · 49fcbd908b
parent 203f60f1e1
commit 49fcbd908b
1 changed files with 13 additions and 24 deletions
--- a/TTS/tts/utils/text/phonemizers/espeak_wrapper.py
+++ b/TTS/tts/utils/text/phonemizers/espeak_wrapper.py
@ -50,7 +50,7 @@ else:
    _DEF_ESPEAK_VER = None
-def _espeak_exe(espeak_lib: str, args: list) -> list[bytes]:
+def _espeak_exe(espeak_lib: str, args: list) -> list[str]:
    """Run espeak with the given arguments."""
    cmd = [
        espeak_lib,
@ -59,25 +59,18 @@ def _espeak_exe(espeak_lib: str, args: list) -> list[bytes]:
        "1",  # UTF8 text encoding
    ]
    cmd.extend(args)
-    logger.debug("espeakng: executing %s", repr(cmd))
+    logger.debug("Executing: %s", repr(cmd))
-    with subprocess.Popen(
+    p = subprocess.run(cmd, capture_output=True, encoding="utf8", check=True)
-        cmd,
+    for line in p.stderr.strip().split("\n"):
-        stdout=subprocess.PIPE,
+        if line.strip() != "":
-        stderr=subprocess.PIPE,
+            logger.warning("%s: %s", espeak_lib, line.strip())
-    ) as p:
+    res = []
-        res = iter(p.stdout.readline, b"")
+    for line in p.stdout.strip().split("\n"):
-        err = iter(p.stderr.readline, b"")
+        if line.strip() != "":
-        for line in err:
+            logger.debug("%s: %s", espeak_lib, line.strip())
-            logger.warning("espeakng: %s", line.decode("utf-8").strip())
+            res.append(line.strip())
-        res2 = list(res)
+    return res
        p.stdout.close()
        if p.stderr:
            p.stderr.close()
        if p.stdin:
            p.stdin.close()
        p.wait()
    return res2
 class ESpeak(BasePhonemizer):
@ -195,8 +188,6 @@ class ESpeak(BasePhonemizer):
        # compute phonemes
        phonemes = ""
        for line in _espeak_exe(self.backend, args):
            logger.debug("line: %s", repr(line))
            ph_decoded = line.decode("utf8").strip()
            # espeak:
            #   version 1.48.15: " p_ɹ_ˈaɪ_ɚ t_ə n_oʊ_v_ˈɛ_m_b_ɚ t_w_ˈɛ_n_t_i t_ˈuː\n"
            # espeak-ng:
@ -206,7 +197,7 @@ class ESpeak(BasePhonemizer):
            #   "sɛʁtˈɛ̃ mˈo kɔm (en)fˈʊtbɔːl(fr) ʒenˈɛʁ de- flˈaɡ də- lˈɑ̃ɡ."
            # phonemize needs to remove the language flags of the returned text:
            #   "sɛʁtˈɛ̃ mˈo kɔm fˈʊtbɔːl ʒenˈɛʁ de- flˈaɡ də- lˈɑ̃ɡ."
-            ph_decoded = re.sub(r"\(.+?\)", "", ph_decoded)
+            ph_decoded = re.sub(r"\(.+?\)", "", line)
            phonemes += ph_decoded.strip()
        return phonemes.replace("_", separator)
@ -226,13 +217,11 @@ class ESpeak(BasePhonemizer):
        args = ["--voices"]
        langs = {}
        for count, line in enumerate(_espeak_exe(_DEF_ESPEAK_LIB, args)):
            line = line.decode("utf8").strip()
            if count > 0:
                cols = line.split()
                lang_code = cols[1]
                lang_name = cols[3]
                langs[lang_code] = lang_name
            logger.debug("line: %s", repr(line))
        return langs
    def version(self) -> str: