better version control for phonemizer

2020-03-02 12:53:55 +01:00 · 2020-03-02 12:53:55 +01:00 · c825b63d4c
parent a68012aec2
commit c825b63d4c
2 changed files with 4 additions and 3 deletions
--- a/datasets/preprocess.py
+++ b/datasets/preprocess.py
@ -84,7 +84,7 @@ def mozilla_de(root_path, meta_file):
        for line in ttf:
            cols = line.strip().split('|')
            wav_file = cols[0].strip()
-            text = cols[1].strip()            
+            text = cols[1].strip()
            folder_name = f"BATCH_{wav_file.split('_')[0]}_FINAL"
            wav_file = os.path.join(root_path, folder_name, wav_file)
            items.append([text, wav_file, speaker_name])
--- a/utils/text/init.py
+++ b/utils/text/init.py
@ -1,6 +1,7 @@
 # -*- coding: utf-8 -*-

 import re
+from packaging import version
 import phonemizer
 from phonemizer.phonemize import phonemize
 from TTS.utils.text import cleaners
@ -28,7 +29,7 @@ def text2phone(text, language):
    seperator = phonemizer.separator.Separator(' |', '', '|')
    #try:
    punctuations = re.findall(PHONEME_PUNCTUATION_PATTERN, text)
-    if float(phonemizer.__version__) < 2.1:
+    if version.parse(phonemizer.__version__) < version.parse('2.1'):
        ph = phonemize(text, separator=seperator, strip=False, njobs=1, backend='espeak', language=language)
        ph = ph[:-1].strip() # skip the last empty character
        # phonemizer does not tackle punctuations. Here we do.
@ -42,7 +43,7 @@ def text2phone(text, language):
            else:
                for punct in punctuations:
                    ph = ph.replace('| |\n', '|'+punct+'| |', 1)
-    elif float(phonemizer.__version__) == 2.1:
+    elif version.parse(phonemizer.__version__) >= version.parse('2.1'):
        ph = phonemize(text, separator=seperator, strip=False, njobs=1, backend='espeak', language=language, preserve_punctuation=True)
        # this is a simple fix for phonemizer.
        # https://github.com/bootphon/phonemizer/issues/32