Preserve [ja] token of the text processing

2023-10-21 11:26:03 +02:00 · 2023-10-21 11:26:03 +02:00 · dad6a7b0b6
parent c7a16042e3
commit dad6a7b0b6
1 changed files with 3 additions and 0 deletions
--- a/TTS/tts/layers/xtts/tokenizer.py
+++ b/TTS/tts/layers/xtts/tokenizer.py
@ -483,10 +483,13 @@ class VoiceBpeTokenizer:
            if lang == "zh-cn":
                txt = chinese_transliterate(txt)
        elif lang == "ja":
+            assert txt[:4] == "[ja]", "Japanese speech should start with the [ja] token."
+            txt = txt[4:]
            if self.katsu is None:
                import cutlet
                self.katsu = cutlet.Cutlet()
            txt = japanese_cleaners(txt, self.katsu)
+            txt = "[ja]" + txt
        else:
            raise NotImplementedError()
        return txt