Refactor TTSDataset to use TTSTokenizer

2021-11-16 13:33:21 +01:00 · 2021-11-16 13:33:21 +01:00 · b2bb954a51
parent 84091096a6
commit b2bb954a51
1 changed files with 17 additions and 0 deletions
--- a/TTS/tts/datasets/dataset.py
+++ b/TTS/tts/datasets/dataset.py
@ -69,6 +69,9 @@ class TTSDataset(Dataset):

            samples (list): List of dataset samples.

+            tokenizer (TTSTokenizer): tokenizer to convert text to sequence IDs. If None init internally else
+                use the given. Defaults to None.
+
            tokenizer (TTSTokenizer): tokenizer to convert text to sequence IDs. If None init internally else
                use the given. Defaults to None.

@ -202,6 +205,20 @@ class TTSDataset(Dataset):
            token_ids = self.tokenizer.text_to_ids(text)
        return np.array(token_ids, dtype=np.int32)

+    @staticmethod
+    def _parse_sample(item):
+        language_name = None
+        attn_file = None
+        if len(item) == 5:
+            text, wav_file, speaker_name, language_name, attn_file = item
+        elif len(item) == 4:
+            text, wav_file, speaker_name, language_name = item
+        elif len(item) == 3:
+            text, wav_file, speaker_name = item
+        else:
+            raise ValueError(" [!] Dataset cannot parse the sample.")
+        return text, wav_file, speaker_name, language_name, attn_file
+
    def load_data(self, idx):
        item = self.samples[idx]