From 227b9c886429f3f8f8074f5377646cd5bbc58ba8 Mon Sep 17 00:00:00 2001
From: mueller91 <nicolasm@gmx.net>
Date: Wed, 23 Sep 2020 23:27:51 +0200
Subject: [PATCH] fix: split_dataset() runtime reduced from O(N * |items|) to
 O(N) where N is the size of the eval split (max 500) I notice a significant
 speedup on the initial loading of large datasets such as common voice (from
 minutes to seconds)

---
 TTS/tts/utils/generic_utils.py | 10 ++++++----
 1 file changed, 6 insertions(+), 4 deletions(-)

diff --git a/TTS/tts/utils/generic_utils.py b/TTS/tts/utils/generic_utils.py
index a0aba29a..2b165951 100644
--- a/TTS/tts/utils/generic_utils.py
+++ b/TTS/tts/utils/generic_utils.py
@@ -16,13 +16,14 @@ def split_dataset(items):
     np.random.shuffle(items)
     if is_multi_speaker:
         items_eval = []
-        # most stupid code ever -- Fix it !
+        speakers = [item[-1] for item in items]
+        speaker_counter = Counter(speakers)
         while len(items_eval) < eval_split_size:
-            speakers = [item[-1] for item in items]
-            speaker_counter = Counter(speakers)
             item_idx = np.random.randint(0, len(items))
-            if speaker_counter[items[item_idx][-1]] > 1:
+            speaker_to_be_removed = items[item_idx][-1]
+            if speaker_counter[speaker_to_be_removed] > 1:
                 items_eval.append(items[item_idx])
+                speaker_counter[speaker_to_be_removed] -= 1
                 del items[item_idx]
         return items_eval, items
     return items[:eval_split_size], items[eval_split_size:]
@@ -127,6 +128,7 @@ def setup_model(num_chars, num_speakers, c, speaker_embedding_dim=None):
     return model
 
 
+
 def check_config_tts(c):
     check_argument('model', c, enum_list=['tacotron', 'tacotron2'], restricted=True, val_type=str)
     check_argument('run_name', c, restricted=True, val_type=str)