Manon Blanco · 4945936c · 74ffe283 · b84e25c3 · 4945936c · 74ffe283
--- a/dan/datasets/extract/utils.py

+ 3

− 1
+++ b/dan/datasets/extract/utils.py

+ 3

− 1
 @@ -193,10 +193,12 @@ class Tokenizer:
                    vocab_size=self.subword_vocab_size,
                    model_prefix=self.prefix,
                    user_defined_symbols=self.special_tokens,
+                    minloglevel=1,
                )
            except Exception as e:
                logger.warning(
-                    f"Failed to train a sentencepiece model for subword tokenization: {e}"
+                    f"Failed to train a sentencepiece model for subword tokenization: {e} "
+                    "Try again by editing the `--subword-vocab-size` parameter."
                )
                self.sentencepiece_model = None
                return