diff --git a/subword_models/README.md b/subword_models/README.md new file mode 100644 index 0000000000000000000000000000000000000000..75254caa66847e3688d4f4d36d11c2d61cd00422 --- /dev/null +++ b/subword_models/README.md @@ -0,0 +1,3 @@ +## Modèles de segmentation + +Deux modèles de segmentations pré-entraînés sur l'ensemble des corpus utilisés dans cet exercice. Tous deux ont été entraînés grâce à [SentencePiece](https://github.com/google/sentencepiece) (modèle unigramme avec une taille de 16 000 tokens).