From 4e920c29c25359dd16b8128448b6b3b193f55f89 Mon Sep 17 00:00:00 2001 From: Damien Hansen <damien.hansen@uliege.be> Date: Fri, 10 Feb 2023 11:09:49 +0000 Subject: [PATCH] Add readme --- subword_models/README.md | 3 +++ 1 file changed, 3 insertions(+) create mode 100644 subword_models/README.md diff --git a/subword_models/README.md b/subword_models/README.md new file mode 100644 index 0000000..75254ca --- /dev/null +++ b/subword_models/README.md @@ -0,0 +1,3 @@ +## Modèles de segmentation + +Deux modèles de segmentations pré-entraînés sur l'ensemble des corpus utilisés dans cet exercice. Tous deux ont été entraînés grâce à [SentencePiece](https://github.com/google/sentencepiece) (modèle unigramme avec une taille de 16 000 tokens). -- GitLab