Skip to content
Snippets Groups Projects
Commit 54c72692 authored by Damien Hansen's avatar Damien Hansen
Browse files

Add readme

parent f2235efb
No related branches found
No related tags found
No related merge requests found
## Jeux de données
Quelques jeux de données permettant d'entraîner un petit modèle de traduction automatique anglais-français. Tous ces corpus proviennent du projet [OPUS](https://opus.nlpl.eu/) et ont été prétraités avec le tokeniseur [Moses](https://github.com/moses-smt/mosesdecoder/tree/master/scripts/tokenizer).
Le corpus Books a également été modifié de manière à ce que les langues ne soient plus inversées.
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment