CamemBERTApr. 27, 2016Zur Projektseite Image credit: Alix ChaguéLanguage ModelingPedro Ortiz SuarezWissenschaftlicher MitarbeiterIch bin wissenschaftlicher Mitarbeiter im Team Speech and Language Technology der DFKI GmbH Berlin.PublikationenCamemBERT: a Tasty French Language ModelWe explore the impact of the training data size on a French version of RoBERTa. (Equal contribution by the first three authors).Louis Martin, Benjamin Muller, Pedro Ortiz Suarez, Yoann Dupont, Laurent Romary, Éric de la Clergerie, Djamé Seddah, Benoît SagotPDF Zitieren Datensatz Projekt Video DOI ACL Anthology arXiv Website ACL 2020 HALLes modèles de langue contextuels Camembert pour le Français : impact de la taille et de l'hétérogénéité des données d'entrainementWe explore the impact of the training data size and heterogeneity on French language modeling. (Equal contribution by the first three authors).Louis Martin, Benjamin Muller, Pedro Ortiz Suarez, Yoann Dupont, Laurent Romary, Éric de la Clergerie, Benoît Sagot, Djamé SeddahPDF Zitieren Datensatz Projekt TALN 2020 HAL Website