Über mich

Ich bin Doktorand in Informatik und arbeite in Computerlinguistik (CL) für historische Dokumente an der Sorbonne Université und im ALMAnaCH-Forschungsteam in Inria.

Ich interessiere mich für große Korpora zum Trainieren von Sprachmodellen, insbesondere für unterversorgte Sprachen und historische Sprachen. Ich interessiere mich für Aufgaben wie Name Entity Recognition (NER), Dependency Parsing und Part-of-Speech Tagging, maschinelle Übersetzung und Dokumentenstrukturierung.

Ich liebe Kaffee, Kekse und Mathe. ☕🍪

Interessen
  • Sprachmodellierung
  • Korpuslinguistik
  • Named Entity Recognition
  • Computerlinguistik
  • Maschinelle Übersetzung
Bildung
  • Ph.D. in Informatik

    Sorbonne Université

  • BASc MIASHS, 2018

    Université Paris 8

  • MSc in Mathematik, 2017

    Aix-Marseille Université

  • BSc in Mathematik, 2016

    Universidad Nacional de Colombia

Aktuelle Veröffentlichungen

Projekte

*
BASNUM

BASNUM

Digitization and analysis of Basnage de Beauval’s Universal Dictionary: lexicography and scientific networks

CamemBERT

CamemBERT

A state-of-the-art language model for French.

OSCAR

OSCAR

OSCAR or Open Super-large Crawled Aggregated coRpus is a huge multilingual corpus

Kontakt