Contents
Bei neuronalen Übersetzungsmaschinen bleibt Terminologietreue trotz der allgemein hohen Output-Qualität ein rotes Tuch. Wie kann die Einhaltung von terminologischen Vorgaben bei customized NMÜ-Engines für technische Inhalte sichergestellt werden? Entscheidend sind Art, Qualität und Aufbereitung der zum Engine-Training eingesetzten Daten. Der Vortrag zeigt Ergebnisse eines wissenschaftlichen Vergleichs von NMÜ-Engines aus der Praxis.
With neural translation engines, terminology compliance remains a bête noire despite the generally high output quality. How can compliance with terminology specifications be ensured for customized NMT engines for technical content? Decisive factors are the type, quality and preparation of the data used for engine training. The presentation shows results of a scientific comparison of NMT engines in practice.
Takeaways
- Arten der Domänenadaptierung von Engines
- Aufbereitung von Trainingsdaten für domänenadaptierte Engines
- Terminologie-Fehlertypen und Messung der Terminologietreue
- Optimierungspotenziale im Training von Custom Engines
- Types of domain adaptation of engines
- Preparation of training data for domain-adapted engines
- Terminology error types and measurement of terminology fidelity
- Optimization potentials in the training of custom engines
Prior knowledge
- Grundbegriffe der Terminologielehre (Begriff, Benennung, Synonyme, Homonyme etc.)
- Unterschied zwischen generischen und angepassten (cutomized) NMÜ-Engines
- Metriken für MÜ-Qualitätsmessung (BLEU-Score, MQM-Framework etc.)
Speaker
Frauke Hellerich
- Hochschule Würzburg-Schweinfurt
- Show profile