Top Tien Pre-Editing Tips (voor nog betere machinevertalingen)

Top Tien Pre-Editing TipsDeel uw nieuws

Hebt u nieuws voor uw collega-taalprofessionals in Europa?

The Language Sector website maakt uw artikel, opinie of andere inhoud (geschreven in om het even welke Europese taal) zo toegankelijk mogelijk voor zo veel mogelijk taalprofessionals in zoveel mogelijk talen.

Met een beperkt aantal relatief kleine interventies kunt u de toegankelijkheid van de machinevertaalde informatie in uw bericht, artikel, opinie of andere inhoud zeer wezenlijk verbeteren.

Hier zijn de top tien tips voor een optimale pre-editing van onze huisexpert Valentin Descamps.


Post-editing is goed 

Met de optimale toegankelijkheid van uw informatie als doel maken we vanzelfsprekend gebruik van de technologieën die de taalsector zelf voortbrengt. Zoals u weet, verbetert de kwaliteit van de vertaalmachines snel. Maar waar nodig kunt u altijd elk artikel op The Language Sector website finetunen tot op het gewenste kwaliteitsniveau in de post-editingomgeving die in onze website is geïntegreerd


Pre-editing is nog beter

Met een goede post-editing kunt u de toegankelijkheid van uw informatie fors verbeteren. Dat klopt. Maar nog tijds- en kosteneffectiever dan een goede post-editing is een goede pre-editing van uw brontekst met het oog op een optimale vertaalbaarheid door de vertaalmachines. Met een beperkt aantal relatief kleine interventies kunt u de toegankelijkheid van de machinevertaalde informatie in uw bericht, artikel, opinie of andere inhoud zeer wezenlijk verbeteren.


Top Tien Pre-Editing Tips

Hier zijn de Top Tien Pre-Editing Tips van onze huisexpert ter zake, Valentin Descamps. Valentin behaalde vorig jaar een masterdiploma in het vertalen aan de Universiteit van Mons in België. Hij is gespecialiseerd in de vertaling uit het Russisch en het Spaans in het Frans.

Voor The Language Sector website presenteert hij u tien eenvoudige maar effectieve technieken waarmee uw tekst vertaalmachinevriendelijker wordt én daardoor toegankelijker in vertaling.

Samengevat is dit zijn advies: met 1 welgemikte pre-edit bespaart u de tijd en de kost van 20 post-edits op The Language Sector website.
Niet aarzelen dus!

 

Gent, 18 december 2020, Valentin Descamps - Doel van het pre-editeren is een zo begrijpelijk mogelijke machinevertaling te genereren in zoveel mogelijk verschillende talen. In de mate dat het nodig is, kan vervolgens de post-editor de machinevertaling “idiomatiseren”.

De tips die ik presenteer, verbeteren de machinevertalingen niet in alle talen in dezelfde mate. Ik heb ze getest op Franse, Russische en Spaanse machinevertalingen uit het Nederlands. De tips maken 9 op de 10 Franse en Spaanse vertalingen begrijpelijker, en 6 op de 10 Russische machinevertalingen. Het kan gebeuren dat een pre-editeertip die de Franse en Spaanse machinevertaling begrijpelijker maakt net het omgekeerde effect sorteert in de Russische vertaling.

Om het effect van de tips te evalueren heb ik Google Translate gebruikt. In de praktijk kunnen andere vertaalmachines een licht ander effect laten zien.
Als voor u de Russische vertaling om welke reden dan ook belangrijker is dan de Spaanse of de Franse, dan kunt u een pre-editing overwegen die meer specifiek op de Slavische talen focust.


Hierna presenteer ik mijn Top Tien Pre-Editing Tips.

Wilt u graag reageren, hebt u een vraag of een suggestie? Neem dan gerust contact met mij op via valentin.descamps@detaalsector.be. Ik kijk uit naar alle mogelijke feedback.

U kunt ook de uitgebreide versie van dit artikel downloaden in pdf. De pdf illustreert elke tip met verschillende voorbeelden (NL > FR / ES / RU).

 

Tip 1: vermijd afkortingen

Vermijd afkortingen. Afkortingen zijn voor de vertaalmachines vaak moeilijk vertaalbaar. Schrijf afkortingen voluit.

 

Tip 2: vermijd zinnen zonder werkwoord

Zinnen zonder werkwoord zijn moeilijk voor de vertaalmachines. Voeg een werkwoord toe, anders riskeert er een werkwoord te ontbreken in de vertaling.

 

Tip 3: verduidelijk het geslacht van eigennamen

Personennamen kunnen specifiek zijn voor een taal of een land.

Voor een lezer zonder achtergrondkennis over het land en voor een vertaalmachine is het niet altijd duidelijk of een naam naar een man of een vrouw verwijst.

Tip: gebruik in de onmiddellijke omgeving van eigennamen zo vaak mogelijk mannelijke of vrouwelijke verwijzende woorden, zodat de machine het gender van de persoon mogelijk uit de context kan afleiden.

 

Tip 4: vermijd te lange zinnen

Hoewel neurale vertaalmachines veel langere zinnen kunnen verwerken dan de vorige generatie (op statistiek gebaseerde) machines, is het toch beter om echt lange zinnen op te splitsen.

 

Tip 5: Speel met de structuur

Hou de structuur van je zinnen zo helder mogelijk. Probeer geen twee ideeën in één zin te proppen. Als twee zinnen een logisch verband met elkaar hebben, gebruik dan verbindingswoorden om de relatie aan te geven.

 

Tip 6: speel met de context

Moderne vertaalmachines bekijken ieder woord in de context van (minstens) de hele zin. Introduceer je een moeilijk woord, introduceer het dan in een context die veel gelieerde informatie bevat die de vertaalmachines gemakkelijk kunnen verstaan. Zo verhoogt u de kans dat ze de zin correct zullen vertalen.

 

Tip 7: speel met synoniemen

Als een heel specifiek woord echt moeilijk blijkt voor de vertaalmachines, stel u dan een beetje soepel op en wees bereid om een synoniem te overwegen. Denk aan de optimale toegankelijkheid van uw informatie in zo veel mogelijk talen.
Is dat ene super precieze woord met die ene super precieze betekenis echt zo belangrijk dat het gerechtvaardigd is dat u er twintig vertaalproblemen mee creëert en twintig post-edits noodzakelijk maakt.

 

Tip 8: Vermijd taalspecifiek idioom

In het Nederlands sturen de mensen hun kat wanneer ze niet op een afspraak verschijnen. De meeste vertaalmachines vertalen zulk idioom dan letterlijk ("zijn kat sturen"), en dat is in vertaling vaak niet begrijpelijk voor de lezer. Het is beter in concrete, expliciete taal te schrijven.

 

Tip 9: corrigeer taalfouten 

Leg de lat hoog. Wees streng voor de kwaliteit van je eigen tekst. Taalfouten in de brontekst kunnen tot taalfouten in de doeltekst leiden. Dus, check nog eens extra je grammatica, spelling, interpunctie en de samenhang van je brontekst. Er zijn tools die jou daarbij kunnen helpen.

 

Tip 10: schrijf in één taal 

Is je tekst in het Nederlands? Schrijf zo veel mogelijk Nederlands. Dat klinkt logisch, maar sommige mensen gebruiken veel Engelse woorden en uitdrukkingen in hun Nederlandse teksten. Geen enkel probleem voor de Engelse vertaalmachine, maar wel vaak des te meer voor de andere machines, die dan minder goed presteren (in het Frans en in de andere Romaanse talen bijvoorbeeld).

 

Download de integrale versie van dit artikel (met voorbeelden) in pdf.

 

Aanvullende gegevens