Techgarage

Schlägt sogar Google: Die Übersetzungsmaschine DeepL

by Kevin Kyburz 17. April 2018

Durch die rasanten Fortschritte bei der Entwicklung Künstlicher Intelligenz (KI) werden die Karten neu gemischt – auch auf dem Gebiet der maschinellen Übersetzung. Das kleine Unternehmen DeepL hat mit Hilfe der KI-Technologie sogar eine bessere Übersetzungsmaschine als Google auf den Markt gebracht.

DeepL sei dreimal so gut wie die Konkurrenz

Bis jetzt beherrscht DeepL folgende Sprachen: Deutsch, Englisch, Französisch, Spanisch, Italienisch, Niederländisch und Polnisch. Sie können alle miteinander kombiniert werden. Wann weitere Sprachen hinzukommen, kann DeepL im Moment nicht abschätzen. Es gäbe aber laufende Forschungsprojekte.

In mehreren Tests soll DeepL laut eigenen Angaben wesentlich besser als die Maschinen von Google, Microsoft und Facebook abgeschnitten haben. Professionelle Übersetzer hätten die Übersetzungen von DeepL in einem Blindtest dreimal häufiger als bestes Ergebnis ausgewählt als diejenigen der Konkurrenz (Stand: August 2017). Auch beim BLEU Score – einer qualitativen Messmethode unter Forschern – hätte man über seine Mitstreiter gesiegt.

Teilweise liegen alle gleich falsch: „Pater“statt „Vater“

DeepL Jungle Book

 

The Jungle Book von Rudyard Kipling, New York 1910, S. 1:
„It was seven o’clock of a very warm evening in the Seeonee hills when Father Wolf woke up from his day’s rest, scratched himself, yawned, and spread out his paws one after the other to get rid of the sleepy feeling in the tips.“

DeepL Übersetzer:
„Es war sieben Uhr eines sehr warmen Abends in den Seeonee-Hügeln, als Pater Wolf aus seiner Tagesruhe aufwachte, sich kratzte, gähnte und seine Pfoten nacheinander ausbreitete, um das verschlafene Gefühl in den Spitzen loszuwerden.“

Google Translate:
„Es war sieben Uhr eines sehr warmen Abends in den Bergen von Seeonee, als Pater Wolf von seiner Ruhetage aufwachte, sich kratzte, gähnte und seine Pfoten nacheinander ausbreitete, um das schläfrige Gefühl in den Spitzen loszuwerden.“

Bing Microsoft Translator:
„Es war 07.00 Uhr eines sehr warmen abends in den seoni Hills, als Pater Wolf aus der Ruhe seines Tages aufwachte, sich verkratzte, gähnete und seine Pfoten nacheinander ausbreitete, um das verschlafene Gefühl in den Spitzen loszuwerden.“

Das richtige Training ist entscheidend

Auf die Frage, wieso DeepL bessere Übersetzungsergebnisse als der KI-Gigant Google hervorbringt, antwortet der Technikvorstand von DeepL, Jaroslaw Kutylowski: „DeepL ist auch ein Gigant in Sachen KI. Wir beschäftigen uns als Firma seit 10 Jahren mit verschiedensten Techniken und haben ein hervorragendes Team von Entwicklern und Researchern, die den Teams von Google/ Microsoft/ Facebook anscheinend sogar überlegen sind.“

Neben den besseren Köpfen ist es also die jahrelange Erfahrung, die DeepL so erfolgreich macht. Das Unternehmen betreibt seit zehn Jahren die Übersetzungs-Suchmaschine Linguee und kann auf deren Datenschatz zugreifen. Das Besondere an Linguee: hier werden menschliche Übersetzungen von mehrsprachigen Webseiten aus dem Internet zusammengesucht und dem Nutzer als Suchergebnis angezeigt.

Linguee konnte auf diese Art mehr als eine Milliarde Übersetzungen aus qualifizierter Menschenhand sammeln. Mit dieser enormen Datengrundlage füttert DeepL nun seine Künstliche Intelligenz – ein neuronales Netz, das mit Hilfe eines extrem leistungsfähigen Supercomputers trainiert wird. Neuronale Netze sind der Versuch, das menschliche Gehirn mit seinen Nervenzell-Vernetzungen nachzubilden.

Google verwendet andere Netze

Laut der Nachrichten-Webseite Heise.de verfolge DeepL grundsätzlich einen anderen Ansatz als Google. Während Google rekurrente Netze verwende, die bei der Übersetzung ein Wort nach dem anderen betrachten, setze DeepL auf konvolutionelle Netze, die alle Wörter parallel analysieren. Damit sei DeepL vor allem schneller als Google.

Zusätzlich gehe Heise.de davon aus, dass DeepL einen besseren Aufmerksamkeits-Mechanismus nutze, der Wortbedeutungen auf mehreren Ebenen vergleiche. Google verwende zwar auch einen solchen Vergleichsmechanismus, allerdings nur auf einer einzigen Ebene.

Advertisements

Und schliesslich sei anzunehmen, dass DeepL mit einem Wahrscheinlichkeits-Algorithmus arbeite, der in der Lage sei, auch unwahrscheinlichere Übersetzungen auszuwählen, sofern diese besser in den Satz passen.

Ausnahmsweise übersetzt Microsoft am besten – zum Teil

The Jungle Book, von Rudyard Kipling, New York 1910, S. 116:
„‚Who calls?‘said Shere Khan, and a splendid peacock fluttered up out of the ravine, screeching.“

DeepL Übersetzer:
„‚Wer ruft an?‘sagte Shere Khan, und ein prächtiger Pfau flatterte kreischend aus der Schlucht.“

Google Translate:
„‚Wer ruft an?‘sagte Shere Khan, und ein großartiger Pfau flatterte schreiend aus der Schlucht.“

Bing Microsoft Translator:
„‚Wer ruft?‘, sagte Shere Khan, und ein prächtiger Pfau flatterte aus der Schlucht, Quietschen.“

„Absolute Fehlerfreiheit ist utopisch“

Wer mit der Übersetzung unzufrieden ist, kann bei DeepL durch den Mauszeiger auf einzelne Wörter klicken. DeepL zeigt sofort eine Liste von Alternativ-Übersetzungen an, aus denen der Nutzer die passende wählen kann. Bei Texten bietet Google einen vergleichbaren Service nur für ganze Sätze an. Alternativvorschläge für einzelne Wörter kann man bei Google nur nutzen, wenn ein einziges Wort übersetzt wird.

Ich habe DeepL gefragt, wann seine Künstliche Intelligenz Übersetzungen ohne Fehler liefern wird. Technikvorstand Jaroslaw Kutylowski sagt dazu: „Absolute Fehlerfreiheit ist utopisch. Die erreicht auch ein Gremium von 10 menschlichen Übersetzern nicht. Dafür ist Sprache zu mehrdeutig, ungenau und vielfältig. Es gibt eben nicht ‚DIE‘ richtige Übersetzung. Wir denken aber, dass die Übersetzungsqualität in den nächsten Jahren noch rasant steigen wird.“

Bei längeren Sinnzusammenhängen siegt eindeutig DeepL

The Jungle Book, von Rudyard Kipling, New York 1910, S. 93:
„When Mowgli left the wolf’s cave after the fight with the Pack at the Council Rock, he went down to the plowed lands where the villagers lived, but he would not stop there because it was too near to the jungle, and he knew that he had made at least one bad enemy at the Council.“

DeepL Übersetzer:
„Als Mowgli die Wolfshöhle nach dem Kampf mit dem Rudel am Ratsfelsen verließ, ging er in die gepflügten Länder, wo die Dorfbewohner lebten, aber er wollte dort nicht aufhören, weil es zu nah am Dschungel war, und er wusste, dass er sich mindestens einen schlechten Feind im Rat gemacht hatte.“

Google Translate:
„Als Mowgli die Wolfshöhle nach dem Kampf mit dem Rudel am Ratsfelsen verließ, ging er hinunter in die gepflügten Länder, in denen die Dorfbewohner wohnten, aber er wollte nicht dort stehenbleiben, weil er dem Dschungel zu nahe war, und er wusste, dass er es getan hatte machte mindestens einen bösen Feind im Rat.“

Bing Microsoft Translator:
„Als Mowgli die Höhle des Wolfs nach dem Kampf mit dem Rudel im Council Rock verließ, er ging hinunter in die gepflügt Land, wo die Dorfbewohner lebten, aber er würde nicht aufhören, weil es zu nahe an den Dschungel, und er wusste, dass er mindestens einen schlechten Feind an der gemacht Rat.“

Fazit

Auch in meinen Testübersetzungen schloss DeepL eindeutig besser ab als Google und Bing. Microsofts Übersetzer fällt am häufigsten durch grammatikalische Fehler auf. Bei einzelnen Wortbedeutungen hat mal die eine mal die andere Übersetzungsmaschine den besseren Riecher. Wenn es aber um längere Sinnzusammenhänge geht, meistert DeepL die Herausforderungen weit besser als die Konkurrenz.

Künstliche Intelligenzen entwickeln sich durch Lernen. Wenn ein Nutzer also eine alternative Übersetzung aus einer Vorschlagliste wählt, trainiert er damit das neuronale Netzwerk auf Perfektion. Google bietet zwar auch Alternativ-Übersetzungen zur Auswahl an. Diese sind bei Texten jedoch unübersichtlich, da immer ganze Sätze angezeigt werden. DeepL hat das praktischer gelöst, da es stets Alternativen für einzelne Wörter anzeigen kann. Dadurch wird die Funktion viel eher verwendet und DeepL ständig verbessert; mit jeder neuen Korrektur-Auswahl seiner Nutzer.

Die Basis-Ausführung des DeepL-Übersetzers ist kostenlos. Zusatzfunktionen müssen bezahlt werden. Dazu gehört ein verbesserter Datenschutz, die Nutzung einer Programmier-Schnittstelle, die Integration in andere Übersetzungsprogramme und die Aufhebung der Textlängen-Beschränkung von 5000 Zeichen pro Übersetzungsvorgang. Der durchschnittliche Privatanwender kommt ohne die kostenpflichtige DeepL-Pro-Version aus. DeepL funktioniert nur im Webbrowser und es gibt keine iPhone oder Android App.

Advertisements
Kevin Kyburz

Kevin Kyburz

Kevin Kyburz gehört zu der Generation Y, welche mit einem Windows 95 Computer und der ersten PlayStation aufgewachsen sind. Seit seiner Entdeckung des Internets gibt es keine Grenzen mehr.

Comment Form

Required fields are marked *

Abonniere unseren Newsletter und erhalten die nächsten News aus erster Hand.