Maschinelle Übersetzung im Wandel: Die Auswirkungen von künstlicher Intelligenz auf maschinelle Übersetzungssysteme. Mit einer vergleichenden Untersuchung von Google Translate und Microsoft Translator
Von Aaron Matthiesen
()
Über dieses E-Book
Die Forschung der vergangenen Jahrzehnte ist geprägt von euphorischen Visionen und bitteren Niederschlägen, dem Entwickeln, Verwerfen und Neuentwickeln unterschiedlicher Methoden.
Seitdem 2016 unter anderem Google und Microsoft erfolgreich die aufstrebende Technologie der künstlichen Intelligenz und selbstlernender Software auf ihre Online-Übersetzungsdienste angewendet haben, ist das Feld von einer neuen Euphorie gepackt.
Dieses Buch behandelt die Geschichte und die verschiedenen Ansätze maschineller Übersetzung von 1933 bis heute. Dabei werden typische Probleme der Systeme angesprochen, aber auch aufgezeigt, zu welchen Leistungen KI-Systeme und Deep Learning bereits fähig sind.
Außerdem sollfestgestellt werden, ob mit der aktuellen Generation neuronaler Übersetzungssysteme ein neuerlicher Wandel erkennbar ist, ob Software gar Sprache verstehen kann. Dazu wird untersucht, wie gut drei Übersetzungssysteme mit unterschiedlichen sprachlichen Problemfällen wie Mehrdeutigkeiten umgehen können.
Aaron Matthiesen
Hat vor kurzem sein Hochschulstudium an der Hochschule Flensburg als Technischer Redakteur abgeschlossen.
Ähnlich wie Maschinelle Übersetzung im Wandel
Ähnliche E-Books
Keine Angst vor Industrie 4.0: Digitalisierung als Chance für humane Arbeit Bewertung: 0 von 5 Sternen0 BewertungenKultur und Übersetzung: Studien zu einem begrifflichen Verhältnis Bewertung: 0 von 5 Sternen0 BewertungenÜbersetztes und Unübersetztes: Das Versprechen der Translation und ihre Schattenseiten Bewertung: 0 von 5 Sternen0 BewertungenKorpusgestützte Textanalyse: Grundzüge der Ebenen-orientierten Textlinguistik Bewertung: 0 von 5 Sternen0 BewertungenInternetlinguistik: Ein Lehr- und Arbeitsbuch Bewertung: 0 von 5 Sternen0 BewertungenKorpuslinguistik: Eine Einführung Bewertung: 0 von 5 Sternen0 BewertungenPoetik: Eine literaturtheoretische Einführung Bewertung: 0 von 5 Sternen0 BewertungenLiteratur und Mehrsprachigkeit: Ein Handbuch Bewertung: 0 von 5 Sternen0 BewertungenModerne Pragmatik: Grundbegriffe und Methoden Bewertung: 0 von 5 Sternen0 BewertungenÜbersetzungstheorien Bewertung: 0 von 5 Sternen0 BewertungenLexikologie Bewertung: 0 von 5 Sternen0 BewertungenMehrsprachigkeit und Bildungsgerechtigkeit: Erkundungen einer didaktischen Perspektive Bewertung: 0 von 5 Sternen0 BewertungenDie Syntax-Pragmatik-Schnittstelle: Ein Studienbuch Bewertung: 0 von 5 Sternen0 BewertungenMehrsprachige Leseförderung: Grundlagen und Konzepte Bewertung: 0 von 5 Sternen0 BewertungenTextlinguistik: 15 Einführungen Bewertung: 0 von 5 Sternen0 BewertungenÜbersetzungstheorien: Eine Einführung Bewertung: 0 von 5 Sternen0 BewertungenMethoden der Fremdsprachenforschung Bewertung: 0 von 5 Sternen0 BewertungenMethodik für Linguisten: Eine Einführung in Statistik und Versuchsplanung Bewertung: 0 von 5 Sternen0 BewertungenWissenschaftliches Arbeiten für Linguisten Bewertung: 0 von 5 Sternen0 BewertungenSprachmittlung im Fremdsprachenunterricht: Mit Anwendungsbeispielen für den Spanischunterricht Bewertung: 0 von 5 Sternen0 BewertungenSprachkontaktforschung: Eine Einführung Bewertung: 5 von 5 Sternen5/5Schule neu gedacht - Schule neu gemacht: Die moderne Schule. Reformpädagogische Unterrichtsentwicklung Bewertung: 0 von 5 Sternen0 BewertungenNormen und Variation Bewertung: 0 von 5 Sternen0 BewertungenAnwendung von Mnemotechnik beim Fremdsprachenlernen in der Erwachsenenbildung am Beispiel von Erlernen des arabischen Alphabets Bewertung: 0 von 5 Sternen0 BewertungenGerichtsdolmetschen: Grundwissen und -fertigkeiten Bewertung: 0 von 5 Sternen0 BewertungenÜbersetzung und Linguistik: Grundlagen der Übersetzungsforschung II Bewertung: 0 von 5 Sternen0 BewertungenVarietätenlinguistik: Eine Einführung Bewertung: 0 von 5 Sternen0 BewertungenÜbersetzungswissenschaft: Eine Einführung Bewertung: 0 von 5 Sternen0 BewertungenSprachmittlung Bewertung: 0 von 5 Sternen0 BewertungenWerbesprache als Spiegel der Gesellschaft?: Anzeigentexte und Werbung im Laufe der Jahrzehnte Bewertung: 0 von 5 Sternen0 Bewertungen
Sprachkunst & Disziplin für Sie
101 Conversations in Intermediate German: 101 Conversations | German Edition, #2 Bewertung: 3 von 5 Sternen3/5101 Conversations in Simple German: 101 Conversations | German Edition, #1 Bewertung: 4 von 5 Sternen4/5Mündliche Prüfung Deutsch für den Beruf DTB/BSK B2: 15 Übungen zur DTB mündlichen Prüfungsvorbereitung B2 Bewertung: 4 von 5 Sternen4/5Brieftraining für Deutschlerner B2: Zur Prüfungsvorbereitung Bewertung: 4 von 5 Sternen4/5Ich REDE. Ein Hoch auf Deutsch Bewertung: 0 von 5 Sternen0 BewertungenSystemische Fragetechniken für Fach- und Führungskräfte, Berater und Coaches: Die Bedeutung von Fragen im Beruf Bewertung: 0 von 5 Sternen0 BewertungenGerman Reader, Level 4 Intermediate (B2): Mein Leben in Wien - 1. Teil: German Reader, #1 Bewertung: 5 von 5 Sternen5/5Was nicht mehr im Duden steht: Eine Sprach- und Kulturgeschichte Bewertung: 0 von 5 Sternen0 BewertungenGrundwortschatz Deutsch - Englisch: Das praktische eBook mit den wichtigsten Wörtern auf Deutsch und Englisch Bewertung: 5 von 5 Sternen5/5Mündliche Prüfung Deutsch B1: Übungen zur Prüfungsvorbereitung B1 Deutsch als Fremdsprache Bewertung: 4 von 5 Sternen4/5Merk dir das! Grammatik bis B1: German Grammar explained in English Bewertung: 0 von 5 Sternen0 BewertungenDie deutsche Sprache: Ursprünge, Entwicklung und Wandel Bewertung: 0 von 5 Sternen0 BewertungenMündliche Prüfung Deutsch für den Beruf DTB/BSK C1: 10 Modelltests für die mündliche Prüfung mit Formulierungshilfen Bewertung: 4 von 5 Sternen4/5Deutsch B2 Beschwerdebriefe Schreiben: Schritt für Schritt Prüfungsvorbereitung mit prüfungsähnlichen Modelltests, Redemitteln und Lösungsvorschlägen Bewertung: 0 von 5 Sternen0 Bewertungen75 einfache Spiele ohne viel Vorbereitung für den Deutschkurs: Deutsch als Fremdsprache, #1 Bewertung: 0 von 5 Sternen0 BewertungenBin ich denn der Einzigste hier, wo Deutsch kann?: ber den Niedergang unserer Sprache Bewertung: 4 von 5 Sternen4/5Sprachbausteine Deutsch B2-C1 Medizin Fachsprachprüfung (FSP): 10 Übungen zur FSP-Prüfungsvorbereitung mit Lösungen Bewertung: 4 von 5 Sternen4/5Berliner Brieftraining Bewerbung: Prüfungsvorbereitung Bewertung: 5 von 5 Sternen5/5Fremdsprachenlernen mit System: Das große Handbuch der besten Strategien für Anfänger, Fortgeschrittene und Profis Bewertung: 5 von 5 Sternen5/5Schreibkompetenzen in der Fremdsprache: Aufgabengestaltung, kriterienorientierte Bewertung und Feedback Bewertung: 4 von 5 Sternen4/5Birkenbihls Denkwerkzeuge: gehirn-gerecht zu mehr Intelligenz und Kreativität Bewertung: 4 von 5 Sternen4/5Fragen Sie einfach!: Deutsche Grammatik in leichter Sprache Bewertung: 5 von 5 Sternen5/5
Rezensionen für Maschinelle Übersetzung im Wandel
0 Bewertungen0 Rezensionen
Buchvorschau
Maschinelle Übersetzung im Wandel - Aaron Matthiesen
Maschinelle Übersetzung im Wandel: Die Auswirkungen von künstlicher Intelligenz auf maschinelle Übersetzungssysteme. Mit einer vergleichenden Untersuchung von Google Translate und Microsoft Translator
Abkürzungsverzeichnis
1 Einleitung
2 Aufbau der Arbeit
3 Definitionen
3.1 Künstliche Intelligenz
3.2 Maschinelles Lernen
3.3 Künstliche neuronale Netze und Deep Learning
3.4 Maschinelle Übersetzung
4 Geschichtlicher Hintergrund zur Maschinellen Übersetzung
4.1 Experimentelle Phase (1933 - 1954)
4.2 Optimistische Phase (1954 - 1966)
4.3 Phase der Umorientierung (1966 - 1975)
4.4 Das Wiederaufleben (1975 - 1989)
4.5 Entwicklungen nach 1989
5 Verschiedene Methoden maschineller Übersetzung
5.1 Regelbasierte Übersetzung
5.1.1 Direkte Übersetzung
5.1.1 Interlingua-basierte Übersetzung
5.1.2 Transfer-basierte Übersetzung
5.2 Statistische Übersetzung
5.3 Beispielbasierte Übersetzung
5.4 Neuronale Übersetzung
6 Erfolge und Probleme von maschineller Übersetzung
6.1 Vorteilhafte Bedingungen für maschinelle Übersetzung
6.2 Fehlerursachen bei maschineller Übersetzung
7 Vergleich eines statistischen maschinellen Übersetzungssystems mit zwei neuronalen Systemen
7.1 Vorstellung der untersuchten Systeme
7.1.1 Microsoft Translator
7.1.2 Google Translate
7.2 Testszenarien
7.3 Testkriterien
7.4 Testergebnisse
7.4.1 Sätze ohne bewusste Problemsituationen
7.4.2 Lexikalische Divergenz
7.4.3 Syntaktische Divergenz
7.4.4 Lexikalische Ambiguität
7.4.5 Strukturelle Ambiguität
7.4.6 Referentielle Ambiguität
7.4.7 Besonderheiten bei Eigennamen und feststehenden Übersetzungen
7.4.8 Idiome und Kollokationen
7.4.9 Fehler im Ausgangstext
7.5 Auswertung der Ergebnisse
8 Ausblick
9 Zusammenfassung und Fazit
10 Literatur
Anhang
Abkürzungsverzeichnis
1 Einleitung
Die Bezeichnung „Künstliche Intelligenz wurde vor über 60 Jahren auf einer Konferenz von Informatikern geprägt, und bis heute hat die Forschungsdisziplin nicht an Faszination verloren (Görz/Schneeberger/Schmid 2014: 1-3). Dies mag auch darauf zurückzuführen sein, dass die Idee, etwas zu erschaffen, das dem Menschen in seinen geistigen Fähigkeiten gleicht, bis in die Antike zurückreicht. Seit dem Aufkommen von Automaten und ersten Computern werden in Science-Fiction-Werken intelligente Roboter und Maschinen thematisiert, etwa der Bordcomputer HAL 9000 im Film „2001 A Space Odyssey
aus dem Jahr 1968: Dieser kann mit seinen menschlichen Kollegen kommunizieren und Schach spielen, entwickelt sich jedoch später dahingehend, dass er sie übertrumpft und tötet. (Xanke/Bärenz 2012: 36-39)
In der Realität wurde der menschliche Weltmeister im Schach bereits 1997 vom IBM-Programm „DeepBlue" durch mathematische Rechenleistung geschlagen, 2016 und 2017 waren Computersysteme menschlichen Profi-Gegenspielern auch in deutlich komplexeren Spielen mehrfach überlegen (Hummel 2017: s. p.). Maschinelles Lernen, die Technologie, die dafür verantwortlich ist, ermöglicht es trainierter Software ebenfalls, Katzen oder Krebszellen auf Bildern zu erkennen (Dittberner 2017: s. p.). Zugleich sind seit wenigen Jahren digitale Assistenten auch im Alltag keine Besonderheit mehr, die auf gestellte Fragen mit ganzen Sätzen antworten (Schmitt 2017: s. p.).
Sollen solche Mensch-Maschine-Dialoge erfolgreich sein, bedarf es ausgereifter maschineller Sprachverarbeitung. Denn während es Menschen vergleichsweise leichtfällt, eine Sprache zu erlernen, ist es in der Informatik ein ungleich schwierigeres Problem, aus einer Anordnung von Wörtern die enthaltene Bedeutung abzuleiten (Kiser 2016: s. p.).
Diese Problematik betrifft auch das verwandte Gebiet der maschinellen Übersetzung von Texten, auf dem ebenfalls seit über 50 Jahren geforscht wird. Verschiedene Systeme für maschinelle Übersetzung sind seit Jahren oder Jahrzehnten im Einsatz, obgleich das Feld bereits für untauglich, unmöglich oder gar „tot" erklärt wurde (Lehrberger/Bourbeau 1988: 2).
Maschinelle Übersetzung ist eine permanent relevante Thematik, da die Menge an Texten, die zu übersetzen ist, ebenso wie die Zahl der notwendigen Sprachkombinationen stetig ansteigt. Die möglichst schnelle mehrsprachige Verfügbarkeit von Texten ist eine wichtige Voraussetzung für Kommunikation in verschiedenen Bereichen, doch die Zahl und Leistungsfähigkeit menschlicher Übersetzer ist für die Bewältigung vielfach nicht ausreichend. (Krenz/Ramlow 2008: 25)
Die Globalisierung insgesamt, aber auch konkrete aktuelle Ereignisse wie die Flüchtlingskrise verdeutlichen den Bedarf an automatischer unmittelbarer Übersetzung: Der Online-Übersetzungsdienst Google Translate verzeichnete in einem kurzen Zeitraum beim Sprachenpaar Arabisch-Deutsch einen Anstieg von Übersetzungen um das Fünffache. (Lewis-Kraus 2016: s. p.)
Dass dieser populäre Dienst monatlich von einer halben Milliarde Nutzer verwendet wird, die pro Tag 140 Milliarden Wörter übersetzen lassen (ibid.), zeigt die Bedeutung solcher Anbieter kostenfreier maschineller Übersetzung. Trotz jahrelanger Entwicklung ließ die sprachliche Qualität der übersetzten Sätze allerdings oft zu wünschen übrig, da die meisten Systeme bisher Satzsegmente einzeln mit Datenbanken abglichen, um statistisch wahrscheinliche Übersetzungen zu finden und diese zu einem Zielsatz zu kombinieren (ibid.).
Im Herbst 2016 kündigten jedoch beinahe zeitgleich nicht nur Google, sondern auch Microsoft sowie der seit Jahrzehnten etablierte Übersetzungsanbieter Systran eine Neuentwicklung auf dem Feld maschineller Übersetzung an: Eine neue Methode, die sich künstliche Intelligenz bzw. maschinelles Lernen zunutze macht. Dieser sogenannte neuronale Ansatz soll im Vergleich zum bisher oft verwendeten statistischen Ansatz eine bessere Übersetzungsqualität liefern, indem Sätze oder gar deren Bedeutung als Ganzes analysiert bzw. erfasst und übersetzt werden sollen. Microsoft und Google sind sich bezüglich der Qualitätsverbesserungen so sicher, dass sie ihre Übersetzungsdienste für einige Sprachen bereits ganz oder teilweise auf das neuronale System umgestellt haben. (Hartford 2017: s. p.)
Daraus ergibt sich die Frage, mit der sich die diese Arbeit auseinandersetzt: Führen die neuen Technologien zu derart bemerkenswerten Verbesserungen, dass man hinsichtlich Nutzen und Übersetzungsqualität von einem neuen Wandel sprechen kann, wenn man ein statistisches maschinelles Übersetzungssystem mit zwei neuronalen vergleicht?
Das Ziel der folgenden Arbeit ist es, diese Fragestellung auf der Grundlage empirischer Daten zu beantworten, welche in einer Untersuchung dreier Übersetzungssysteme erhoben werden. Ein besonderes Augenmerk wird dabei auf die maschinelle Übersetzung von Sätzen mit typischen Übersetzungsproblemen gelegt. Der Vergleich erfolgt unter Berücksichtigung verschiedener Methoden maschineller Übersetzung und ihrer geschichtlichen Entwicklung.
2 Aufbau der Arbeit
Dazu ist die Arbeit wie folgt strukturiert: Zu Beginn werden vier Begriffe bzw. Themengebiete grundlegend definiert, die nicht nur aktuell viel Aufmerksamkeit erfahren, sondern vor allem für die folgende Arbeit und ihr Verständnis wesentlich sind. Nachdem deren Verwendung für diese Arbeit festgelegt und mittels aktueller Anwendungsbeispiele ein Überblick geschaffen wurde, wird detaillierter auf das Feld der maschinellen Übersetzung eingegangen.
Hierfür wird zunächst die geschichtliche Entwicklung des Fachgebiets von 1933 bis heute chronologisch zusammengefasst und in fünf Phasen unterteilt, die sich aus bedeutenden Meilensteinen oder Wendepunkten ergeben. Anschließend werden die Methoden maschineller Übersetzung erläutert, die sich im Laufe der Zeit ablösten oder parallel existierten, um ein Verständnis für die unterschiedlichen Ansätze zu schaffen. Dies schließt auch die Methoden ein, welche die in dieser Arbeit untersuchten Systeme nutzen.
Kapitel 6 legt dar, unter welchen Voraussetzungen maschinelle Übersetzung einerseits erfolgreich sein kann und welche Ursachen andererseits zu Schwierigkeiten bei der Übersetzung führen können.
Mit diesem Kapitel sind die notwendigen theoretischen Grundlagen gelegt, sodass in Kapitel 7 der praktische Teil der Arbeit folgen kann, in welchem zwei verschiedene Ansätze maschineller Übersetzung anhand von drei Systemen empirisch verglichen werden. Dazu werden nach der Vorstellung der untersuchten Systeme, der Testszenarien und -kriterien die Testergebnisse für verschiedene