[vc_row][vc_column][vc_custom_heading text=“Mehrsprachigkeit aus der Maschine“ font_container=“tag:h1|font_size:48|text_align:left“ use_theme_fonts=“yes“ css=“.vc_custom_1600082633362{margin-top: -25px !important;}“][vc_column_text]Christine Bruckner, Beraterin für Übersetzungstechnologie[/vc_column_text][ultimate_spacer height=“15″ height_on_tabs=“15″ height_on_tabs_portrait=“15″ height_on_mob_landscape=“15″ height_on_mob=“15″][/vc_column][/vc_row][vc_row][vc_column][vc_custom_heading text=“Kurz & Bündig“ font_container=“tag:h2|font_size:34|text_align:left“ use_theme_fonts=“yes“ css=“.vc_custom_1600082683282{margin-top: -25px !important;}“ el_class=“box-headline“][vc_row_inner el_class=“box-content-wrapper“][vc_column_inner][vc_column_text]
Übersetzungsautomatisierung ist ein wichtiges Instrument für internationalen Handel und Kommunikation. Maschinelle Übersetzungslösungen auf dem aktuellen Entwicklungsstand ermöglichen kostengünstige Quick&Dirty-Übersetzung zwecks Inhaltserschließung fremdsprachiger Textmengen sowie Unterstützung bei der mehrsprachigen Kommunikation. Für hochwertige Kommunikation bieten sie kostenoptimierte Möglichkeiten durch Integration in einen teilautomatisierten Übersetzungsprozess mit Qualitätssicherung durch professionelle Übersetzer.
[/vc_column_text][/vc_column_inner][/vc_row_inner][/vc_column][/vc_row][vc_row css=“.vc_custom_1519752670572{margin-top: -10px !important;}“][vc_column][ultimate_spacer height=“30″ height_on_tabs=“15″ height_on_tabs_portrait=“15″ height_on_mob_landscape=“15″ height_on_mob=“15″][vc_column_text]
Die Nutzung und Akzeptanz maschineller Übersetzungsangebote – wie von Google Translate oder auch dem deutschen KI-Ehrenpreisträger DeepL – steigt in den letzten Jahren rapide an, dank zunehmend besserer Qualität durch Einsatz tiefer neuronaler Netze sowie der Verfügbarkeit von kostenlosen Online-Lösungen und spezialisierten On-Premise- oder Cloud-Lösungen. Das Ende der Sprachgrenzen dank Algorithmen scheint nahe – doch neben technischen Herausforderungen birgt die neuronale Übersetzungstechnologie nach wie vor Unzulänglichkeiten inhaltlicher Art.
[/vc_column_text][/vc_column][/vc_row][vc_row][vc_column][vc_custom_heading text=“Big Data und maschinelle Übersetzung“ font_container=“tag:h3|text_align:left“][vc_column_text]
Waren in den 1950er Jahren im Wesentlichen militärische Interessen die Treiber der Forschung und Anwendung maschineller Übersetzung zwecks Auswertung fremdsprachiger Textmengen, so fördern im 21. Jahrhundert hauptsächlich wirtschaftliche Interessen und Akteure die Weiterentwicklung, Integration und Nutzung von maschineller Übersetzung (Machine Translation, MT).
Die zu übersetzende Menge an Texten steigt im „Big Data“-Zeitalter rasant und kontinuierlich an – und wäre durch menschliche Übersetzer allein bei weitem nicht zu bewältigen. Das auf die Sprachdienstleistungsbranche spezialisierte US-Marktforschungsunternehmen Common Sense Advisory (CSA) bezifferte im Dezember 2019 das aktuelle Datenvolumen auf eine Produktion von fast 3 × 1018 Bytes pro Tag. Um lediglich 0,01 % dieser gesamten Menge in nur eine Sprache zu übersetzen, müssten 1.000 Übersetzer Vollzeit – also acht Stunden am Tag – 61.375 Jahre lang arbeiten [1].
So ist es naheliegend, aus Zeit- und Kostengründen auf vollautomatische Übersetzung zurückzugreifen. Der Einsatz datengestützter Technologieansätze, wie sie seit dem 21. Jahrhundert in der maschinellen Übersetzung eingesetzt werden, ermöglicht eine zunehmende Zahl an Sprachkombinationen: Mussten im früheren regelbasierten Ansatz noch linguistische Regeln manuell von Computerlinguisten maschinengerecht pro Sprachpaar kodiert werden, so „lernt“ im neuronalen Übersetzungsansatz (NMT, neural machine translation) die Maschine selbst aus ein- und zweisprachigen Datenmengen den Kontext von Wörtern: Beim Übersetzungsvorgang selbst werden pro Satz zahlreiche Schichten tiefer neuronaler Netze durchlaufen, um die fremdsprachliche Entsprechung zu erzeugen. Die Ergebnisse sind meist erstaunlich flüssig, auch für linguistisch komplexe Sprachen wie Ungarisch und Finnisch. Doch eben diese flüssige Lesbarkeit erhöht die Gefahr, dass Übersetzungsfehler – häufig Auslassungen, aber auch bedingt durch fehlerhafte Bezüge etc. – übersehen werden.
Für den datengestützten NMT-Ansatz werden neben großen Mengen an Sprachdaten leistungsstarke Rechnerinfrastrukturen benötigt. Und da Daten der „Rohstoff“ des 21. Jahrhunderts und mehrsprachige Kommunikation ein wichtiger Schlüssel für den internationalen (Online-)Handel sind, verwundert es nicht, dass Technologiekonzerne wie Google, Microsoft und Amazon sowie eCommerce-Anbieter wie eBay und Alibaba inzwischen zu wichtigen Akteuren beim Angebot und bei der Weiterentwicklung maschineller Übersetzung geworden sind.
Für die meisten der Unternehmen aus dem Umfeld von GAFA & Co. ist maschinelle Übersetzung jedoch nur ein kleiner Baustein in ihrer Gesamtpalette an cloudbasierten KI- beziehungsweise Machine-Learning-Angeboten. Wie bei den klassischen kommerziellen Übersetzungstechnologie-Herstellern (unter anderem Systran, SDL, ProMT), die neben Cloudauch On-Premise-Lösungen anbieten, lassen sich inzwischen auch die MT-Angebote von Amazon, Google und Microsoft mit eigenen Unternehmensdaten weiter optimieren.
Da auch die MT-Teams der Cloud-Technologiekonzerne ihre Forschungsergebnisse zum Teil als Open-Source-Frameworks zur Verfügung stellen, findet man eine Vielzahl weiterer Akteure: So bieten beispielsweise auch der Softwarekonzern SAP und eine Reihe kleinerer europäischer Sprachtechnologieunternehmen angepasste oder anpassbare MT-Lösungen an. Darüber hinaus sind bei Übersetzungsdienstleistern neue, auf NMT basierende und von Kapitalbeteiligungsgesellschaften geförderte Geschäftsmodelle entstanden [3], [4].
The three examples cited above are urgent digital transformation problems, which as leaders, we need to understand how to fix. How can we approach this?
[/vc_column_text][vc_custom_heading text=“Informations- und Datensicherheit bei MT Cloud-Angeboten“ font_container=“tag:h3|text_align:left“][vc_column_text]
Die kostenlosen Online-Angebote für maschinelle Übersetzung werden gern zu privaten und geschäftlichen Zwecken genutzt, doch für die unternehmensweite Nutzung ist die Einführung einer „sicheren“ Cloud- oder On-PremiseLösung ratsam, insbesondere aus Informationssicherheits- und Datenschutzsicht:
• Die Datenübertragung an die kostenlosen Online-Dienste erfolgt meist unverschlüsselt, so dass vertrauliche Unternehmensdaten in falsche Hände geraten können.
• Die Online-Anbieter speichern in einigen Fällen die eingegebenen Texte und nutzen sie für eigene Zwecke und/oder geben sie an Dritte weiter.
• Texte, die personenbezogene Daten enthalten, werden meist nicht konform mit den Bestimmungen der EU-DatenschutzGrundverordnung (DSGVO) verarbeitet.
So leiten einige Unternehmen bereits Aufrufe an Google Translate an eine „sichere“ MTLösung um – das kann ein im internen Unternehmensnetz installiertes, kommerzielles MTSystem sein, die (unternehmensspezifisch trainierte) MT-Komponente ihres UnternehmensCloud-Anbieters oder auch eine bei ihrem Übersetzungsdienstleister gehostete MTLösung. In allen Varianten lässt sich übrigens das Benutzer-Interface an das jeweilige Corporate Design anpassen und das MT-Angebot direkt in Office- und andere Unternehmensanwendungen integrieren.
Immer beliebter wird auch der Erwerb einer Unternehmenslizenz der Pro-Version von DeepL. Diese bietet zwar nach wie vor noch keine Möglichkeit des Trainings mit eigenen Daten, wirbt dafür aber mit der Aussage, dass in dieser Version alle Texte nach Erstellung der Übersetzung nicht gespeichert werden. Allerdings wird in den AGB darauf hingewiesen, dass personenbezogene Daten über die API nur in Absprache mit DeepL übermittelt werden dürfen [5]. In vielen Unternehmen und Institutionen ist es daher zumindest Best Practice, Mitarbeiter durch Schulungen oder Richtlinien zu sensibilisieren, als „Intern“, „Vertraulich“ oder „Geheim“ klassifizierte Texte sowie Dokumente, die sensible oder personenbezogene Daten enthalten, nicht an frei verfügbare MTAngebote zu senden.
[/vc_column_text][vc_custom_heading text=“Qualitative Risiken beim MT-Einsatz“ font_container=“tag:h3|text_align:left“][vc_column_text]
Die neuronale Übersetzungstechnologie hat fraglos zu großen Qualitätsverbesserungen der maschinellen Übersetzung geführt. Der Hype, der auch durch vollmundige Presseveröffentlichungen von MT-Anbietern mit Aussagen wie Neural Machine Translation Enabling Human Parity Innovations in the Cloud“ [6] befeuert wird, sollte jedoch nicht darüber hinwegtäuschen: Die Ergebnisse der auf dem modernen neuronalen Ansatz basierenden MT-Lösungen zeichnen sich zwar durch meist sehr gute Lesbarkeit aus, doch die Genauigkeit der Übersetzung ist damit nicht gewährleistet – und die Möglichkeit, dass sich ein verfälschter oder gar gegenteiliger Sinn gegenüber dem Originaltext ergibt, ist durchaus gegeben.
Dass solche maschinellen Fehlübersetzungen sogar zu politischen Verwicklungen führen können, zeigte sich unter anderem im Januar 2020, als auf Facebook-Seiten der Name des chinesischen Staatspräsidenten Xi Jinping durch maschinell falsch aus dem Birmanischen ins Englische übersetzt wurde – als „Drecksloch“. Auch DeepL warnt in seinen AGBs vor der vollautomatischen Übersetzung von Inhalten, „im Zusammenhang mit oder zum Betrieb kritischer Infrastrukturen wie Elektrizitätswerken, Militär- oder Verteidigungsanlagen, medizinischen Geräten oder anderen Geräten, deren Ausfall oder Beeinträchtigung zu unvorhersehbaren wirtschaftlichen oder physischen Schäden führen würde“ [5]. Und die Sprachendienste der Schweizer Bundesverwaltung brachten es im Jahr 2019 als Fazit ihres DeepL Pro-Tests zum Einsatz der Anwendung innerhalb der Behörden auf den Punkt: „Was du für dich selber brauchst, kannst du maschinell übersetzen, was du für andere brauchst, gibst du besser einem Profi!“ [7]
[/vc_column_text][vc_custom_heading text=“Integration maschineller Übersetzung im qualitätsgesicherten Übersetzungsprozess“ font_container=“tag:h3|text_align:left“][vc_column_text]
Es ist unbestritten, dass für qualitativ hochwertige, publikationsreife Übersetzung professionelle Übersetzer nach wie vor und auf absehbare Zeit unersetzbar sind. Doch auch im professionellen Übersetzungsprozess spielt Automatisierung eine zunehmende Rolle. Maschinelle Übersetzung ist dabei eine (optionale) Komponente, die sich neben weiteren wie ComputerAided-Translation-Werkzeugen (CAT-Tools) beziehungsweise Translation-Management-Systemen (TMS) einordnet, mit denen professionelle Übersetzer, unternehmensinterne Sprachendienste und Übersetzungsagenturen zum Teil bereits seit Jahrzehnten arbeiten. Diese integrierten Übersetzungsumgebungen bieten automatisches Nachschlagen in mit qualitätsgesicherten Übersetzungen befüllten Übersetzungsdatenbanken (Translation Memories), die Integration von Terminologiedatenbanken und Glossaren, intelligente Qualitätssicherungsfunktionen, die zentrale Verwaltung von mehrsprachigen Referenzdokumenten sowie Schnittstellen zu Content-ManagementSystemen und maschinellen Übersetzungslösungen. Intelligent verknüpft mit dem Knowhow ausgebildeter Sprachprofis sparen sie nicht nur Zeit und Kosten, sondern liefern auch die gewünschte Qualität: Der „Human in the Loop“, d. h. der professionelle Übersetzer oder mehrsprachige Fachexperte, kontrolliert und entscheidet letztlich über sprachliche Qualität und Konsistenz der Übersetzungen. Und die qualitätsgesicherten neuen Sprachdaten lassen sich wiederum für weiteres Trainieren des unternehmensinternen MT-Systems nutzen.
[/vc_column_text][vc_single_image image=“23166″ add_caption=“yes“ alignment=“center“][ult_createlink title=“Zu den Literaturangaben“ btn_link=“url:https%3A%2F%2Fwww.aws-institut.de%2Fim-io%2Fausgabe-2020-2-352%2F|title:Ausgabe%202020-2-352″][/vc_column][/vc_row][vc_row][vc_column][ult_dualbutton btn_hover_style=“Style 2″ btn_border_style=“solid“ btn_color_border=“#ffffff“ btn_border_size=“2″ btn_alignment=“left“ dual_resp=“off“ button1_text=“Einzelheft kaufen“ icon_link=“url:https%3A%2F%2Fwww.aws-institut.de%2Fim-io%2Fproduct%2Fsustainable-business%2F|title:Sustainable%20Business||“ btn1_background_color=“#f3f3f3″ btn1_bghovercolor=“#f07d00″ icon=“Defaults-book“ icon_size=“22″ icon_color=“#f07d00″ icon_hover_color=“#ffffff“ button2_text=“Jetzt abonnieren“ btn_icon_link=“url:https%3A%2F%2Fwww.aws-institut.de%2Fim-io%2Fabo%2F|title:Abo||“ btn2_background_color=“#f3f3f3″ btn2_bghovercolor=“#f07d00″ btn_icon=“Defaults-chevron-right“ btn_icon_size=“22″ btn_icon_color=“#f07d00″ btn_iconhover_color=“#ffffff“ divider_text=“oder“ divider_text_color=“#f07d00″ divider_bg_color=“#ffffff“ btn1_text_color=“#f07d00″ btn1_text_hovercolor=“#ffffff“ btn2_text_color=“#f07d00″ btn2_text_hovercolor=“#ffffff“ title_font_size=“desktop:20px;“ btn_border_radius=“30″ title_line_ht=“desktop:22px;“ btn_width=“280″][/vc_column][/vc_row]