Zum Hauptinhalt springen

Erstellung eines Entwurf verstehen

Einführung

Das Natural Language Processing Team von SIL International hat ein Werkzeug entwickelt, das bei der Bibelübersetzung helfen kann, indem es einen groben ersten Entwurf erstellt, den die Übersetzer dann bearbeiten und verfeinern können. Ab dem 1. Januar 2024 ist dieses Werkzeug nun für die Verwendung in Scripture Forge, einer Plattform zur Bearbeitung von Bibeltexten, die in [Paratext] (https://paratext.org/) integriert ist, verfügbar.

Alle Entwürfe, die erstellt werden, enthalten Fehler, die vom Übersetzungsteam korrigiert werden müssen. Bei einigen Projekten wird die Qualität zu gering sein, um nützlich zu sein. Ausführliche Praxistests haben jedoch gezeigt, dass eine beträchtliche Anzahl von Teams die Entwürfe als sehr hilfreich für ihre Arbeit empfindet und dass sie von ausreichender Qualität sind, um sie als Ausgangspunkt für die Bearbeitung durch das Team zu verwenden.

Letztendlich wird der Erfolg der Entwürfe daran gemessen, ob sie als Hilfsmittel für die Arbeit des Übersetzungsteams nützlich sind, und nicht daran, ob sie als fertiges Produkt für sich allein stehen können.

Wie es funktioniert

Um das Werkzeug effektiv nutzen zu können, ist es wichtig zu verstehen, wie es funktioniert. Die Entwürfe werden in einem zweistufigen Verfahren erstellt:

  1. Sprache erlernen.
  2. Den Text übersetzen.

Der wichtigste Schritt ist der erste, das Erlernen der Sprache. Die Qualität des entstehenden Entwurfs hängt fast ausschließlich davon ab, wie gut dieser Schritt verläuft.

Das System lernt, indem es denselben Satz in mehreren Sprachen sieht, eine in einer Sprache, die es bereits versteht, und eine in der Sprache, in die Du übersetzt.

Der wichtigste Punkt ist, dass diese Sätze in beiden Sprachen das Gleiche aussagen müssen. Dies ist dasselbe Prinzip, das es den Gelehrten ermöglichte, die Hieroglyphen vom Stein von Rosette zu lernen: derselbe Text wurde in drei verschiedenen Sprachen geschrieben, was einen Vergleich zwischen einer bereits verstandenen und einer nicht verstandenen Sprache ermöglichte.

Ein Text, der sowohl in der Sprache, aus der Du übersetzest, als auch in der Sprache, in die Du übersetzt, verfügbar ist, wird als "Paralleltext" bezeichnet. Im Allgemeinen gilt: Je mehr Paralleltexte Du hast, umso besser lernt das System die Sprache. Bei den meisten Projekten wird dieser Paralleltext Dein Referenztext sein und die Übersetzungsarbeit, die Du bereits abgeschlossen hast. Zum jetzigen Zeitpunkt empfehlen wir Dir, zumindest das Neue Testament übersetzt zu haben.

Anwendungsbeispiele

Ein einfaches Beispiel

Angenommen, ein Übersetzungsteam übersetzt die Bibel in eine lokale Sprache und verwendet die englische NIV als Referenztext. Das Team hat das gesamte Neue Testament fertiggestellt und beginnt mit der Arbeit am 1. Buch Mose. Das System würde einen Entwurf wie folgt erstellen:

  1. Das englische Neue Testament der NIV mit dem Neuen Testament der Landessprache vergleichen, um die Sprache zu lernen.
  2. Nach dem Erlernen der Sprache das 1. Buch Mose aus der englischen NIV in die Lokalsprache übersetzen.

Nachdem das 1. Buch Mose erstellt wurde, würde das Team den Entwurf überarbeiten, um alle Fehler zu korrigieren. Anschließend könnten sie einen Entwurf für das nächste Buch erstellen, an dem sie arbeiten wollen, und das System würde die Übersetzung von 1. Mose nutzen, um die Qualität des nächsten Entwurfs zu verbessern.

Ein komplexeres Beispiel

Im ersten Beispiel verwendete das Team die englische NIV als Referenztext, und das System lernte die Sprache durch den Vergleich der englischen NIV mit dem Neuen Testament in der Lokalsprache. In vielen Fällen kann jedoch ein besserer Entwurf mit einem anderen Text, als dem des Teams, generiert werden.

Es ist zum Beispiel oft möglich, die Qualität des Entwurfs zu verbessern, indem eine Rückübersetzung von Lokalsprache in die Ausgangssprache verwendet wird. Wenn das Team das Projekt ins Englische oder Deutsche rückübersetzt hat, könnte es als Referenztext anstelle der englischen NIV oder einer deutschen Bibelübersetzung verwendet werden. Eine Rückübersetzung ist in der Regel wesentlich wortgetreuer als eine normale Übersetzung und macht es dem System daher leichter zu verstehen, wie die lokale Sprache dem Englischen oder Deutschen entspricht. In diesem Beispiel würde das System einen Entwurf wie folgt erstellen:

  1. Die englische oder deutsche Rückübersetzung mit dem Neuen Testament der Lokalsprache vergleichen, um die Sprache zu lernen.
  2. Nach dem Erlernen der Sprache das 1. Buch Mose aus der englischen NIV oder der deutschen Bibelübersetzung in die Lokalsprache übersetzen.

Das ideale Setup für ein Projekt zu bestimmen, ist ein komplexer Prozess und nicht etwas, das Du lernen musst. Das SIL Natural Language Processing Team entwickelt Werkzeuge, um die ideale Konfiguration zu bestimmen und kann Teams während des Onboarding-Prozesses unterstützen.

Rückübersetzungen generieren

Neben der Erstellung von Entwürfen in der Lokalsprache kann das System auch Rückübersetzungen in unterstützte Ausgangssprachen erstellen. Um einen Entwurf einer Rückübersetzung zu generieren, muss das Team bereits mindestens einige Bücher aus der Lokalsprache in die Ausgangssprache rückübersetzt haben.

In diesem Beispiel nehmen wir an, ein Team hat die vier Evangelien in die Lokalsprache übersetzt und hat Matthäus, Markus und Lukas wieder ins Englische oder Deutsche übersetzt. Um einen Rückübersetzungsentwurf von Johannes zu generieren, würde das System Folgendes tun:

  1. Die englischen oder deutschen Rückübersetzungen von Matthäus, Markus und Lukas mit den Versionen von Matthäus, Markus und Lukas in der Lokalsprache vergleichen, um die Sprache zu lernen.
  2. Nachdem Erlernen der Sprache, Johannes aus der Lokalsprache ins Englische oder Deutsche übersetzen.

Rückübersetzungsentwürfe enthalten ebenfalls Fehler und müssen bearbeitet werden, aber die Qualität ist in der Regel wesentlich höher als bei den Entwürfen in die Lokalsprache.

Erste Schritte

Das Generieren von Rückübersetzungsentwürfen ist derzeit offen und steht allen Paratext-Benutzer zu Verfügung. Das Generieren von Entwürfen in die Lokalsprache, erfordert aufgrund der Komplexität beim Einrichten, dass ein Übersetzungsteam vom SIL Natural Language Processing Team unterstützt wird. Bitte fülle das [Registrierungsformular für das Erstellen von Übersetzungsentwürfen] (https://app.smartsheet.com/b/form/305798a45a664d8585ac74e72241d8cc) aus, und ein Mitglied des SIL Natural Language Processing Teams wird prüfen, ob Dein Projekt für das Generieren von Entwürfen in Frage kommt.

Unabhängig davon, ob Du Rückübersetzungsentwürfe oder Entwürfe in der Lokalsprache generierst, kannst Du beginnen, indem Du Dein Paratext-Projekt mit Scripture Forge verbindest, indem Du die folgenden Schritte ausführst:

  1. Mit Deinen Paratext-Anmeldedaten bei [Scripture Forge] (https://scriptureforge.org/) einloggen.
  2. Dein Paratext-Projekt mit Hilfe der [Anleitung zum Verbinden eines Paratext-Projekts] (https://help.scriptureforge.org/connect-paratext-project) verbinden. Beim Verbinden des Projekts, Deinen Referenztext als Quelle auswählen. Für eine Rückübersetzung sollte der Ausgangstext in die Lokaslsprache übersetzt werden.
  3. Nach dem Verbinden Deines Projekts, in der Seitenleiste auf "Entwurf generieren" klicken.
  4. Falls Du einen Entwurf in der Lokalsprache generierst, ist dies die einzige Möglichkeit, die Du hast, und Du müsst das Anmeldeformular für die Erstellung von Übersetzungen ausfüllen, indem Du auf "Für die Erstellung von Entwürfen anmelden" klickst. Falls Dein Projekt bereits freigeschaltet wurde oder Du mit einer Rückübersetzung arbeitest, klicke auf "Entwurf generieren", um den Prozess zu starten.
  5. Wähle die Bücher aus, die Du übersetzen möchtest, und wähle dann die Bücher, die Du als Trainingsdaten verwenden möchtest.
  6. Auf "Entwurf generieren" klicken, um den Vorgang zu starten.

Das Generieren des Entwurfs kann von mehreren Stunden bis zu mehreren Tage dauern.

Sobald Du einen Entwurf generiert hast, kannst Du eine Vorschau des Entwurfs ansehen und einzelne Kapitel in Dein Projekt importieren.

Unterstützte Sprachen für das Erstellen von Rückübersetzungsentwürfen

Rückübersetzungsentwürfe können aus jeder Sprache generiert werden, müssen aber in eine der folgenden Sprachen rückübersetzt werden.

Name der SpracheISO 639-1ISO 639-2ISO 639-3
Achinesischace
Mesopotamisches Arabischacm
Ta'izzi-Adeni Arabischacq
Tunesisch-Arabischaeb
Afrikaansafafrafr
Südlevantinisches Arabischajp
Akanakaka
Amharischamamhamh
Nordlevantinisches Arabischapc
Standard-Arabischararbara
Najdi-Arabischars
Marokkanisches Arabischary
Ägyptisches Arabischarz
Assamesischasasmasm
Asturischast
Awadhiawa
Aymaraayr
Südaserbaidschanischazb
Nordaserbaidschanischazj
Baschkirischbabakbak
Bambarabmbambam
Balinesischban
Belarussischbebelbel
Bembabem
Bengalibnbenben
Bhojpuribho
Banjaresischbjn
Tibetischbobodtib
Bosnischbsbosbos
Buginesischbug
Bulgarischbgbulbul
Katalanischcacatcat
Cebuanoceb
Tschechischcscescze
Chokwecjk
Zentralkurdischckb
Krimtatarischcrh
Walisischcycymwel
Dänischdadandan
Deutschdedeuger
Dinkadik
Diouladyu
Dzongkhadzdzodzo
Griechischelellgre
Englischenengeng
Esperantoeoepoepo
Estnischetestest
Baskischeueusbaq
Eweeeeweewe
Färöischfofaofao
Fidschifjfijfij
Finnischfifinfin
Fonfon
Französischfrfrafre
Friaulischfur
Nigerianisches Fulfuldefuv
Schottisch-Gälischgdglagla
Irischgaglegle
Galizischglglgglg
Guaranigngrngrn
Gujaratigugujguj
Haitianisches Kreolischhat
Hausahahauhau
Hebräischhehebheb
Hindihihinhin
Chhattisgarhihne
Kroatischhrhrvhrv
Ungarischhuhunhun
Armenischhyhyearm
Igboigiboibo
Ilokoilo
Indonesischidindind
Isländischisislice
Italienischititaita
Javanischjvjavjav
Japanischjajpnjpn
Kabylischkab
Kachinkac
Kambakam
Kannadaknkankan
Kaschmirischkskaskas
Georgischkakatgeo
Zentralkanuriknc
Kasachischkkkazkaz
Kabiyékbp
Kabuverdianukea
Khmerkmkhmkhm
Kikuyukikikkik
Kinyarwandarwkinkin
Kirgisischkykirkir
Kimbundukmb
Nordkurdischkmr
Kikongokgkonkon
Koreanischkokorkor
Laotischlolaolao
Ligurischlij
Limburgischlilimlim
Lingalalnlinlin
Litauischltlitlit
Lombardischlmo
Lettgallischltg
Luxemburgischlbltzltz
Tschilubalua
Lugandalgluglug
Luoluoluo
Lushailuslus
Lettischlvlvslav
Magahimagmag
Maithilimaimai
Malayalammlmalmal
Marathimrmarmar
Minangkabauischminmin
Mazedonischmkmkdmac
Plateau-Malagasypltplt
Maltesischmtmltmlt
Meiteimnimni
Chalcha-Mongolischkhkkhk
Mossimosmos
Maorimimrimao
Burmesischmymyabur
Niederländischnlnlddut
Norwegisch (Nynorsk)nnnnonno
Norwegisch (Bokmål)nbnobnob
Nepalinpinpi
Nord-Sothonsonso
Nuernusnus
Chichewanynyanya
Okzitanischococioci
West-Zentral-Oromogazgaz
Odiaoryory
Pangasinensischpagpag
Panjabipapanpan
Papiamentupappap
Persischfapesper
Polnischplpolpol
Portugiesischptporpor
Dariprsprs
Südpaschtopbtpbt
Quechuaquyquy
Rumänischroronrum
Rundirnrunrun
Russischrurusrus
Sangosgsagsag
Sanskritsasansan
Santalisatsat
Sizilianischscnscn
Shanshnshn
Singhalesischsisinsin
Slovakischskslkslo
Slowenischslslvslv
Samoanischsmsmosmo
Shonasnsnasna
Sindhisdsndsnd
Somalischsosomsom
Süd-Sothostsotsot
Spanischesspaspa
Toskischsqalsals
Sardischscsrdsrd
Serbischsrsrpsrp
Siswatisssswssw
Sundanesischsusunsun
Schwedischsvsweswe
Swahiliswswhswh
Schlesischszlszlszl
Tamilischtatamtam
Tatarischtttattat
Teluguteteltel
Tadschikischtgtgktgk
Tagalogtltgltgl
Thaiththatha
Tigrinjatitirtir
Tamaseqtmhtaqtaq
Tok Pisintpitpitpi
Setswanatntsntsn
Tsongatstsotso
Turkmenischtktuktuk
Tumbukatumtumtum
Türkischtrturtur
Twitwtwitwi
Zentralatlas-Tamazighttzmtzmtzm
Uigurischuguiguig
Ukrainischukukrukr
Umbunduumbumbumb
Urduururdurd
Usbekischuzuznuzn
Venetischvecvecvec
Vietnamesischvivievie
Waraywarwarwar
Wolofwowolwol
Xhosaxhxhoxho
Jiddischyiyddyid
Yorubayoyoryor
Kantonesischzhyueyue
Chinesischzhzhochi
Malaiischmszsmzsm
Zuluzuzulzul