Aller au contenu principal

Comprendre l'ébauche

Introduction

L'équipe de SIL International spécialisée dans le traitement du langage naturel a mis au point un outil qui peut aider à la traduction de la Bible en créant une première ébauche que les traducteurs peuvent éditer et affiner. Depuis le 1er janvier 2024, cet outil peut être utilisé dans Scripture Forge, une plateforme d'édition des Écritures étroitement intégrée à Paratext.

Toutes les ébauches qui ont été créés contiennent des erreurs qui doivent être corrigées par l'équipe de traduction. Pour certains projets, la qualité sera trop faible pour être utile. Cependant, des tests de terrain approfondis ont montré qu'un nombre significatif d'équipes trouvent que les ébauches sont très utiles dans leur travail, et de qualité suffisante pour servir de point de départ pour que l'équipe puisse le modifier.

En fin de compte, la mesure du succès des projets est dans leur utilité en tant qu'outil pour aider l'équipe de traduction dans leur travail, pas leur capacité à être autonome en tant que produit fini.

Comment ça marche

Pour utiliser l’outil efficacement, il est important de comprendre comment il fonctionne. Les ébauches sont créées en utilisant un processus en deux étapes:

  1. Apprenez la langue.
  2. Traduire le texte.

L'étape la plus importante est la première, l'apprentissage de la langue. La qualité du projet qui est créé dépend presque entièrement du degré de réussite de cette étape.

Le système apprend en voyant la même phrase écrite en plusieurs langues, une dans une langue qu'elle comprend déjà, et une dans la langue dans laquelle vous traduisez.

Le point le plus important à retenir est que ces phrases doivent dire la même chose dans les deux langues. C'est le même principe qui a permis aux érudits d'apprendre l'hiéroglyphe à partir de la pierre Rosetta : le même texte a été écrit en trois langues différentes, permettant la comparaison entre un langage qui était déjà compris et un langage qui ne l'était pas.

Le texte qui est disponible dans la langue à partir de laquelle vous traduisez et dans laquelle vous traduisez est connu sous le nom de « texte parallèle ». En général, plus vous avez de texte parallèle, plus le système apprendra la langue. Pour la plupart des projets, ce texte parallèle sera votre texte de référence et le travail de traduction que vous avez déjà terminé. Pour l'instant, nous vous recommandons d'avoir au moins le Nouveau Testament traduit.

Exemple de cas d'utilisation

Un exemple basique

Supposons qu'une équipe de traduction de la Bible soit en train de traduire la Bible dans une langue locale, en utilisant le NIV anglais comme texte de référence. L'équipe a achevé l'ensemble du Nouveau Testament et commence à travailler sur la Genèse. Le système générerait un projet comme suit:

  1. Comparez le Nouveau Testament anglais avec la langue locale du Nouveau Testament, afin d'apprendre la langue.
  2. Ayant appris la langue, traduire la Genèse de l'anglais NIV dans la langue locale.

Après avoir généré le livre de Genèse, l'équipe éditait l'ébauche pour corriger les erreurs. Ensuite, ils seraient en mesure de générer une ébauche du prochain livre sur lequel ils prévoient travailler, et le système utiliserait la traduction de la Genèse pour améliorer la qualité de la prochaine ébauche.

Un exemple plus complexe

Dans le premier exemple, l'équipe utilisait le NIV anglais comme texte de référence, et le système a appris la langue en comparant l'anglais NIV avec la langue locale Nouveau Testament. Cependant, dans de nombreux cas, une ébauche de meilleure qualité peut être généré en utilisant un texte différent de celui dont l'équipe est en train de traduire.

Par exemple, il est souvent possible d'améliorer la qualité du projet en utilisant une rétro-traduction de la langue locale dans la langue source. Une rétro-traduction est généralement beaucoup plus littérale qu'une traduction normale, et permet donc au système de comprendre plus facilement comment la langue locale carte à l'anglais. Dans cet exemple, le système génère une ébauche comme suit :

  1. Comparez la retraduction en anglais avec la langue locale New Testament, afin d'apprendre la langue.
  2. Ayant appris la langue, traduire la Genèse de l'anglais NIV dans la langue locale.

Déterminer la configuration idéale pour un projet est un processus complexe, et ce n’est pas quelque chose que vous devrez apprendre. L’équipe de traitement du langage naturel de SIL développe des outils pour déterminer la configuration idéale et peut assister les équipes pendant le processus d’intégration.

Générer des retraductions

En plus de créer des ébauches dans la langue vernaculaire, le système peut également générer des rétro-traductions dans les langues source supportées. Afin de générer une ébauche de retraduction, l'équipe doit déjà avoir retraduit au moins quelques livres de la langue vernaculaire dans la langue source.

Dans cet exemple, supposons qu'une équipe a traduit les quatre évangiles dans la langue vernaculaire et a de retour traduit Matthew, Mark et Luc en anglais. Pour générer une ébauche de retraduction de John, le système ferait ce qui suit :

  1. Comparer les retraductions en anglais de Matthew, Mark, et Luc avec les versions en langue vernaculaire de Matthew, Mark, et Luc pour apprendre la langue.
  2. Ayant appris la langue, traduire John de la langue vernaculaire en anglais.

Les ébauches de retraduction contiennent également des erreurs et doivent être modifiés, mais la qualité est généralement nettement plus élevée que pour les ébauches vernaculaires.

Démarrage

La génération de l'ébauche de retraduction est actuellement ouverte et disponible pour tous les utilisateurs de Paratext. La génération de l'ébauche dans le vernaculaire, en raison de la complexité de l'installation, nécessite qu'une équipe soit embarquée par l'équipe de traitement du langage naturel de la SIL. Veuillez remplir le formulaire d'inscription de rédaction de traduction, et un membre de l'équipe évaluera si votre projet est un bon candidat pour la génération des ébauches.

Peu importe si vous générez des ébauches de retraduction ou des ébauches vernaculaires, vous pouvez commencer par connecter votre projet Paratext à Scripture Forge en suivant ces étapes :

  1. Connectez-vous à Scripture Forge, en utilisant vos identifiants Paratext.
  2. Connectez votre projet Paratext en suivant le Guide du projet Paratext. Lorsque vous connectez le projet, sélectionnez votre texte de référence comme source. Pour une retraduction, le texte source doit être la langue vernaculaire.
  3. Après avoir connecté votre projet, cliquez sur "Générer un e ébauche" dans la barre latérale.
  4. Si vous produisez un projet en langue vernaculaire, vous ne pourrez pas aller plus loin par vous-même et vous devrez remplir le formulaire d'inscription à la rédaction de traduction en cliquant sur "S'inscrire à la rédaction". Si votre projet a déjà été intégré, ou si vous travaillez avec une retraduction, cliquez sur "Générer une ébauche" pour lancer le processus.
  5. Sélectionnez les livres que vous souhaitez traduire, puis les livres que vous souhaitez utiliser comme données d'entraînement.
  6. Cliquez sur « Générer une ébauche » pour démarrer le processus.

Le processus de génération des ébauches peut prendre de plusieurs heures à plusieurs jours.

Une fois que vous avez une ébauche générée, vous pouvez prévisualiser l'ébauche et importer des chapitres individuels dans votre projet.

Langues supportées pour la rédaction de retraduction

Les ébauches de rétro-traduction peuvent être générés à partir de n'importe quelle langue, mais doivent être de retour traduits dans l'une des langues suivantes.

Nom de la langueISO 639-1ISO 639-2ISO 639-3
Chinoisace
Arabe mésopotamienacm
Ta'izzi-Adeni Arabicacq
Arabe tunisienaeb
Africain (Afrikaans)afafrafr
Arabe Levantin du Sudajp
Akanakaka
Amhariqueamamhamh
Arabe du Nord Levantinapc
Arabe standardararbara
Arabe najdiars
Arabe marocainary
Arabe égyptienarz
Assameseasasmasm
Asturianast
Awadhiawa
Aymaraayr
Azerbaïdjanais du Sudazb
Azerbaïdjanais du Nordazj
Bashkirbabakbak
Bambarabmbambam
Balineseban
Belarusianbebelbel
Bembabem
Bengalibnbenben
Bhojpuribho
Banjarbjn
Tibetanbobodtib
Bosnienbsbosbos
Buginesebug
Bulgarebgbulbul
catalancacatcat
Cebuanoceb
Tchèquecscescze
Chokwecjk
Central Kurdishckb
Crimean Turkishcrh
Welshcycymwel
Danoisdadandan
Allemanddedeuger
Dinkadik
Dyuladyu
Dzongkhadzdzodzo
Greekelellgre
Anglaisenengeng
Esperantoeoepoepo
Estonienetestest
Basqueeueusbaq
Eweeeeweewe
Faroesefofaofao
Fijianfjfijfij
Finnishfifinfin
Fonfon
Françaisfrfrafre
Friulianfur
Fulfulde nigérianfuv
Scottish Gaelicgdglagla
Irishgaglegle
Galicienglglgglg
Guaranigngrngrn
Gujaratigugujguj
Créole haïtienhat
Hausahahauhau
Hébreuhehebheb
Hindihihinhin
Chhattisgarhihne
Croatehrhrvhrv
Hungarianhuhunhun
Arménienhyhyearm
Igboigiboibo
Ilokoilo
Indonésienidindind
Icelandicisislice
Les Italiensititaita
Javanaisjvjavjav
japonaisesjajpnjpn
Kabylekab
Kachinkac
Kambakam
Kannadaknkankan
Kashmirikskaskas
Georgienkakatgeo
Central Kanuriknc
Kazakhkkkazkaz
Kabiyekbp
Kabuverdianukea
Khmerkmkhmkhm
Kikuyukikikkik
Kinyarwandarwkinkin
Kyrgyzkykirkir
Kimbundukmb
Kurde du Nordkmr
Kongokgkonkon
Coréenkokorkor
Laololaolao
Ligurianlij
Limburgishlilimlim
Lingalalnlinlin
Lithuanianltlitlit
Lombardlmo
Latgalianltg
Luxembourgishlbltzltz
Luba-Lulualua
Lugandalgluglug
Luoluoluo
Lushailuslus
Latvianlvlvslav
Magahimagmag
Maithilimaimai
Malayalammlmalmal
Marathimrmarmar
Minangkabauminmin
Macédonienmkmkdmac
Plateau Malagasypltplt
Maltesemtmltmlt
Manipurimnimni
Halh Mongoliankhkkhk
Mossimosmos
Maorimimrimao
Burmesemonmyabur
Dutchnlnlddut
Norwegian Nynorsknnnnonno
Norwegian Bokmålnbnobnob
Nepalinpinpi
Sotho du Nordnsonso
Nuernusnus
Chichewanynyanya
Occitanococioci
West Central Oromogazgaz
Odiaoryory
Pangasinanpagpag
Punjabipapanpan
Papiamentopappap
Persianfapesper
Polishplpolpol
Portugaisptporpor
Dariprsprs
Pachto du Sudpbtpbt
Quechuaquyquy
Roumainroronrum
Rundirnrunrun
Russerurusrus
Sangosgsagsag
Sanskritsasansan
Santalisatsat
Sicilianscnscn
Shanshnshn
Sinhalasipéchépéché
Slovakskslkslo
Slovénienslslvslv
Samoansmsmosmo
Shonasnsnasna
Sindhisdsndsnd
Somaliesosomsom
Sotho, Sudstsotsot
Espagnolesspaspa
Tosk Albaniansqalsals
Sardinianscsrdsrd
Serbesrsrpsrp
Swazisssswssw
Sundanesesusunsun
Swedishsvsweswe
Swahiliswswhswh
Silesianszlszlszl
Tamiltatamtam
Tatartttattat
Teluguteteltel
Tajiktgtgktgk
Tagalogtltgltgl
Thaiththatha
Tigrinyatitirtir
Tamashektmhtaqtaq
Tok Pisintpitpitpi
Tswanatntsntsn
Tsongatstsotso
Turkmentktuktuk
Tumbukatumtumtum
Turkishtrturtur
Twitwtwitwi
Tamazighttzmtzmtzm
Uighuruguiguig
Ukrainienukukrukr
Umbunduumbumbumb
Urduururdurd
Uzbekuzuznuzn
Vénitienvecvecvec
Vietnamiennevivievie
Waraywarwarwar
Wolofwowolwol
Xhosaxhxhoxho
Yiddishyiyddyid
Yoroubayoyoryor
Cantonaiszhyueyue
Chinoiszhzhochi
Malaymszsmzsm
Zuluzuzulzul