Proč Google Translate neumí překládat?

Proč Google Translate neumí překládat?

Včerejší článek na Technetu o skokovém vylepšení technologií Google Translate v odborné komunitě vyvolal dost rozporuplné reakce; obavami, že "překladatelé nebudou mít co žrát" počínaje, až k pohrdavým pokrčením rameny, že se žádná zásadní změna nekoná a starý dobrý překladač je stále stejně k smíchu. Jak to tedy ve skutečnosti je?  


Aby bylo jasno, technologický rozměr tohoto počinu je obrovský a vůbec nepopírám, že se jedná o úctyhodný výdobytek. Myslím si, že ohrnovat nos nad technologickým pokrokem, jen protože nám v něčem leze do zelí a mění pracovní prostředí nebo profesní poměry, na které jsme jako překladatelé zvyklí, by bylo stejně naivní, jako rozčilovat se, že se zavírají doly nebo robotizují automobilky. Je to logický důsledek automatizace procesů, které dříve prováděli lidé, s tím, že úroveň abstrakce a složitosti těchto procesů rapidně stoupla.



Funkce překladu a nefunkční překlad 


Nepopírám, že překladač může být v každodenním životě užitečný. Ba, sama ho občas používám (samozřejmě tajně), když se v důsledku divokého googlení ocitnu na stránkách, kde nerozumím ani písmenku a potřebuji se rychle zorientovat. Nikdo rozumný si nebude objednávat překlad obsahu webu, na který chodí pro zábavu, ve volném čase. Jednoduše by si na tu zábavu nevydělal. Sečteno podtrženo, není to o nástroji jako takovém, ale spíše o způsobu, kontextu a účelu, za kterým jej používáme. Google Translate obstojně funguje v případech, kdy byste si jako lidé vystačili s komunikativní znalostí jazyka. Tak nějak se chytáte, unikají vám detaily, kreativní použití jazyka, odkazy na širší kulturní kontext.


Myslím, že kámen úrazu spočívá v nepochopení, co překladatelé vlastně dělají a jaká je funkce překladů v byznysu, kultuře či politice. Pokud bychom to brali tak, že funkcí překladu je zajistit pasivní přístup k textu čtenářům, kteří s ním dále nebudou nic podnikat, tak ano, překladač je zcela schopen nahradit překladatele. Nikdo si ale neobjednává odborný překlad, aby si mohl jen tak z plezíru počíst. Výjimkou je samozřejmě beletrie, ale zaručuji vám, že románem přeloženým tak, abyste se "tak nějak chytali", po pár minutách mrsknete o zeď. Lokalizovaný eshop nemá jen viset na sítí a být "srozumitelný": má být dohledatelný a prodávat. Přeložená smlouva musí terminologicky odpovídat legislativě, v jejímž rámci byla uzavřena, a především má smluvní strany zavazovat k určitému jednání. K tomu překladatelé využívají nejen jazykové znalosti, ale také znalost oboru, a především kritické myšlení, což je myslím to hlavní, co dnes strojovému překladu schází.


Abych tedy zjistila, jestli zítra nebudu muset nasadit svůj profesní plán B, rozhodla jsem se funkce nového překladače vyzkoušet. Soudě podle komentářů pod článkem, neodborná veřejnost se bavila překládáním české hymny a fundraisingových dopisů ghanských princů. Vzhledem k tomu, že nemám pracovní zkušenosti ani s jedním, ani s druhým, vzala jsem náhodně zvolené vzorky několika textů, na kterých zrovna pracuji. Nutno podotknout, že ilustrační výsledky překladů do angličtiny, zveřejněné redaktory Technetu (a předpokládám, že neověřené profesionálním překladatelem nebo rodilým mluvčím) k dokonalosti měly hodně daleko. S trochou dobré vůle bych je označila za srozumitelné, rozhodně ne však správné po jazykové stránce. Jak tomu bylo v mém případě?



Čehož, což, cože?


Na nový translator jsem šla pěkně zvostra a pro začátek jsem mu neuronové sítě zavařila klasickou právničtinou. 



 


Ano, právníci takhle opravdu píšou. Je to ukázka ze žádosti o zrušení patentu, kterou zrovna překládám do angličtiny (a skřipu zuby). Překladač vynechal zkratku u.p.w.p. (ustawa prawo własności przemysłowej - Industrial Property Law). Pak se očividně ztratil ve změti vztažných zájmen a s ústředním komplexním souvětím si vůbec neporadil. Hlavně v poslední věte je zřejmé, že překlad kopíruje polský slovosled. Pojem "technically feasible" znamená, že je něco technicky proveditelné; podle překladače by tedy vynález měl být technicky neproveditelný a použitelný zároveň, což je holý nesmysl. Takže vlastně nevíme, co se podle zákona považuje za technický vynález a kdy se smí patentovat. Jak by tento text měl znít v překladu:


Under Art. 24 of the Industrial Property Law (hereinafter referred to as "IPL"), “Patents shall be granted for any technical inventions which are new, i.e. are not a logical result of the current stage of technical development, and which are susceptible of industrial application. These conditions are further defined within the IPL as follows: “an invention shall be considered to be new if it does not form part of the state of the art”. The IPL defines "the state of the art" as “everything made available to the public by means of a written or oral description, by use, displaying or disclosure in any other way, before the date according to which priority to obtain a patent is determined".

Dobrým zvykem je tu právničtinu trochu polidštit: zkrátit, co se da, rozbít členitá souvětí, myslet na shodu předmětu s přísudkem, přehledně vydefinovat pojmy. Zkrátka: myslet na čtenáře. S takhle přeloženým textem se už dá nakládat.



Měřítko na neurčito


Jako další přišel na řadu marketingový text z letáku na biotechnologické zařízení. Text je založený na krátkých, rázných větách, tzv. "call to action" sloganech. Opakující se slova nejsou na škodu. Dvě poslední věty obsahují frázová slovesa "scale up" a "scale out", které v tomto kontextu (jedná se o laboratorní výbavu) lze vykládat mnoha způsoby: scaling up primárně znamená intensifikaci, posílení nějakého procesu, ale také přenesení laboratorních postupů do výroby. Scaling out může znamenat extenzivní rozšíření systému nebo procesu, ale také nastavení stejných parametrů na více zařízeních. 





Výsledek v češtině je spíše kostrbatý. "Šetří peníze mnoha způsoby" je Czenglish jako poleno. Opakující se slova v češtině zní poněkud tupě. S metaforou "rock-solid" si překladač vůbec neporadil. Pointa je zcela mimo. 


Ušetříte. Na mnoha frontách. [název zařízení] výrazně sníží vaše investiční náklady a provozní náklady srazí na minimum. Díky flexibilitě modulárního systému se vaše jednorázová investice mnohonásobně zhodnotí. Zařízení se přizpůsobí různým pracovním postupům a podmínkám na pracovišti. Zkoušejte, modifikujte, kombinujte. Využijte neomezených možností posilování a rozšířování systému.

S tímto překladem nejsem úplně spokojená a asi si s tím ještě pohraju. Nebo máte nějaké nápady?



Tak proč to nefunguje?


Google Translate má stále mnoho slabin. Mezi ty nejpodstatnější patří:

  • neschopnost porozumět členitějším větám - stroj není schopen si tu větu pro lepší pochopení rozebrat nebo přímo rozepsat do nějakého schématu, což překladatelé občas dělat musí
  • kopírování větné stavby a slovosledu originálu - což vyplývá z předchozího
  • zmatek v terminologii - Google má sice k dispozici miliony, ne-li miliardy podkladů a zdrojů, ne všechny jsou ale spolehlivé (i na Eur-Lexu jsou občas chyby), chybí mu schopnost kriticky podklady posoudit
  • neschopnost rozluštit zkratky
  • neschopnost "číst mezi řádky" (když je text až moc stručný, zkratkovitý nebo myšlen ironicky)
  • nerozumí metaforám a obrazným vyjádřením, které nejsou doménou krásné literatury, naopak, najdeme je v každodenní mluvě a dokonce v technické hantýrce (tuhle jsem si nechala přeložit "stromeček, masiv" z nabídky na pokládku parket a vyšlo mi "tree, massif" místo "herringbone, solid wood"), je to tak protože stroj nemá představivost ani smyslové zážitky uložené v paměti
  • překlad působí tupě, nedokáže upoutat pozornost čtenáře
  • když si neví rady, mezi dvěma cizími jazyky překládá prostřednictím angličtiny.



Závěrem


Pokud nevíte, co vám přišlo v mailu, klidně jej prožeňte překladačem. Nemyslete si ale, že uživatelé nepoznají, že jste překladačem prohnali i svůj web, na kterém něco prodáváte nebo o něčem informujete. Působí to směšně a neprofesionálně. 


Pokud jde o budoucnost našeho oboru, zcela souhlasím s těmi vyváženými hlasy, že je jedině dobře, že se Google Translate vylepšuje. Pokud klientům dokážete přesvědčivě vysvětlit, jaký je rozdíl mezi původním překladem od profesionála a pouhou editací strojového překladu (post-editing machine translation je čím dál běžnější služba), máte vyhráno. Zdokonalování technik strojového překladu způsobí odliv poloprofesionálů z překladatelského trhu (protože segment, který vyžaduje nižší odbornost, zaberou strojové překlady), menší vytíženost profesionálů a větší spokojenost zákazníků. 



* Titulní foto pochází z Cronenbergova snímku Videodrome, zdroj.