Egyszerű szöveg fordítása


Alapbeállítás szerinti kódolás

Az egyszerű szöveges állományok legtöbbször <s0>.txt</s0> kiterjesztésűek - kizárólag szöveges információból épülnek föl. Az egyszerű szöveges állományokban nincs egyértelmű utasítás a számítógép számára arra vonatkozóan, hogy milyen nyelven íródtak. Ez alapvetően azt jelenti, hogy a számítógép abból indul ki, hogy a szöveg nyelve megegyezik a számítógép alapbeállítása szerinti nyelvvel.


Zavaros megjelenítés

Egy orosz felhasználó esetén a számítógép nagy valószínűséggel szintén oroszul működik: a menük oroszul vannak, a megnyíló állományok nyelve is orosz stb. Legtöbbször a számítógép helyes feltételezésből indul ki, mivel a nyelvi környezet minden eleme orosz megjelenítést kíván.

Ha egy orosz fordító japán állományokat kap fordításra egyszerű szöveg formájában, akkor ezeket a gép orosznak fogja tekinteni. Ennek az az oka, hogy az állományban nincs utasítás a számítógép részére arról, hogy a szöveg milyen nyelven íródott.

A japán állomány tartalma lehet pl. a következő:

OmegaTとは、コンピュータを利用した翻訳ツールです。

A szövegszerkesztőben azonban ez ekként jelenik meg:

OmegaTВ∆ВЌБAГRГУГsГЕБ[Г^ВрЧШЧpµšЦ|ЦуГcБ[ГЛВ≅ВЈБB

mivel orosz tartalmat feltételezett... Csakhogy ez nem oroszul van. A japán karakterek helyén orosz betűk láthatók.

Az OmegaT szintén így működik. Az OmegaT feltételezi, hogy az egyszerű szöveg nyelve megegyezik a számítógép alapbeállítás szerinti nyelvével. Ez nem jelent gondot, ha francia gépen kell a szöveget lefordítani angolra, vagy német gépen kell megnyitni olasz állományokat.


Karakterkészletek és kódolások

Miért működik jól az angol és a francia esetén, és miért gond az orosz vagy a japán? Azért, mert az angol és a francia azonos karakterkészletet használ. Éspedig a Latin-1-et vagy annak egy változatát. Egészen mostanáig az orosz és a japán eltérő karakterkészleteket használt. Az orosz karakterek nem felelnek meg a japánoknak, és fordítva. Ennek eredménye látható fent.

A japán megbízó japán gépen dolgozik és japán szöveges állományokat hoz létre. Az ügyfél által kiválasztott karakterkészlet az operációs rendszertől és egyéb beállításoktól függ, de bizonyára a kiválasztott (japán) karakterkészlet nem fog helyesen megjelenni az orosz számítógépen.

Az, hogy egy karakterkészletben az adott szöveg fizikailag miként jelenik meg (vagyis a számítógép miként olvassa azt be és jeleníti meg), a kódolástól függ. Amikor a számítógép beolvassa az állományt, a kódolásnak megfelelően "dekódolja" az információt és a karakterkészletnek megfelelően jeleníti meg. Pontatlanul fogalmazva egy kódolás egy karakterkészletnek felel meg...


Az OmegaT által kínált megoldás

A helyzet kezelésére az OmegaT 3 alapvető megoldást kínál. A 3 módszer mindegyike a Beállítások menü állományszűrőinek használatára épül.

  1. Adja meg egyszerű szöveges állományainak - azaz a .txt kiterjesztésű állományoknak - a kódolását.
    A Szűrőszerkesztés párbeszédablak Egyszerű szövegek részében módosítsa a Forrásállomány kódolását <auto>matikusról a .txt állománynak megfelelő kódolásra.
  2. Az egyszerű szöveges forrásállományok kiterjesztését módosítsa például japán esetén .txt-ről .jp-re.
    A Szűrőszerkesztés párbeszédablak Egyszerű szövegek részében adja hozzá a *.jp Forrásállomány nevének mintájához és válassza ki a megfelelő paramétereket a forrásnyelvi és a célnyelvi kódoláshoz.
  3. Nyissa meg a forrásállományt egy olyan szövegszerkesztőben, amely megfelelően kezeli annak kódolását, az állományt pedig mentse el UTF-8 kódolással.
    Változtassa meg az állomány kiterjesztését .txt-ről .utf8-ra.
    Az OmegaT az állományt automatikusan UTF-8 kódolású állományként fogja kezelni.

Jelenleg az OmegaT az alábbi formátumú egyszerű szöveges állományokat támogatja

Ellenőrizheti mindezt, ha a Beállítások menüben az Állományszűrők pontra kattint.

Az OmegaT ezen felsorolás használatával segítséget nyújt egyes egyszerű szöveges állományok kezeléséhez.

Ha például cseh szöveges állománnyal van dolga (amely minden valószínűség szerint ISO-8859-2 kódolású), akkor a .txt kiterjesztés .txt2-re módosítása esetén az OmegaT annak tartalmát helyesen fogja értelmezni.


Jogi tudnivalók