Az egyszerű szöveges állományok legtöbbször <s0>.txt</s0> kiterjesztésűek - kizárólag szöveges információból épülnek föl. Az egyszerű szöveges állományokban nincs egyértelmű utasítás a számítógép számára arra vonatkozóan, hogy milyen nyelven íródtak. Ez alapvetően azt jelenti, hogy a számítógép abból indul ki, hogy a szöveg nyelve megegyezik a számítógép alapbeállítása szerinti nyelvvel.
Egy orosz felhasználó esetén a számítógép nagy valószínűséggel szintén oroszul működik: a menük oroszul vannak, a megnyíló állományok nyelve is orosz stb. Legtöbbször a számítógép helyes feltételezésből indul ki, mivel a nyelvi környezet minden eleme orosz megjelenítést kíván.
Ha egy orosz fordító japán állományokat kap fordításra egyszerű szöveg formájában, akkor ezeket a gép orosznak fogja tekinteni. Ennek az az oka, hogy az állományban nincs utasítás a számítógép részére arról, hogy a szöveg milyen nyelven íródott.
A japán állomány tartalma lehet pl. a következő:
OmegaTとは、コンピュータを利用した翻訳ツールです。
A szövegszerkesztőben azonban ez ekként jelenik meg:
OmegaTВ∆ВЌБAГRГУГsГЕБ[Г^ВрЧШЧpµšЦ|ЦуГcБ[ГЛВ≅ВЈБB
mivel orosz tartalmat feltételezett... Csakhogy ez nem oroszul van. A japán karakterek helyén orosz betűk láthatók.
Az OmegaT szintén így működik. Az OmegaT feltételezi, hogy az egyszerű szöveg nyelve megegyezik a számítógép alapbeállítás szerinti nyelvével. Ez nem jelent gondot, ha francia gépen kell a szöveget lefordítani angolra, vagy német gépen kell megnyitni olasz állományokat.
Miért működik jól az angol és a francia esetén, és miért gond az orosz vagy a japán? Azért, mert az angol és a francia azonos karakterkészletet használ. Éspedig a Latin-1-et vagy annak egy változatát. Egészen mostanáig az orosz és a japán eltérő karakterkészleteket használt. Az orosz karakterek nem felelnek meg a japánoknak, és fordítva. Ennek eredménye látható fent.
A japán megbízó japán gépen dolgozik és japán szöveges állományokat hoz létre. Az ügyfél által kiválasztott karakterkészlet az operációs rendszertől és egyéb beállításoktól függ, de bizonyára a kiválasztott (japán) karakterkészlet nem fog helyesen megjelenni az orosz számítógépen.
Az, hogy egy karakterkészletben az adott szöveg fizikailag miként jelenik meg (vagyis a számítógép miként olvassa azt be és jeleníti meg), a kódolástól függ. Amikor a számítógép beolvassa az állományt, a kódolásnak megfelelően "dekódolja" az információt és a karakterkészletnek megfelelően jeleníti meg. Pontatlanul fogalmazva egy kódolás egy karakterkészletnek felel meg...
A helyzet kezelésére az OmegaT 3 alapvető megoldást kínál. A 3 módszer mindegyike a Beállítások menü állományszűrőinek használatára épül.
.txt
kiterjesztésű állományoknak - a kódolását..txt
állománynak megfelelő kódolásra..txt
-ről .jp
-re.*.jp
Forrásállomány nevének mintájához és válassza ki a megfelelő paramétereket a forrásnyelvi és a célnyelvi kódoláshoz..txt
-ről .utf8
-ra.Jelenleg az OmegaT az alábbi formátumú egyszerű szöveges állományokat támogatja
.txt
szövegeket az OmegaT automatikusan (auto) a számítógép alapbeállítás szerinti kódolásának megfelelően értelmezi..txt1
állományokat az OmegaT ISO-8859-1 kódolásúnak tekinti (ez a kódolás lefedi a legtöbb nyugat-európai nyelvet)..txt2
állományokat az OmegaT ISO-8859-2 kódolásúnak tekinti (ez a kódolás lefedi a legtöbb közép- és kelet-európai nyelvet)..utf8
állományokat az OmegaT UTF-8 kódolásúnak tekinti (ez a kódolás lefedi a világ csaknem összes nyelvét).Ellenőrizheti mindezt, ha a Beállítások menüben az Állományszűrők pontra kattint.
Az OmegaT ezen felsorolás használatával segítséget nyújt egyes egyszerű szöveges állományok kezeléséhez.
Ha például cseh szöveges állománnyal van dolga (amely minden valószínűség szerint ISO-8859-2 kódolású), akkor a .txt
kiterjesztés .txt2
-re módosítása esetén az OmegaT annak tartalmát helyesen fogja értelmezni.