Kódování textu v souborech digitálních dokumentů odkazuje na způsob, jakým jsou sekvence bajtů mapovány na znaky v jazyce. Existuje mnoho různých kódování pro různé jazyky. Kódování textového souboru můžete určit pomocí řady softwarových nástrojů.
Je to nutné
- - Microsoft Office Word;
- - KWrite;
- - Mozilla Firefox;
- - enca.
Instrukce
Krok 1
K určení kódování textového souboru použijte aplikaci Microsoft Office Word, pokud je ve vašem počítači nainstalována. Spusťte tuto aplikaci. V hlavní nabídce vyberte položky „Soubor“a „Otevřít …“nebo stiskněte klávesovou zkratku Ctrl + O. V zobrazeném dialogovém okně přejděte do požadovaného adresáře a vyberte soubor. Klikněte na tlačítko „Otevřít“. Pokud se kódování textu liší od CP1251, automaticky se otevře dialogové okno „Převést soubor“. Aktivujte v něm možnost „Jiné“a vyberte kódování pomocí seznamu vpravo. Pokud je vybráno správné kódování, v poli „Ukázka“se zobrazí čitelný text.
Krok 2
Použijte textové editory, které umožňují výběr kódování zdrojového textu. Dobrým příkladem takové aplikace je KWrite (běží na KDE v systémech podobných systému UNIX). Vložte textový soubor do editoru. Pak stačí iterovat přes kódování, dokud se nezobrazí čitelný text (v KWrite se to provádí pomocí části Kódování v nabídce Nástroje).
Krok 3
Podobně jako v textovém editoru můžete k určení kódování souboru použít prohlížeč. Použijte Mozilla Firefox. Spusťte tuto aplikaci. Pokud není nainstalován, stáhněte si příslušnou distribuci z mozilla.org a nainstalujte ji. Otevřete textový soubor v prohlížeči. Chcete-li to provést, vyberte v hlavní nabídce položky „Soubor“a „Otevřít soubor …“nebo stiskněte Ctrl + O. Pokud se načtený text zobrazuje správně, rozbalte sekci „Kódování“nabídky „Zobrazit“a vyhledejte kódování podle názvu položky, na kterou je značka nastavena. V opačném případě vyberte tento parametr výběrem různých položek stejné nabídky a také její části „Další“.
Krok 4
K určení kódování textových souborů použijte speciální nástroje. V systémech podobných systému UNIX můžete použít enca. V případě potřeby nainstalujte tento program pomocí dostupných správců balíků. Seznam dostupných jazyků zobrazíte spuštěním příkazu:
enca - seznam jazyků
Určete kódování textového souboru zadáním jeho názvu pomocí volby -g a jazyka dokumentu pomocí volby -L. Například:
enca -L ruština -g /home/vic/tmp/aaa.txt.