Ero sivun ”Unicode” versioiden välillä

Siirry navigaatioon Siirry hakuun
2 902 merkkiä lisätty ,  5. elokuuta 2006
ei muokkausyhteenvetoa
Ei muokkausyhteenvetoa
Ei muokkausyhteenvetoa
Rivi 17: Rivi 17:
  recode ISO-8859-15..UTF-8 tiedosto.txt
  recode ISO-8859-15..UTF-8 tiedosto.txt
Tiedostojen nimien muuntaminen onnistuu [[convmv]]-nimisellä ohjelmalla.
Tiedostojen nimien muuntaminen onnistuu [[convmv]]-nimisellä ohjelmalla.
== Tiedostojärjestelmät ==
=== EXT3 ===
EXT3 on Linuxissa yleisesti käytetty tiedostojärjestelmä. Se tukee täydellisesti Unicodea ja UTF-8:aa mutta tekee sen tavallaan tietämättään. EXT3-tiedostojärjestelmä ei välitä, mitä merkkejä tiedostojen nimissä on eikä tallenna mitään tietoa käytetystä merkistöstä tai sen koodaustavasta. Tästä johtuen Linux tulkitsee tiedostojen nimet käytössä olevan lokaalin perusteella. Jos käytössä on UTF-8-lokaali (esimerkiksi fi_FI.UTF-8), niin järjestelmä katsoo, että tiedostojen nimet ovat UTF-8-koodattuja. Tämä tarkoittaa, että jos tiedostojen nimet on kirjoitettu käyttäen eri lokaalia, niin todennäköisesti tiedostojen nimet eivät näy täysin oikein. Tiedostojen nimien muuttaminen onnistuu aiemmin mainitulla [[convmv]]-ohjelmalla.
=== NTFS ===
NTFS on Microsoftin kehittämä tiedostojärjestelmä, ja sitä käytetään Windows-koneissa. Monet Linux-käytäjät pitävät koneellaan myös Windowsia ja liittävät Windowsin tiedostojärjestelmät osaksi Linux-järjestelmää (ks. [[mount]]), joten tässä on syytä kertoa, kuinka se tehdään mahdollisimman yhteensopivasti.
NTFS tukee täysin Unicodea, ja se tallentaa tiedostojen nimet aina UTF-16-muodossa. Jotta tiedostojen nimet näkyisivät täysin oikein Linuxissa, täytyy Linuxissa olla käytössä UTF-8-lokaali. Lisäksi [[mount]]-komennolle täytyy kertoa, että NTFS:llä olevien tiedostojen nimet täytyy muuttaa Linuxin ymmärtämään UTF-8-muotoon. Tämä tapahtuu tiedostojärjestelmää liitettäessä antamalla [[mount]]-komennolla optioksi ”nls=utf8”. Sen voi tehdä esimerkiksi [[fstab|/etc/fstab]]-tiedostossa seuraavan rivin avulla:
/dev/hdb1  /mnt/windows-c  ntfs  nls=utf8,gid=1000  0  0
Katso lisätietoja [[fstab]]-sivulta sekä Linuxista komennolla <tt>man mount</tt>.
=== FAT ===
Myös FAT on Microsoftin kehittämä tiedostojärjestelmä. Sitä käytetään paitsi Windowsissa mutta yleisesti myös USB-muistien, digikameroiden ja kannettavien MP3-soittimien tiedostojärjestelmänä. FAT tukee myös Unicodea ja periaatteessa tallentaa tiedostojen nimet UTF-16-muodossa. Ikänsä vuoksi se tukee kuitenkin vain Unicoden ensimmäisiä versioita, ja merkkejä alueelta U+10000..U+10FFFF ei tiedostojen nimissä voida käyttää. FATin tukema merkkivalikoima käsittää kuitenkin suurimman osan maailman kirjoitusmerkeistä, joten sen Unicode-tuki on käytännössä erittäin hyvä.
Samoin kuin NTFS:ssä, myös FAT-tiedostojärjestelmää liitettäessä täytyy Linuxille kertoa, mihin muotoon tiedostojen nimet täytyy muuttaa. Käytettäessä Linuxissa UTF-8-lokaalia, täytyy FAT-tiedostojärjestelmä liittää Linuxiin käyttämällä [[mount]-komennon optiota ”utf8”. [[fstab|/etc/fstab]]-tiedostoon laitettaisiin esimerkiksi rivi:
/dev/hdb2  /mnt/windows-d  vfat  utf8,dmask=077,fmask=177  0  0


== Ohjelmat ==
== Ohjelmat ==
Rekisteröitymätön käyttäjä

Navigointivalikko