Ero sivun ”CSV” versioiden välillä
Siirry navigaatioon
Siirry hakuun
päivitystä Merkkaukset: Mobiilimuokkaus mobiilisivusto-muokkaus |
Ei muokkausyhteenvetoa |
||
| Rivi 17: | Rivi 17: | ||
'''CSV''' ''(Comma-Separated Values)'' on yksinkertainen, vakiomuotoinen tekstitiedostoformaatti, jolla tallennetaan taulukkomuotoista tietoa. CSV-tiedosto koostuu riveistä, ja kukin rivi edustaa yhtä tietoriviä. Rivin sisällä olevat kentät (sarakkeet) erotetaan toisistaan erotinmerkillä. Valmiita CSV-tiedostoja voidaan tuoda lähes kaikkiin taulukkolaskenta-, tietokanta- ja ohjelmointiohjelmistoihin. | '''CSV''' ''(Comma-Separated Values)'' on yksinkertainen, vakiomuotoinen tekstitiedostoformaatti, jolla tallennetaan taulukkomuotoista tietoa. CSV-tiedosto koostuu riveistä, ja kukin rivi edustaa yhtä tietoriviä. Rivin sisällä olevat kentät (sarakkeet) erotetaan toisistaan erotinmerkillä. Valmiita CSV-tiedostoja voidaan tuoda lähes kaikkiin taulukkolaskenta-, tietokanta- ja ohjelmointiohjelmistoihin. | ||
===Tiedoston rakenne ja erotinmerkit (DSV)=== | |||
CSV on itse asiassa yleisemmin DSV (Delimiter-Separated Values), sillä käytetty erotin voi vaihdella alueittain ja ohjelmistoittain. | CSV on itse asiassa yleisemmin DSV (Delimiter-Separated Values), sillä käytetty erotin voi vaihdella alueittain ja ohjelmistoittain. | ||
===Erotinmerkit=== | |||
CSV-standardin (RFC 4180) oletus on pilkku (,), mutta seuraavat erottimet ovat yleisiä: | CSV-standardin (RFC 4180) oletus on pilkku (,), mutta seuraavat erottimet ovat yleisiä: | ||
* Pilkkua (,) käytetään ensisijaisesti angloamerikkalaisissa järjestelmissä. | * Pilkkua (,) käytetään ensisijaisesti angloamerikkalaisissa järjestelmissä. | ||
| Rivi 26: | Rivi 26: | ||
* Tabulaattoria käytettäessä tiedostomuotoa kutsutaan usein [[TSV]]-muodoksi (Tab-Separated Values). | * Tabulaattoria käytettäessä tiedostomuotoa kutsutaan usein [[TSV]]-muodoksi (Tab-Separated Values). | ||
===Rivinvaihdot=== | |||
Rivinvaihdon merkintä vaikuttaa tiedoston yhteensopivuuteen eri käyttöjärjestelmissä: | Rivinvaihdon merkintä vaikuttaa tiedoston yhteensopivuuteen eri käyttöjärjestelmissä: | ||
* CRLF (Carriage Return + Line Feed): Yleisin Windows-järjestelmissä ja RFC 4180 -standardin suosittelema. | * CRLF (Carriage Return + Line Feed): Yleisin Windows-järjestelmissä ja RFC 4180 -standardin suosittelema. | ||
* LF (Line Feed): Yleisin Unix- ja Linux-järjestelmissä. | * LF (Line Feed): Yleisin Unix- ja Linux-järjestelmissä. | ||
===Otsikkorivi=== | |||
Tiedoston ensimmäinen rivi sisältää useimmiten kenttien nimet eli otsikkorivin (Header Row). | Tiedoston ensimmäinen rivi sisältää useimmiten kenttien nimet eli otsikkorivin (Header Row). | ||
| | ||
===Lainausmerkit ja erikoismerkit=== | |||
CSV-formaatti käyttää lainausmerkkejä merkkijonojen ja erikoismerkkien käsittelyyn. | CSV-formaatti käyttää lainausmerkkejä merkkijonojen ja erikoismerkkien käsittelyyn. | ||
* Arvon ympäröiminen: Jos kentän arvo sisältää: | * Arvon ympäröiminen: Jos kentän arvo sisältää: | ||
* erotinmerkin (esim. ; tai ,), | |||
* rivinvaihdon, tai | |||
* lainausmerkin ("), on koko arvo ympäröitävä lainausmerkeillä ("). | |||
* Lainausmerkin escapointi: Jos lainausmerkeillä ympäröity arvo sisältää itsessään lainausmerkin, on se escapoitava (escaping) eli esitettävä kahdella peräkkäisellä lainausmerkillä (""). | * Lainausmerkin escapointi: Jos lainausmerkeillä ympäröity arvo sisältää itsessään lainausmerkin, on se escapoitava (escaping) eli esitettävä kahdella peräkkäisellä lainausmerkillä (""). | ||