Ero sivun ”CSV” versioiden välillä

Siirry navigaatioon Siirry hakuun
päivitystä
Merkkaukset: Mobiilimuokkaus mobiilisivusto-muokkaus
Ei muokkausyhteenvetoa
Rivi 17: Rivi 17:
'''CSV''' ''(Comma-Separated Values)'' on yksinkertainen, vakiomuotoinen tekstitiedostoformaatti, jolla tallennetaan taulukkomuotoista tietoa. CSV-tiedosto koostuu riveistä, ja kukin rivi edustaa yhtä tietoriviä. Rivin sisällä olevat kentät (sarakkeet) erotetaan toisistaan erotinmerkillä. Valmiita CSV-tiedostoja voidaan tuoda lähes kaikkiin taulukkolaskenta-, tietokanta- ja ohjelmointiohjelmistoihin.
'''CSV''' ''(Comma-Separated Values)'' on yksinkertainen, vakiomuotoinen tekstitiedostoformaatti, jolla tallennetaan taulukkomuotoista tietoa. CSV-tiedosto koostuu riveistä, ja kukin rivi edustaa yhtä tietoriviä. Rivin sisällä olevat kentät (sarakkeet) erotetaan toisistaan erotinmerkillä. Valmiita CSV-tiedostoja voidaan tuoda lähes kaikkiin taulukkolaskenta-, tietokanta- ja ohjelmointiohjelmistoihin.


'''Tiedoston rakenne ja erotinmerkit (DSV)'''
===Tiedoston rakenne ja erotinmerkit (DSV)===
CSV on itse asiassa yleisemmin DSV (Delimiter-Separated Values), sillä käytetty erotin voi vaihdella alueittain ja ohjelmistoittain.
CSV on itse asiassa yleisemmin DSV (Delimiter-Separated Values), sillä käytetty erotin voi vaihdella alueittain ja ohjelmistoittain.


​'''Erotinmerkit'''
===Erotinmerkit===
​CSV-standardin (RFC 4180) oletus on pilkku (,), mutta seuraavat erottimet ovat yleisiä:
​CSV-standardin (RFC 4180) oletus on pilkku (,), mutta seuraavat erottimet ovat yleisiä:
​* Pilkkua (,) käytetään ensisijaisesti angloamerikkalaisissa järjestelmissä.
​* Pilkkua (,) käytetään ensisijaisesti angloamerikkalaisissa järjestelmissä.
Rivi 26: Rivi 26:
​* Tabulaattoria käytettäessä tiedostomuotoa kutsutaan usein [[TSV]]-muodoksi (Tab-Separated Values).
​* Tabulaattoria käytettäessä tiedostomuotoa kutsutaan usein [[TSV]]-muodoksi (Tab-Separated Values).


​'''Rivinvaihdot'''
===Rivinvaihdot===
​Rivinvaihdon merkintä vaikuttaa tiedoston yhteensopivuuteen eri käyttöjärjestelmissä:
​Rivinvaihdon merkintä vaikuttaa tiedoston yhteensopivuuteen eri käyttöjärjestelmissä:
​* CRLF (Carriage Return + Line Feed): Yleisin Windows-järjestelmissä ja RFC 4180 -standardin suosittelema.
​* CRLF (Carriage Return + Line Feed): Yleisin Windows-järjestelmissä ja RFC 4180 -standardin suosittelema.
​* LF (Line Feed): Yleisin Unix- ja Linux-järjestelmissä.
​* LF (Line Feed): Yleisin Unix- ja Linux-järjestelmissä.


​'''Otsikkorivi'''
===Otsikkorivi===
​Tiedoston ensimmäinen rivi sisältää useimmiten kenttien nimet eli otsikkorivin (Header Row).
​Tiedoston ensimmäinen rivi sisältää useimmiten kenttien nimet eli otsikkorivin (Header Row).
'''Lainausmerkit ja erikoismerkit'''
===Lainausmerkit ja erikoismerkit===
​CSV-formaatti käyttää lainausmerkkejä merkkijonojen ja erikoismerkkien käsittelyyn.
​CSV-formaatti käyttää lainausmerkkejä merkkijonojen ja erikoismerkkien käsittelyyn.
​* Arvon ympäröiminen: Jos kentän arvo sisältää:
​* Arvon ympäröiminen: Jos kentän arvo sisältää:
* erotinmerkin (esim. ; tai ,),
* erotinmerkin (esim. ; tai ,),
* rivinvaihdon, tai
* rivinvaihdon, tai
* lainausmerkin ("), on koko arvo ympäröitävä lainausmerkeillä (").
* lainausmerkin ("), on koko arvo ympäröitävä lainausmerkeillä (").
​* Lainausmerkin escapointi: Jos lainausmerkeillä ympäröity arvo sisältää itsessään lainausmerkin, on se escapoitava (escaping) eli esitettävä kahdella peräkkäisellä lainausmerkillä ("").
​* Lainausmerkin escapointi: Jos lainausmerkeillä ympäröity arvo sisältää itsessään lainausmerkin, on se escapoitava (escaping) eli esitettävä kahdella peräkkäisellä lainausmerkillä ("").


Noudettu kohteesta ”https://www.linux.fi/wiki/CSV