Ero sivun ”CSV” versioiden välillä

Siirry navigaatioon Siirry hakuun
EgoLuser (keskustelu | muokkaukset)
p Ohjelmat jotka avaavat ja luovat .csv-tiedostoja: Tarkennettu ja lisätty awk esimerkiksi.
päivitystä
Merkkaukset: Mobiilimuokkaus mobiilisivusto-muokkaus
Rivi 15: Rivi 15:
| avoinkoodi    =  
| avoinkoodi    =  
}}
}}
'''CSV''' ''(comma-separated values)'' on pilkuilla erotellut arvot. CSV tiedosto, jolla tallennetaan yksinkertaista taulukkomuotoista tietoa [[Tekstitiedosto|tekstitiedosto]]on. Valmiita CSV-tiedostoja voidaan viedä [[Taulukkolaskenta|taulukkolaskenta]], [[Tietokantaohjelma|tietokantaohjelmiin]] tai ohjelmoitaviin ohjelmistoihin. CSV:n toteutus on tekstitiedosto, jonka taulukkorakenteen eri kentät on eroteltu toisistaan pilkuilla ja rivinvaihdoilla.
'''CSV''' ''(Comma-Separated Values)'' on yksinkertainen, vakiomuotoinen tekstitiedostoformaatti, jolla tallennetaan taulukkomuotoista tietoa. CSV-tiedosto koostuu riveistä, ja kukin rivi edustaa yhtä tietoriviä. Rivin sisällä olevat kentät (sarakkeet) erotetaan toisistaan erotinmerkillä. Valmiita CSV-tiedostoja voidaan tuoda lähes kaikkiin taulukkolaskenta-, tietokanta- ja ohjelmointiohjelmistoihin.
 
'''Tiedoston rakenne ja erotinmerkit (DSV)'''
CSV on itse asiassa yleisemmin DSV (Delimiter-Separated Values), sillä käytetty erotin voi vaihdella alueittain ja ohjelmistoittain.
 
​'''Erotinmerkit'''
​CSV-standardin (RFC 4180) oletus on pilkku (,), mutta seuraavat erottimet ovat yleisiä:
​* Pilkkua (,) käytetään ensisijaisesti angloamerikkalaisissa järjestelmissä.
​* Puolipistettä (;) käytetään laajalti Suomessa ja monissa muissa Euroopan maissa. Tämä on välttämätöntä, jos arvoissa itsessään käytetään pilkkua desimaalierottimena (esim. 12,34).
​* Tabulaattoria käytettäessä tiedostomuotoa kutsutaan usein [[TSV]]-muodoksi (Tab-Separated Values).
 
​'''Rivinvaihdot'''
​Rivinvaihdon merkintä vaikuttaa tiedoston yhteensopivuuteen eri käyttöjärjestelmissä:
​* CRLF (Carriage Return + Line Feed): Yleisin Windows-järjestelmissä ja RFC 4180 -standardin suosittelema.
​* LF (Line Feed): Yleisin Unix- ja Linux-järjestelmissä.
 
​'''Otsikkorivi'''
​Tiedoston ensimmäinen rivi sisältää useimmiten kenttien nimet eli otsikkorivin (Header Row).
'''Lainausmerkit ja erikoismerkit'''
​CSV-formaatti käyttää lainausmerkkejä merkkijonojen ja erikoismerkkien käsittelyyn.
​* Arvon ympäröiminen: Jos kentän arvo sisältää:
​ * erotinmerkin (esim. ; tai ,),
​ * rivinvaihdon, tai
​ * lainausmerkin ("), on koko arvo ympäröitävä lainausmerkeillä (").
​* Lainausmerkin escapointi: Jos lainausmerkeillä ympäröity arvo sisältää itsessään lainausmerkin, on se escapoitava (escaping) eli esitettävä kahdella peräkkäisellä lainausmerkillä ("").
 


Esimerkki .csv-tiedostosta:
Esimerkki .csv-tiedostosta:
Noudettu kohteesta ”https://www.linux.fi/wiki/CSV