Ero sivun ”CSV” versioiden välillä
Siirry navigaatioon
Siirry hakuun
p →Ohjelmat jotka avaavat ja luovat .csv-tiedostoja: Tarkennettu ja lisätty awk esimerkiksi. |
päivitystä Merkkaukset: Mobiilimuokkaus mobiilisivusto-muokkaus |
||
| Rivi 15: | Rivi 15: | ||
| avoinkoodi = | | avoinkoodi = | ||
}} | }} | ||
'''CSV''' ''( | '''CSV''' ''(Comma-Separated Values)'' on yksinkertainen, vakiomuotoinen tekstitiedostoformaatti, jolla tallennetaan taulukkomuotoista tietoa. CSV-tiedosto koostuu riveistä, ja kukin rivi edustaa yhtä tietoriviä. Rivin sisällä olevat kentät (sarakkeet) erotetaan toisistaan erotinmerkillä. Valmiita CSV-tiedostoja voidaan tuoda lähes kaikkiin taulukkolaskenta-, tietokanta- ja ohjelmointiohjelmistoihin. | ||
'''Tiedoston rakenne ja erotinmerkit (DSV)''' | |||
CSV on itse asiassa yleisemmin DSV (Delimiter-Separated Values), sillä käytetty erotin voi vaihdella alueittain ja ohjelmistoittain. | |||
'''Erotinmerkit''' | |||
CSV-standardin (RFC 4180) oletus on pilkku (,), mutta seuraavat erottimet ovat yleisiä: | |||
* Pilkkua (,) käytetään ensisijaisesti angloamerikkalaisissa järjestelmissä. | |||
* Puolipistettä (;) käytetään laajalti Suomessa ja monissa muissa Euroopan maissa. Tämä on välttämätöntä, jos arvoissa itsessään käytetään pilkkua desimaalierottimena (esim. 12,34). | |||
* Tabulaattoria käytettäessä tiedostomuotoa kutsutaan usein [[TSV]]-muodoksi (Tab-Separated Values). | |||
'''Rivinvaihdot''' | |||
Rivinvaihdon merkintä vaikuttaa tiedoston yhteensopivuuteen eri käyttöjärjestelmissä: | |||
* CRLF (Carriage Return + Line Feed): Yleisin Windows-järjestelmissä ja RFC 4180 -standardin suosittelema. | |||
* LF (Line Feed): Yleisin Unix- ja Linux-järjestelmissä. | |||
'''Otsikkorivi''' | |||
Tiedoston ensimmäinen rivi sisältää useimmiten kenttien nimet eli otsikkorivin (Header Row). | |||
| |||
'''Lainausmerkit ja erikoismerkit''' | |||
CSV-formaatti käyttää lainausmerkkejä merkkijonojen ja erikoismerkkien käsittelyyn. | |||
* Arvon ympäröiminen: Jos kentän arvo sisältää: | |||
* erotinmerkin (esim. ; tai ,), | |||
* rivinvaihdon, tai | |||
* lainausmerkin ("), on koko arvo ympäröitävä lainausmerkeillä ("). | |||
* Lainausmerkin escapointi: Jos lainausmerkeillä ympäröity arvo sisältää itsessään lainausmerkin, on se escapoitava (escaping) eli esitettävä kahdella peräkkäisellä lainausmerkillä (""). | |||
Esimerkki .csv-tiedostosta: | Esimerkki .csv-tiedostosta: | ||