Distri-Award
– Jetzt zur Umfrage!

Suchen

Definition Was ist eine CSV-Datei?

| Autor / Redakteur: Nicole / Margrit Lingner

Das csv-Format dient dem unkomplizierten Austausch von Daten zwischen verschiedenen Programmen über die Export- und Importfunktion. Es handelt sich dabei um ein systemübergreifendes Textformat ohne allgemeingültigen Standard.

Firmen zum Thema

Grundlagenwissen zum IT-Business
Grundlagenwissen zum IT-Business
(Bild: © adiruch na chiangmai - Fotolia.com)

Die Abkürzung „csv“ steht für „comma-separated values“, also durch Komma getrennte Daten. Das Format wird für einen reibungslosen Austausch von Daten zwischen Programmen wie zum Beispiel Excel und Outlook über die Kopieren- und Einfügefunktion genutzt.

Aufbau der Datei

Zwar sollen csv-Dateien ein problemloses Übertragen von Daten erlauben, dennoch müssen dabei bestimmte Regeln beachtet werden:

  • eine Textzeile pro Datensatz
  • Trennung der Datenfelder durch ein bestimmtes Zeichen
  • optional bezeichnet die Kopfzeile die Datenfelder

Die Datensätze können aus einer Tabellenkalkulation oder einem Datenbank gestützten Programm stammen. Gängige Beispiele sind Excel, MySQL oder Oracle. Handelt es sich beispielsweise um den Kundenbestand, besteht ein Datensatz aus den Kundeninformationen. Die Trennung der einzelnen Datensätze erfolgt durch einen Zeilenumbruch.

In den Datenfeldern finden sich die jeweiligen Details wie Name, Anschrift und Kontaktinformation. Zwecks korrekter Zuordnung beim Import ist deren nähere Bezeichnung in der ersten Zeile der csv-Datei möglich. Um die einzelnen Datensätze voneinander zu trennen, dient ein Zeichen, daher die Bezeichnung „csv“ (comma-separated values oder kommagetrennte Werte). Alternativ findet ein Semikolon, Doppelpunkt, Leerzeichen oder ein anderes Zeichen Verwendung.

Einsatzmöglichkeiten von csv-Dateien

Voraussetzung für den Datenaustausch per csv ist, dass die beteiligten Programme das Format kennen. Je nach Software erfolgt die Formatierung automatisch oder es ist eine freie Konfigurationsmöglichkeit gegeben, um Details wie Trennzeichen und die Datenfeldbezeichnungen in der ersten Zeile festzulegen. Der simple Aufbau erlaubt theoretisch den Austausch jeglicher einfach strukturierter Daten. Dazu zählen zum Beispiel Kundeninformationen, Produktdetails oder Kontobewegungen. Ebenso ist es über csv-Dateien möglich, die komplette Datensicherung beispielsweise eines MySQL-basierten CMS-Systems durchzuführen.

Neben Tabellenkalkulationen und Datenbanken beherrschen Textverarbeitungen und Editoren das Format. Eine csv-Datei kann folglich nach dem Export beziehungsweise vor dem Import noch beliebig bearbeitet werden. Komplexere verschachtelte oder verkettete Datenstrukturen können grundsätzlich im csv-Format abgebildet werden, besser geeignet sind hier jedoch XML oder EDI.

Trennzeichen oder Sonderzeichen

Kommt ein Trennzeichen wie das Komma auch in den Feldinhalten vor – etwa bei Kontobewegungen oder Produktinformationen wie Preisen –, muss der Feldinhalt in Anführungszeichen gesetzt werden. Diese werden Feld- oder Textbegrenzerzeichen bezeichnet. Das anschließend folgende Komma wird beim Import wieder als Trennzeichen erkannt.

Richtige Codierung bei csv-Dateien

Mangels Standard gibt es keine festgelegte Codierung bei csv-Dateien. So kann es vorkommen, dass beim Einlesen einer csv-Datei Umlaute und verschiedene Zeichen nicht korrekt dargestellt werden, weil die Programme unterschiedliche Zeichensätze verwenden. Idealerweise ist eine entsprechende Auswahl möglich, um die richtige Darstellung der Inhalte zu gewährleisten.

(ID:45487021)