Ga naar de hoofdinhoud

TSV versus CSV: waarom scheidingstekens de import van spreadsheets verbreken

Door Converty Team

Ontdek waarom de verschillen tussen TSV- en CSV-scheidingstekens het importeren van spreadsheets verbreken, en hoe u geparseerde rijen kunt inspecteren voordat het doelsysteem het bestand afwijst.

TSV versus CSV: waarom scheidingstekens de import van spreadsheets verbreken

Het importeren van spreadsheets mislukt vaak omdat het bestand niet wordt gesplitst op de manier waarop het doelsysteem verwacht. Een bestand kan CSV heten, maar gebruikt tabbladen. Bij een andere export kunnen puntkomma's worden gebruikt vanwege regionale instellingen. Een geplakt voorbeeld kan er in een spreadsheet uitgelijnd uitzien, maar samenvallen in één kolom wanneer het wordt geparseerd met het verkeerde scheidingsteken.

Dat is het praktische verschil achter problemen met scheidingstekens tussen TSV en CSV. De belangrijke vraag is niet alleen wat de bestandsextensie zegt. Het is hoe de rijen feitelijk gescheiden zijn. De CSV Validator van Converty helpt door scheidingstekens te detecteren en een ontleed voorbeeld weer te geven voordat het importsysteem de eerste plaats wordt waar u het probleem ontdekt.

CSV en TSV zijn beide op scheidingstekens gebaseerde formaten

CSV betekent meestal door komma's gescheiden waarden. TSV betekent door tabs gescheiden waarden. Beide slaan rijen op als tekst en scheiden velden met een scheidingsteken.

Het probleem is dat de echte export niet altijd netjes wordt geëtiketteerd. In een spreadsheet kan een bestand met komma's, tabs of puntkomma's worden opgeslagen, afhankelijk van het exportpad en de landinstelling. Een systeem dat uitgaat van komma's kan een door tabs gescheiden bestand verkeerd interpreteren als één breed veld. Een systeem dat uitgaat van tabbladen kan er niet in slagen door komma's gescheiden rijen te splitsen.

Problemen met scheidingstekens lijken op gegevensproblemen

Als het scheidingsteken verkeerd is, ziet alles stroomafwaarts er kapot uit:

  • kopteksten verschijnen als één gecombineerde kolom
  • rijlengtes komen niet overeen
  • velden verschuiven naar de verkeerde kolommen
  • vereiste kolommen lijken te ontbreken
  • Imports rapporteren verwarrende validatiefouten

Het bestand is mogelijk niet slecht. Het kan eenvoudigweg worden geparseerd met het verkeerde scheidingsteken.

Inspecteer het geparseerde voorbeeld vóór het importeren

De veiligste workflow is om de structuur te inspecteren voordat deze wordt geüpload of geïmporteerd.

  1. Open de CSV-validator.
  2. Plak de rijen of upload het bestand.
  3. Controleer het gedetecteerde scheidingsteken.
  4. Bevestig dat de koprij zich opsplitst in de verwachte kolommen.
  5. Controleer het geparseerde voorbeeld met het bronspreadsheet.
  6. Corrigeer de verwachte export- of scheidingstekens voordat u het bestand stroomafwaarts verzendt.

Hierdoor blijft de delimiter-foutopsporing dicht bij het bestand en niet binnen het doelsysteem.

De headervalidatie is afhankelijk van de validatie van het scheidingsteken

Problemen met koprijen en problemen met scheidingstekens houden verband met elkaar. Als het scheidingsteken verkeerd is, kan de koprij niet worden vertrouwd. Een dubbele of ontbrekende kolomwaarschuwing kan een echt headerprobleem zijn, of het kan een teken zijn dat de parser de rij nooit correct heeft gesplitst.

Voor kopspecifieke richtlijnen leest u Een CSV-koprij valideren vóór import. Voor de bredere workflow voor scheidingstekens leest u Problemen met CSV-scheidingstekens oplossen vóór een import.

Open de CSV Validator voordat u een spreadsheetexport importeert wanneer TSV, CSV, puntkomma's of geplakte rijen mogelijk niet het scheidingsteken gebruiken dat uw doelsysteem verwacht.

Misschien vind je dit ook interessant