Vai al contenuto principale

TSV vs CSV: perché i delimitatori rompono gli import spreadsheet

Di Converty Team

Scopri perché le differenze di delimitatore tra TSV e CSV rompono gli import spreadsheet e come ispezionare le righe parsate prima che il sistema di destinazione rifiuti il file.

TSV vs CSV: perché i delimitatori rompono gli import spreadsheet

Gli import da spreadsheet spesso falliscono perché il file non viene diviso come si aspetta il sistema di destinazione. Un file può chiamarsi CSV ma usare tab. Un altro export può usare punti e virgola per impostazioni regionali. Un campione incollato può sembrare allineato in un foglio di calcolo ma collassare in una sola colonna quando viene parsato con il delimitatore sbagliato.

È questa la differenza pratica dietro i problemi di delimitatore TSV vs CSV. La domanda importante non è solo cosa dica l'estensione del file. È come siano effettivamente separate le righe. Il Validatore CSV di Converty aiuta rilevando delimitatori e mostrando un'anteprima parsata prima che il sistema di import diventi il primo posto in cui scopri il problema.

CSV e TSV sono entrambi formati basati su delimitatori

CSV di solito significa comma-separated values. TSV significa tab-separated values. Entrambi memorizzano righe come testo e separano i campi con un delimitatore.

Il problema è che gli export reali non sono sempre etichettati in modo pulito. Un foglio di calcolo può salvare un file con virgole, tab o punti e virgola a seconda del percorso di export e della locale. Un sistema che presume virgole può leggere male un file tab-separated come un unico campo largo. Un sistema che presume tab può fallire nel dividere righe separate da virgole.

I problemi di delimitatore sembrano problemi dati

Quando il delimitatore è sbagliato, tutto a valle sembra rotto:

  • gli header appaiono come una sola colonna combinata
  • le lunghezze delle righe non corrispondono
  • i campi slittano nelle colonne sbagliate
  • colonne richieste sembrano mancanti
  • gli import riportano errori di validazione confusi

Il file potrebbe non essere cattivo. Potrebbe semplicemente essere parsato con il separatore sbagliato.

Ispeziona l'anteprima parsata prima dell'import

Il workflow più sicuro è ispezionare la struttura prima dell'upload o dell'import.

  1. Apri il Validatore CSV.
  2. Incolla le righe o carica il file.
  3. Controlla il delimitatore rilevato.
  4. Conferma che la riga header venga divisa nelle colonne attese.
  5. Confronta l'anteprima parsata con lo spreadsheet sorgente.
  6. Correggi l'export o l'aspettativa sul delimitatore prima di inviare il file a valle.

Questo mantiene il debug del delimitatore vicino al file invece che dentro il sistema di destinazione.

La validazione header dipende dalla validazione delimitatore

I problemi di riga header e di delimitatore sono collegati. Se il delimitatore è sbagliato, la riga header non è affidabile. Un warning su colonna duplicata o mancante può essere un vero problema di header, oppure un segnale che il parser non ha mai diviso correttamente la riga.

Per una guida specifica sugli header, leggi Come validare la riga header di un CSV prima dell'import. Per il workflow più ampio sui delimitatori, leggi Come risolvere problemi di delimitatori CSV prima dell'importazione.

Apri il Validatore CSV prima di importare un export spreadsheet quando TSV, CSV, punti e virgola o righe incollate potrebbero non usare il delimitatore atteso dal sistema di destinazione.

Ti potrebbe interessare anche