Preskoči na glavni sadržaj

TSV vs CSV: zašto delimiteri lome uvoze proračunskih tablica

Autor: Converty Team

Saznajte zašto razlike između TSV i CSV delimitera lome uvoze proračunskih tablica i kako pregledati parsirane retke prije nego što ciljni sustav odbije datoteku.

TSV vs CSV: zašto delimiteri lome uvoze proračunskih tablica

Uvozi proračunskih tablica često ne uspiju jer se datoteka ne dijeli onako kako ciljni sustav očekuje. Datoteka se može zvati CSV, ali koristiti tabove. Drugi export može koristiti točku-zarez zbog regionalnih postavki. Zalijepljeni uzorak može izgledati poravnato u spreadsheetu, ali se srušiti u jedan stupac kada se parsira pogrešnim delimiterom.

To je praktična razlika iza TSV vs CSV problema s delimiterima. Važno pitanje nije samo što piše u ekstenziji datoteke. Važno je kako su retci stvarno odvojeni. Convertyjev CSV validator pomaže detekcijom delimitera i prikazom parsiranog previewa prije nego što import sustav postane prvo mjesto na kojem otkrijete problem.

CSV i TSV su formati temeljeni na delimiterima

CSV obično znači comma-separated values. TSV znači tab-separated values. Oba spremaju retke kao tekst i odvajaju polja delimiterom.

Problem je što stvarni exporti nisu uvijek jasno označeni. Spreadsheet može spremiti datoteku sa zarezima, tabovima ili točkama-zarezima, ovisno o putu exporta i localeu. Sustav koji pretpostavlja zareze može tab-separated datoteku pogrešno pročitati kao jedno široko polje. Sustav koji pretpostavlja tabove može ne uspjeti razdvojiti retke odvojene zarezima.

Problemi s delimiterima izgledaju kao problemi s podacima

Kada je delimiter pogrešan, sve nizvodno izgleda slomljeno:

  • headeri se pojavljuju kao jedan kombinirani stupac
  • duljine redaka se ne podudaraju
  • polja se pomiču u pogrešne stupce
  • obavezni stupci izgledaju kao da nedostaju
  • uvozi prijavljuju zbunjujuće validacijske pogreške

Datoteka možda nije loša. Možda je samo parsirana pogrešnim separatorom.

Pregledajte parsirani preview prije uvoza

Najsigurniji workflow je pregledati strukturu prije uploada ili uvoza.

  1. Otvorite CSV validator.
  2. Zalijepite retke ili učitajte datoteku.
  3. Pregledajte detektirani delimiter.
  4. Potvrdite da se header redak dijeli u očekivane stupce.
  5. Usporedite parsirani preview s izvornom proračunskom tablicom.
  6. Popravite export ili očekivanje delimitera prije slanja datoteke nizvodno.

Tako delimiter debugging ostaje blizu datoteke, a ne skriven unutar ciljnog sustava.

Validacija headera ovisi o validaciji delimitera

Problemi s header retkom i problemi s delimiterima povezani su. Ako je delimiter pogrešan, header retku ne možete vjerovati. Upozorenje o dupliciranom ili nedostajućem stupcu može biti stvaran problem s headerom ili znak da parser nikada nije ispravno razdvojio redak.

Za smjernice specifične za header pročitajte Kako validirati CSV redak zaglavlja prije uvoza. Za širi workflow s delimiterima pročitajte Kako ispraviti probleme s CSV delimiterima prije uvoza.

Otvorite CSV validator prije uvoza spreadsheet exporta kada TSV, CSV, točke-zarezi ili zalijepljeni retci možda ne koriste delimiter koji ciljni sustav očekuje.

Možda će vam se svidjeti