Пропуснете към основното съдържание

TSV срещу CSV: защо разделителите чупят spreadsheet import-и

От Converty Team

Научете защо delimiter разликите между TSV и CSV чупят spreadsheet import-и и как да inspect-нете parsed rows, преди target system да отхвърли файла.

TSV срещу CSV: защо разделителите чупят spreadsheet import-и

Spreadsheet import-и често fail-ват, защото файлът не се split-ва по начина, който target system очаква. Файл може да се нарича CSV, но да използва tabs. Друг export може да използва semicolons заради regional settings. Pasted sample може да изглежда aligned в spreadsheet, но да collapse-не в една column, когато се parse-ва с грешния delimiter.

Това е практичната разлика зад TSV срещу CSV delimiter проблемите. Важният въпрос не е само какво казва file extension. Важното е как rows реално са разделени. CSV валидаторът на Converty помага, като detecting delimiters и показва parsed preview, преди import system да стане първото място, където откривате проблема.

CSV и TSV са delimiter-based formats

CSV обикновено означава comma-separated values. TSV означава tab-separated values. И двата format-а съхраняват rows като text и разделят fields с delimiter.

Проблемът е, че real exports не винаги са cleanly labeled. Spreadsheet може да save-не файл с commas, tabs или semicolons в зависимост от export path и locale. Система, която assumes commas, може да прочете tab-separated file като едно широко field. Система, която assumes tabs, може да не split-не comma-separated rows.

Delimiter проблемите изглеждат като data проблеми

Когато delimiter е грешен, всичко downstream изглежда счупено:

  • headers се появяват като една combined column
  • row lengths не съвпадат
  • fields се местят в грешни columns
  • required columns изглеждат missing
  • imports връщат объркващи validation errors

Файлът може да не е лош. Може просто да се parse-ва с грешния separator.

Inspect-нете parsed preview преди import

Най-сигурният workflow е да inspect-нете structure преди upload или import.

  1. Отворете CSV валидатора.
  2. Поставете rows или upload-нете файла.
  3. Прегледайте detected delimiter.
  4. Потвърдете, че header row се split-ва в expected columns.
  5. Проверете parsed preview спрямо source spreadsheet.
  6. Поправете export-а или delimiter expectation, преди да изпратите файла downstream.

Това държи delimiter debugging близо до файла, вместо вътре в target system.

Header validation зависи от delimiter validation

Header row проблемите и delimiter проблемите са свързани. Ако delimiter е грешен, header row не може да се trusted. Duplicate или missing column warning може да е real header issue, или може да е знак, че parser никога не е split-нал row правилно.

За header-specific guidance прочетете Как да валидирате CSV header ред преди import. За по-широк delimiter workflow прочетете Как да поправите проблеми с CSV разделители преди import.

Отворете CSV валидатора преди importing на spreadsheet export, когато TSV, CSV, semicolons или pasted rows може да не използват delimiter-а, който target system очаква.

Може да ви хареса още