Saltar para o conteúdo principal

TSV vs CSV: Porque é que os delimitadores quebram as importações de folhas de cálculo

Por Converty Team

Saiba por que razão as diferenças entre os delimitadores TSV e CSV interrompem as importações de folhas de cálculo e como inspecionar as linhas analisadas antes de o sistema de destino rejeitar o ficheiro.

TSV vs CSV: Porque é que os delimitadores quebram as importações de folhas de cálculo

As importações de folhas de cálculo geralmente falham porque o ficheiro não está a ser dividido da forma esperada pelo sistema de destino. Um ficheiro pode ser chamado CSV, mas utilizar separadores. Outra exportação pode utilizar ponto e vírgula devido às definições regionais. Uma amostra colada pode parecer alinhada numa folha de cálculo, mas ser recolhida numa coluna quando analisada com o delimitador errado.

Esta é a diferença prática por detrás dos problemas do delimitador TSV e CSV. A questão importante não é apenas o que diz a extensão do ficheiro. É como as linhas estão realmente separadas. O Validador CSV do Converty ajuda ao detetar delimitadores e mostrar uma vista analisada antes que o sistema de importação se torne o primeiro local onde descobre o problema.

CSV e TSV são formatos baseados em delimitadores

CSV significa geralmente valores separados por vírgula. TSV significa valores separados por tabulações. Ambos armazenam linhas como texto e separam os campos com um delimitador.

O problema é que as exportações reais nem sempre são rotuladas de forma clara. Uma folha de cálculo pode guardar um ficheiro com vírgulas, tabulações ou ponto e vírgula, dependendo do caminho de exportação e da localização. Um sistema que assume vírgulas pode interpretar mal um ficheiro separado por tabulações como um campo amplo. Um sistema que assuma tabulações pode não conseguir dividir linhas separadas por vírgula.

Problemas de delimitador parecem problemas de dados

Quando o delimitador está errado, tudo o que está abaixo parece estar partido:

  • os cabeçalhos aparecem como uma coluna combinada
  • os comprimentos das linhas não correspondem
  • os campos mudam para as colunas erradas
  • colunas obrigatórias parecem faltar
  • importações reportam erros de validação confusos

O ficheiro pode não ser mau. Pode ser simplesmente analisado com o separador errado.

Inspecione a vista analisada antes de importar

O fluxo de trabalho mais seguro é inspecionar a estrutura antes do carregamento ou importação.

1.º Abra o Validador CSV. 2.º Cole as linhas ou carregue o ficheiro. 3.º Reveja o delimitador detectado. 4.º Confirme se a linha do cabeçalho se divide nas colunas esperadas. 5.º Compare a visualização analisada com a folha de trabalho de origem. 6.º Corrija a expectativa de exportação ou delimitador antes de enviar o ficheiro a jusante.

Isto mantém a depuração do delimitador perto do ficheiro, e não dentro do sistema de destino.

A validação do cabeçalho depende da validação do delimitador

Os problemas de linha de cabeçalho e os problemas de delimitador estão ligados. Se o delimitador estiver errado, a linha do cabeçalho não será fiável. Um aviso de coluna duplicada ou em falta pode ser um problema real de cabeçalho ou pode ser um sinal de que o analisador nunca dividiu a linha corretamente.

Para obter orientação específica do cabeçalho, leia Como validar uma linha de cabeçalho CSV antes da importação. Para um fluxo de trabalho mais amplo do delimitador, leia Como corrigir problemas do delimitador CSV antes de uma importação.

Abra o Validador CSV antes de importar uma exportação de folha de cálculo quando o TSV, CSV, ponto e vírgula ou linhas coladas não estão a utilizar o delimitador que o seu sistema de destino espera.

Também podes gostar