Salta al contingut principal

Com corregir problemes de delimitadors CSV abans de la importació

Per Converty Team

Aprèn a corregir problemes de delimitadors CSV abans d'una importació revisant detecció de separadors, supòsits de capçalera, previsualització parsejada i validació per fila en comptes d'endevinar des del fitxer cru.

Com corregir problemes de delimitadors CSV abans de la importació

Les importacions CSV fallen per motius avorrits més sovint que per motius dramàtics. Un fitxer sembla correcte en un full de càlcul, es puja a un CRM, CMS o eina interna, i falla perquè el separador no era el que el sistema receptor esperava. El frustrant és que les files poden semblar raonables a simple vista. El problema només es veu quan el parser llegeix el fitxer d'una manera diferent de la persona que l'ha obert.

Els problemes de delimitador mostren per què inspeccionar el fitxer cru no és suficient. Veure comes, punts i comes, tabulacions o barres verticals en text pla diu alguna cosa. Veure com els interpreta un parser diu molt més.

Aquesta és la feina del validador CSV de Converty. No intenta convertir-se en el teu sistema d'importació. T'ajuda a revisar detecció de delimitadors, supòsits de capçalera, forma de fila i sortida parsejada abans que el fitxer arribi al pas fràgil on un altre sistema el rebutja.

Per què els problemes de delimitador són tan comuns

Molts fitxers CSV només són "CSV" en el sentit flexible de text delimitat pensat per a intercanvi tipus full de càlcul. A la pràctica, el separador pot ser una coma, un punt i coma, una tabulació o una barra vertical segons l'origen, la locale o l'hàbit de l'equip.

Per això els problemes apareixen sovint en fluxos internacionals o entre eines. Una exportació usa punts i comes. Una altra usa tabulacions perquè les dades ja contenen comes en camps lliures. Un tercer sistema diu CSV però espera una estructura estreta amb cometes i capçaleres consistents.

El resultat és familiar: una fila de capçalera queda en una sola columna, un recompte de camps es desvia a mig fitxer o la importació sembla funcionar mentre desplaça dades a columnes equivocades.

La pregunta segura és com s'està llegint el fitxer

Aquí la previsualització parsejada de Converty importa més que el text cru. Si el parser detecta una coma i el fitxer volia un punt i coma, veuràs la forma trencar-se de seguida. Si detecta un punt i coma i les files s'alineen correctament, tens més confiança que la importació es comportarà bé.

Això canvia l'hàbit de revisió. El delimitador deixa de ser un signe de puntuació i passa a ser una regla de parseig que pots confirmar o qüestionar amb evidència.

També és per això que la detecció de delimitador i el toggle de capçalera van junts. Una fila pot estar parsejada amb el separador correcte i continuar fallant si la primera fila s'interpreta malament.

Un flux realista abans d'importar

Imagina que algú exporta contactes d'un sistema i els ha d'importar en un altre. El fitxer s'obre bé en un full de càlcul, però diverses columnes contenen comes dins de camps entre cometes i l'origen estava configurat per a punts i comes.

El flux més ràpid és:

  1. Obre el fitxer al validador CSV o enganxa'n una mostra representativa.
  2. Revisa el delimitador detectat en comptes d'assumir-lo.
  3. Canvia l'opció de capçalera si la primera fila s'interpreta malament.
  4. Llegeix la llista d'incidències per trobar formes de fila inconsistents, duplicats o files buides.
  5. Comprova la previsualització parsejada per confirmar que les columnes s'alineen amb el que espera la destinació.

Aquesta seqüència elimina l'endevinalla. No intentes decidir a ull si una coma és delimitador o un caràcter literal dins d'un camp amb cometes.

Els delimitadors i les capçaleres sovint fallen junts

Si la primera fila es converteix en una cadena gegant perquè el separador era equivocat, el fitxer pot semblar que té una capçalera trencada quan el problema real és el delimitador. També passa al revés: un delimitador correcte amb una suposició de capçalera incorrecta pot fer que un fitxer vàlid sembli sospitós.

El toggle de capçalera de Converty et deixa confirmar si la primera fila són etiquetes o dades sense reconstruir el fitxer.

Arregla el fitxer abans que l'eina d'importació sigui el depurador

Els sistemes d'importació solen ser llocs dolents per depurar estructura CSV. Et diuen que una fila ha fallat o que un recompte de columnes s'ha desviat, però sovint no mostren el fitxer d'una manera que ajudi a arreglar-lo ràpidament.

Per això una passada prèvia de validació és tan valuosa. Mantens la depuració a prop del fitxer font. Si el pas següent es mou cap a formats de configuració, combina-ho amb Per què la sortida TOML no està disponible per a algunes entrades JSON o YAML.

Una comprovació de delimitador és una assegurança barata

La millor importació CSV és la que sembla avorrida perquè l'estructura ja estava confirmada abans de pujar-la. Obre el validador CSV, consulta les preguntes freqüents, revisa Com validar fitxers CSV abans que falli una importació i mantén a prop la guia de TOML quan el proper problema de traspàs passi de files a configuració.

També et pot interessar