Opmaak tekstbestanden voor import

Uit De Vliegende Brigade
Naar navigatie springen Naar zoeken springen

Het zou prettig zijn als ik zo veel mogelijk dezelfde opmaak gebruik voor import en export van tekstbestanden. Dit gaat primair over exports vanuit LibreOffice Calc, maar alle andere casussen zijn van harte welkom

Casus: Export Calc » Import MySQL (okt. 2018)

Dit lijkt goed te werken voor import in MySQL. Alle velden worden toch als strings geïmporteerd, dus er is geen text delimiter nodig

Instellingen LibreOffice Calc

  • Character set: UTF8
  • Field delimeter: {Tab}
  • Text-delimeter: Geen

Opmerkingen

  • Extensie wordt vanzelf csv, ook al betreft het eigenlijk een tsv-bestand: Calc plaatst er altijd .csv achter
  • Als je wel een text-delimeter gebruikt, en dat karakter komt voor in de bestand (bijvoorbeeld "), dan wordt dat geëscaped ofzo - Vragen om problemen!
  • Cijfers met voorloopnullen, worden geïmporteerd als text - Precies wat de bedoeling is (bv. een artikelnummer zoals '0100' moet '0100' blijven, en niet het getal '100' worden)

Import MySQL

Bijbehorende instellingen voor import in MySQL:

load data local infile "/tmp/02.csv"

	into table import_tmp
	character set utf8
	fields terminated by '\t'
	enclosed by ''
	lines terminated by '\n'
	ignore 1 rows;   # Afhankelijk van de inhoud van het bestand, niet de opmaak

Zie ook