Après avoir pris ce fichier : Réserve parlementaire
Maintenant je prends ce fichier : Dotation d’action parlementaire (Sénat)
On commence par le fichier CSV, qui est au bon format ! Contrairement au fichier du Parlement on a des points-virgules et non des virgules. Mais je ne suis pas pour autant un adepte de ce format à cause des retours chariots.
$ cat reserve2014.csv | awk -F ";" '{print NF-1 }' | sort -n | uniq -c 84 0 7 2 51 3 51 6 7 7 6105 9
Il y a quand même 84+7+51+51+7 = 200 lignes à reprendre. Mais il y a des solutions pour reprendre ceci de façon automatique … awk …
Le fichier JSON est vraiment mal fait, contrairement au fichier du Parlement, toutes les données sont sur une même ligne !
$ wc -l reserve2014.json 0 reserve2014.json
Il y a vraiment un problème de format …. je vais donc essayer de lancer une discussion afin d’améliorer la qualité des fichiers. Ma précédente discussion a été refusée sûrement parce que j’avais mis un lien (URL), cette fois je vais mettre que du texte.