Nettoyage des fichiers – Round 2

Nous avions présenté notre solution pas très glamour pour nettoyer les fichiers des boutons sous forme + # *, une solution qui créait des fichiers intermédiaires à chaque étape, nous nous sommes retrouvés avec 800 fichiers dans le répertoire « pages_dump »…

Alors on présente la nouvelle solution du jour qui, pour commencer, ne génère pas autant de fichiers, et, pour finir permet de prendre en compte aussi la puce  » o  » qui nous donnait du fil à retordre, puisqu’il fallait supprimer les lignes commençant par ces puces  » o « , mais sans les lignes commençant par « on… » « others… » « ostra… ». :

sed 's/^[ \t| \s]*//;/^\(#\|*\|+\|o \)/d' essai.txt | awk '!a[$0]++' > essai2.txt

Maintenant que nous avons nettoyé nos fichiers des boutons, il n’y a plus qu’à recommencer le trameur.

Publicités

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s