Forum Clubic

Encore fichier texte à bidouiller

Bonjour,

j’ai un fichier texte comportant 13500 lignes.
Je cherche un moyen de trouver les lignes qui se répètent.
Je pense que sur les 13500, j’en ai une vingtaine qui sont en double dans le fichier.

Y-a-t-il une combine? Copier dans Excel ??

J’utilise comme éditeur de texte Notepad++, si çà peut aider.

Merci

Seb
Edité le 23/04/2010 à 19:22

Avec python ou perl (ou autre), tu peux créer des ensembles (des tableaux en gros).
Pour les ensembles, chaque clé est unique …

Donc la méthode c’est de créer un ensemble avec toutes les lignes … ensuite en écrivant l’ensemble des élements dans un fichier texte, tu auras toutes les lignes (sans répétition)

Sinon effectivement tu as une fonction “Supprimer les doublons” dans Excel :

Ouvre ton fichier dans Excel, choisis un séparateur de colonne qui n’est pas présent dans ton fichier (afin du tout se retrouve dans la même colonne), clique sur “Supprimer les doublons”, et tu n’as plus qu’à sauvegarder.