Supprimer mot en double

Bonjour à tous,

voila j’ai un fichier texte contenant des mots, une liste de mots énorme.
Malheureusement, il y a des mots en double. Je cherche à les supprimer
Connaissait vous un logiciel qui permet de le faire ?

Merci pour votre aide
Edité le 24/05/2008 à 13:48

tu peux les mettre dans excel et faire un tri par ordre alphabetique puis regarder vite fait la liste, quand tu vois un double tu le supprime

c’est le plus simple, a moins que tu ais un fichier vraiment énorme :confused:
Edité le 13/04/2008 à 19:53

Et bien comme je l’ai dit, le fichier est énorme, ils sont déjà par ordre alphabétique, mais maintenant pour chercher les doubles ligne par ligne, cela va me prendre un temps fou !

D’autres solutions ?
Edité le 14/04/2008 à 00:49

c’était juste uine solution au cas ou il n’aurais pas été trop gros :neutre:

une macro excel peut etre ? mais là je laisse la place aux experts en excel car je ne maitrise pas :frowning:

Tout dépend comment se présente ton fichier texte.
S’il se présente à raison d’un mot par ligne, moi j’essaierais d’abord sort -u en mode console
Il te faut pour cela récupérer la commande sort d’Unix dans sa version windows, mais ca ne doit pas être le plus dur.

Sinon, excel semble effectivement un bonne solution.
En une seule fois, tu peux traiter 65536 lignes (donc mots)
Et si en plus ton fichier est déjà trié, tu peux le splitter s’il dépasse cette taille et traiter chaque morceau l’un après l’autre

Ensuite, pour le traitement proprement dit, le mieux est de faire sans macro :
1- tu importes ton fichier dans excel (colonne A)
2- en B1, tu ecris =A1
3- en B2 tu écris =si(A2<>A1;A2;"")
4- tu recopies cette formule jusqu’en bas de ta zone utile (double clic sur le coin en bas à droite de la cellule B2
5- il te reste à récupérer les données utiles : tu fais une copie de la colonne B
6- dans une nouvelle feuille, tu fais un collage spécial > Valeurs
7- tu tries pour éliminer les lignes vides

Alors là, je dis :jap:
Merci infiniment pour votre aide, ça fonctionne a la perfection avec Excel, je n’y aurais jamais penser :slight_smile:

Une dernière question, pour récupérer la commande sort d’unix sous Windows, comment faire ?
Il faut récupérer Cygwin ?

Regarde ce lien
Rien que dans le premier proposé (UnixDos) tu dois trouver 99% de ce dont tu as besoin en règle générale

Autre question, comment je peux faire pour selectionner tous les mots de la liste qui ont par exemple " 3 caracteres" ?

En excel ?
Tu rajoutes une colonne avec la fonction nbcar(), et tu fais un filtre automatique
(données > filtrer > filtre automatique)
Edité le 19/04/2008 à 15:01

Desole, je suis nul en excel, mais pour toutes les colonnes, j’ecris nbcar de quoi ? (car je vais pas faire nbcar(A1), nbcar(A2)…) .
Merci

EDIT, j’ai trouve, c’est nbcar(A:A) :slight_smile:
Edité le 19/04/2008 à 19:14