[LANGAGE C] Effacer bruit de fond dans un document

Salut tout le monde,

Voilà, je participe à un projet ou le but final sera d’avoir un O.C.R (Optical Charater Recognition), c’est a dire un logiciel capable de retranscrire dans un format texte un document scanné.

Ma partie pour l’instant se penche principalement sur le gommage des bruits de fond, c’est à dire les espèces d’impuretées noires qu’il pourrait y avoir sur un document écrit noir sur blanc afin d’obtenir un document claire et lisible bien noire sur blanc sans tâche.

Donc si vous avez une petite idée pour me lancer ou des bon sites expliquant ce principe, je suis preneur.

Merci d’avance.

Je ne suis pas axé image (plus signal audio) mais utiliser un filtre FIR (Finite Impulse Response) pourrait être une piste, comme tu peux le voir ici il est utilisé pour réduire les bruits d’une image 2D.

Il existre plusieurs filtres pour atténuer le bruit d’une image (filtre linéaire) (filtre gaussien) etc.
En programmation tu peux essayer d’appliquer ce filtre linéraire (assez simple a programme) tu créés une fenêtre 3*3 de valeur 1

1 1 1
1 1 1
1 1 1

ton image:

20 20 20 20 20 25 25
10 20 30 20 48 59 78
10 20 30 20 48 59 78
10 20 30 20 48 59 78
10 20 30 20 48 59 78
10 20 30 20 48 59 78

tu l’appliques ( en evitant les bords) comme ça:

calcul du point 2,2 : (201 + 201 + 20*1 + 10 1 +20 20 +30 1 + 101 +201+ 301) / 9

c’est un filtre linéaire simple, il en existe des plus complexes avec des valeur de pondération différente de 1, tu peux aussi jour sur la taille de la fenêtre 55 77 par exemple

++

C’est pile poil le même exemple qu’il y a sur le lien que j’ai donné, s’marrant :slight_smile:

Je l’ai programmé y 3 ans pour le projet dans mon école d’inG en C++ :wink:

Effectivement après lecture c’est bien la même chose :wink: (avec tous les détails techniques)