Création moteur de recherche spécial

Bonjour a tous!

Je voudrais créer un moteur de recherche dans le but de retrouver des documents et contenus de documents (word, excel, visio) très rapidement. Logique me direz-vous un moteur de recherche sert à cela.:slight_smile:
Je voudrais que lorsqu’un utilisateur a besoin d’une information, il tape le mot dans ce moteur qui va chercher dans les dossiers du serveur les fichiers dont le contenu comporte le mot en question ou alors le nom du document en question.
Je ne sais pas vraiment avec quoi faire cela, une page html? Une appli web? Il y a bien sur la recherhce Windows mais je voudrais quelque chose de plus fin. je ne sais pas si vous voyez ce que je veux dire.
Qu’en pensez-vous?
Merci d’avance.

Salut,

Je ne connais pas beaucoup de languages, mais tu dois pouvoir faire ça avec un peu nimporte lequel. Le but serait plutôt de trouver quel language sera le plus rapide.

ex : ta page html appelle une page php qui va scanner les répertoires et parser tous les fichiers qu’il faut. Par contre ça risque d’être un peu long… (mais c’est du php donc gratos, faut voir ton contexte)

sinon, je ne sais pas si ce serait plus rapide (et je ne sais pas si ça te conviendrait), mais tu pourrais stocker tes fichiers dans une base de donnée. Les recherches se feraient grâce à un index fulltext et ce serait probablement plus rapide. Mais je dis ça au pif, j’ai rarement utilisé les index fulltext.
Il faudrait aussi connaitre la quantité de fichiers, leur taille, leur type… avant de trouver LA solution qui te conviens.

Bonjour kiki et merci pour ta réponse complète.

Il y a entre 30 et 40 documents (Word, Excel, Visio) allant de 16Ko à 38Mo, ce sont des procédures et tableaux de référencements qui sont triés et qui ont besoin d’être retrouvés vite par ceux qui les utilisent.
Est-ce qu’une base de donnée est justifié pour 40 fichiers? Je ne me rend pas compte.

Merci pour les idées.:slight_smile:

Bonjour,

L’indexation fulltext est difficilement envisageable, car pour enregistrer des documents autres que du texte simple il faut passer par un champ de type BLOB, qui n’est pas indexable avec fulltext.

Si c’est pour une application de gestion de contenu simple avec peu de documents, je te conseille de stocker tes fichiers dans un répertoire quelque part, et d’enregistrer dans une table de ta base de données une ligne pour chaque fichier. Chaque ligne pourrait contenir par exemple :

  • le chemin vers le fichier
  • son nom
  • une description rapide
    Ensuite tu associes chaque fichier avec des mots clefs qui sont renseignés par l’utilisateur lui-même, ces mots clefs sont enregistrés dans une table séparée, et la relation entre les mots clefs et tes fichiers est faite dans une table de jointure.

les champs des tables contenant les références vers le fichier et les mots clefs peuvent absolument être indexées avec fulltext pour des raisons de puissance et de rapidité (même si 40 enregistrements c’est vraiment que dalle :))

Ce système a l’avantage d’être techniquement simple, et il te permettra d’obtenir une certaine flexibilité dans ta recherche de documents. Par exemple si le document possède les critères de recherche dans son titre ou sa description, il apparaîtra en premier dans la liste de résultats…
Edité le 05/05/2009 à 09:57

OK très bien merci beaucoup,

Je vais donc créer une petite base mysql et faire cela, en effet cela me semble tout a fait accessible techniquement.
Je vais créer une petite page pour y accéder.

Merci

A bientôt