Cette page est actuellement non finalisée. Vous ne trouverez donc pas tout son contenu.
Nous sommes désolé pour la gène occasionnée.
Raison(s) :

  1. Page à écrire et/ou réviser
  2. Réviser les données techniques
  3. Réviser les versions
  4. Mise à jour des captures d'écran


Pour nous aider à compléter la documentation, consulter cette page (Section “wiki”).

FIXME S'aider de : http://fr.piwigo.org/forum/viewtopic.php?pid=160426#p160426

Faire une recherche sur une galerie Piwigo

Il y a deux manière distinctes pour faire une recherche sur une galerie Piwigo.

  1. Utiliser le champs “Recherche rapide” dans le menu “Menu”.
  2. Utiliser le formulaire de recherche via le lien “Recherche” dans le menu “Menu”

Voyons comment ces deux façons de faire une recherche fonctionne concrètement.

La recherche rapide

Fig.1 Le champs de recherche rapide
Fig.1 Le champs de recherche rapide

La recherche rapide diffère de la recherche classique. Elle ne répond pas exactement aux même demandes. Par contre, cette recherche restitue des résultats triés selon leur pertinence.

Entrent en ligne de compte:

  • le nom propre aux images,
  • la description des images,
  • les commentaires réalisés à propos des images,
  • le nom du répertoire,
  • le nom de la catégorie,
  • la description de la catégorie,
  • le nom des fichiers,
  • les tags associés aux images, et
  • les url (adresses) des images,

sur un lot d'images lui-même fonction des droits d'accès de l'utilisateur.

Les explications ci-dessous restent malgré tout “simplifiées”.

L'identification des mots et de leur pertinence

L'ensemble des informations ci-dessus (exceptées les 3 dernières) sera filtré simplement pour séparer le texte en mots. Un “mot” est n'importe quelle chaîne de caractères constituée de lettres, chiffres, d'apostrophes simple et d'espaces soulignés. Tout autre caractère sera à l'origine de l'identification d'un autre “mot”. Tout “mot” présent dans la liste des mots mais trop court (3 caractères ou moins) sera ignoré.

La taille minimale pour un mot dans les recherches sur ces éléments est donc de 4 lettres.

Les 'un', 'le', 'la', 'les' en français seront éliminés, pouvant être considérés comme trop communs pour avoir une valeur intrinsèque. Malheureusement une liste de mots anglais à ignorer, trop commun, sera également prise en compte dans l'exclusion. Quelques exemples de termes français qui seront mal évalués : cause, certain, course, différent, former, plus, possible, sensible, zéro

La taille minimale des mots et la liste de mots à ignorer sont des éléments du réglage de MySQL. Comme beaucoup de sites partagent un serveur MySQL, il ne leur est pas possible d'obtenir un réglage différent (à éviter de toute façon). Pour ceux qui disposent de leur propre serveur veuillez vous référer à la documentation officielle de MySQL (Full-Text Stopwords et paragraphes suivants).

Tous les mots corrects de la liste et de la requête sont pondérés en fonction de leur importance dans la liste ou la requête. De cette façon, un mot présent dans de nombreuses lignes aura un poids faible (et peut être même un poids nul), car il a peu d'importance dans cette requête particulière. Au contraire, si le mot est rare, il recevra un poids fort. Le poids des mots est alors calculé pour mesurer la pertinence de la ligne.

Une telle technique fonctionne plus efficacement sur de grands volumes de données (en fait, elle est optimisée pour cela). Avec peu d'éléments, la distribution des mots ne reflète pas correctement leur valeur sémantique et ce modèle peut parfois produire des résultats étranges.

Un mot utilisé dans plus de la moitié des éléments se retrouvera ignoré.

Ce mot ignoré ne sera de toute façon pas efficace pour trouver les documents appropriés. En fait, l'utilisateur trouvera sûrement beaucoup de documents inappropriés à sa recherche. Afin d'éviter ce piège, les éléments se voient donc attribué une valeur sémantique très basse.

En clair, si la recherche porte sur le terme “fil”:
- une description contenant “le fil d'Ariane” ne sera pas retenue (3 caractères).
- une description contenant “La jeune fille à la perle” sera sélectionnée sans qu'on puisse réellement donner la pondération correspondante de façon précise.

Une recherche de “course” ne sélectionnera aucune image par cette première approche.

Les noms des fichiers sont traités séparément par simple similitude

Les noms des fichiers ont une structure différente (sans espace, sans accent, …). Ils sont traités différemment pour cette raison. Chaque mot recherché sera simplement encadré du caractère % et à l'issue de cette sélection la pertinence (poids des images) sera augmentée en cas de similitude.

La recherche de “égal” sélectionnera le fichier p-legall.jpg.

En clair, si la recherche porte sur le terme “fil”:
- un fichier defile_du_14_juillet.jpg sera sélectionné et son poids augmenté de 2 points.

Une recherche de “course” sélectionnera tout élément dont le nom physique contient “course”.

Les Tags sont traités séparément essentiellement pour des raisons de performance

Les tags ayant un sens propre et indépendant, ils sont également traités séparément.
FIXME: Traiter le cas des url_name

Les images sélectionnées par les tags voient leur pondération être augmentée du nombre de tags qui les référence. La recherche des tags sera encore réalisée par similitude (caractère %).

En clair, si la recherche porte sur “fil” et “clair”:
Une image sélectionnée par uniquement le tag “clair-obscur” aura une pondération augmentée de 1 point alors qu'une image taguée par “fille” et “Claire” verra sa pondération augmentée de 2 points.

Une recherche de “course” sélectionnera les tags contenant “course” et les images correspondantes.

Pour aller plus loin...

Page(s) associée(s) :




 
Haut de page
utiliser/utilisation/fonctionnalites/recherche_rapide.txt · Dernière modification: 2013/07/04 11:30 (modification externe)
 
 
github twitter facebook google+ newsletter Faire un don Piwigo.org © 2002-2017 · Contact