Eric a écrit:
Je n'aurais pas dû en faire état dans le bugtracker mais ne tenir compte que du filtrage des logs dans l'historique en fonction du REFERER et de l'ID du navigateur (comme l'a suggéré flipflip).
On s'en tiendra là sans doute.
8-)
VDigital a écrit:
Merci Eric. 8-)
[HS]William Shakespeare avec un "e" pour ne pas froisser nos English members[/HS]
J'ai ajouté que picture.php présente aussi des url sur les tags et de ce fait la page est aussi impactée, ce qui est plus gênant de mon point de vue.
8-/
[HS]Satané moi ! Evidemment avec un "e" ! J'ai corrigé, merci.[/HS]
Effectivement, picture.php peut aussi poser problème dans ce contexte. En fait, plus j'y réfléchis plus je pense que le meta tag avec noindex ne résoudra que très partiellement le problème.
Je n'aurais pas dû en faire état dans le bugtracker mais ne tenir compte que du filtrage des logs dans l'historique en fonction du REFERER et de l'ID du navigateur (comme l'a suggéré flipflip).
Eric a écrit:
[Edit]
Référence Bugtracker : 606
Je l'ai fait en anglais en espérant avoir été assez clair. Mon anglais, bien que techniquement pas trop mauvais, est loin de Shakespear :-/
[/Edit]
Merci Eric. 8-)
[HS]William Shakespeare avec un "e" pour ne pas froisser nos English members[/HS]
J'ai ajouté que picture.php présente aussi des url sur les tags et de ce fait la page est aussi impactée, ce qui est plus gênant de mon point de vue.
8-/
VDigital a écrit:
Il faut donc lui forcer noindex sur cette page en plus de celles identifées. Plus simple à dire qu'à faire.
Faire un header.tpl propre à l'affichage des pages tags et recherche ? Car le header.tpl est commun à toutes les pages générées... Enfin, je crois.
VDigital a écrit:
Eric a écrit:
Une demande d'évolution dans le bugtracker sur le sujet serait-elle judicieuse ?
Oui, si on a une bonne idée d'ici la sortie de la 1.7 cela serait stupide de ne pas l'intégrer.
J'y vais de ce pas...
[Edit]
Référence Bugtracker : 606
Je l'ai fait en anglais en espérant avoir été assez clair. Mon anglais, bien que techniquement pas trop mauvais, est loin de Shakespeare :-/
[/Edit]
C'est l'idée de flipflip dès le post #2.
Basée sur le contrôle du référent ou de l'identifiant du navigateur pour ne pas historiser.
Dès que possible, il faut chercher de ce coté (cela n'évite pas le scan mais l'explosion de l'historique).
D'ailleurs, cela n'est pas trop grave d'être scanné si on n'a pas de réelle limite de volume downloadé chez un hébergeur (ça existe et dans ce cas c'est foutu).
Bonjour,
j'interviens après ce dernier post pour dire que je rencontre le même petit "problème".
Je n'en aurais pas parlé, mais comme le sujet est lancé...
En fait,il n'y a rien de bien méchant, pas de réelle gène due à la visite poussée de ces robots.. mais c'est vrai qu'ils polluent les stats de l'historique... alors... a défaut d'avoir envie de gonfler les stats pour flatter son égo, il peut-être intéressant de savoir comment limiter l'étendue de l'incursion des robots..
amicalement,
éric.
Eric a écrit:
Une demande d'évolution dans le bugtracker sur le sujet serait-elle judicieuse ?
Oui, si on a une bonne idée d'ici la sortie de la 1.7 cela serait stupide de ne pas l'intégrer.
8-)
Eric a écrit:
[Edit] Vérifications faite sur le header des pages de recherche et des tags après modif de header.tpl => la balise <meta name="robots" content="index,nofollow"> est bien présente dans le source. Donc, si "YahooBot" (car il s'agit essentiellement de lui) est un bon / gentil bot, il n'est pas sensé suivre les liens de ces pages... [/Edit]
On est d'accord. Il devrait se contenter d'indexer les liens présents sur la page.
Il faut donc lui forcer noindex sur cette page en plus de celles identifées.
Plus simple à dire qu'à faire.
8-)
Remarque sur l'indexation des tags : Il n'y a pas seulement le menu des tags qui est en cause mais aussi celui de la recherche. Car les bots qui me harcellent font des combinaisons tag1 + tag2 etc...
Ceci n'est, normalement, pas possible via la page des tags mais par la page de recherche. Cà complique encore la chose de mon point de vue de néophyte.
Une demande d'évolution dans le bugtracker sur le sujet serait-elle judicieuse ?
[Edit] Vérifications faite sur le header des pages de recherche et des tags après modif de header.tpl => la balise <meta name="robots" content="index,nofollow"> est bien présente dans le source. Donc, si "YahooBot" (car il s'agit essentiellement de lui) est un bon / gentil bot, il n'est pas sensé suivre les liens de ces pages... [/Edit]
oui Mr. merci de l'explication.
comme ça je ne melange plus.
XEUL a écrit:
donc ci j'ai bien compris l'astuce donnée dans l'autre topic par vincent empeche le referencement??????
[HS]Les spams que tu subissais, avaient pour objectif de faire référencer des liens depuis ton site par les robots. Ceci afin d'améliorer le ranking de leurs sites, et du même coup faire baisser le rank de ton site. En éliminant ces spams, tu ne les interresses plus les spammeurs.
Les bots: Il y a robots et robots. Eric n'est pas spammé mais soumis à des visites trop nombreuses de bons ou moins bons robots. Visites qui sont historisées et de plus qui se prennent les pieds dans le tapis avec les tags.
L'astuce que j'ai donné n'empêche pas le référencement de ton site, elle améliore son efficacité et son résultat. Par contre, elle ne correspond en rien au problème d'Eric.
Est-ce plus clair?
8-)
[/HS]
donc ci j'ai bien compris l'astuce donnée dans l'autre topic par vincent empeche le referencement??????
Comme ça...
Il faudrait faire du nofollow dans le parsing de header.tpl
quand on est sur la page tags.php
Cela ne suffit pas malheureusement, c'est le menu des Tags de la page index.php qui pose pb.
Dès qu'on est sur une image, en suivant le lien d'un tag, on obtient ce menu.
Or nous avons besoin des scans de la page d'index pour les autres liens.
A ce jour, je ne sais pas éliminer ces scans.
Les bots devraient avoir le même comportement face aux tags dans un blog, non?
Il faudrait creuser pour savoir si ce pb existe ou comment il est évité.
Par contre, l'idée de flipflip du contrôle du référent ou de l'identifiant du navigateur pour ne pas historiser me semble être une excellente idée à creuser (cela n"évite pas le scan mais évite une explosion de l'historique).
8-)
VDigital a écrit:
XEUL a écrit:
yo!
applique ce que met Vdigital dans ce topic et ça va s'arrêter sous un mois a peu pres!!!
http://forum.phpwebgallery.net/viewtopic.php?id=9547Je ne pense pas qu'il s'agisse du même pb.
8-)
Oui, il semble que notre ami XEUL ait déjà commencé à fêter Noel et le nouvel an ;-))
flipflip a écrit:
Salut, pour le robot.txt c'est pour empêcher de parcourire les répertoires si par exemple tu n'a pas mis de fichier index.html ou index.php à la racine de ton site.
Si je fais çà, cela empêchera les robots d'indexer ma galerie en tant que telle et ce n'est pas ce que je souhaite. Et je ne souhaite pas non plus que les robots indexent toutes mes images et tous les liens possibles pour y accéder (cas des tags). Bref c'est un casse tête.
C'est pourquoi je me suis dit qu'en empêchant l'indexation du répertoire galerie... Mais, non. Je me suis fourvoyé. Je voulais essayer d'empêcher l'indexation du fichier tags.php mais c'est idiot puisqu'il n'affiche pas réellement la page concernée.... Je sèche...
XEUL a écrit:
yo!
applique ce que met Vdigital dans ce topic et ça va s'arreter sous un mois a peu pres!!!
http://forum.phpwebgallery.net/viewtopic.php?id=9547
Je ne pense pas qu'il s'agisse du même pb.
8-)