[PHP] Tracker google - ou le googlebot

:hello:

J’ai fait un script tout con pour tracker google.

En fait pour voir à quelle fréquence il passe, et quel chemin il prend sur mon site.

<?php
$ua = $_SERVER['HTTP_USER_AGENT'];
$trouve = strstr($ua, 'google');
if($trouve) {
	$fp = fopen("google.txt","a+");
	$content = date('d/m/Y H:i'). ' - ' . $_SERVER['REQUEST_URI'] . "\r\n";
	fwrite($fp, $content);
}
?>

J’ai donc basé ça sur le User Agent, j’imagine qu’il doit contenir “google” dedans.

Mais pour l’instant google.txt reste définitivement vide…

Le script en lui-même fonctionne, j’ai mis mon user agent à “googlebot” et effectivement le fichier est écrit.

donc, j’ai choisi le bonne méthode ? le googlebot ne renvoie pas de user agent ?

ou alors il est pas encore passé sur mon site, mais mince alors ! :frowning:

je peux intégrer ton code à mon forum pour vérifier si ca fonctionne :slight_smile:

EDIT : sinon WRI est également le site des créateurs de ROBOTstats, et il parait que c’est 'achement bien comme logiciel.

ah ben volontier si tu propose :slight_smile:

Robotstats j’avais voulu essayer une fois, mais il me retournais des erreurs, et j’avais pas envie de chercher.

en plus la dernière version est sortie le 11 octobre 2003.

Moi je veux simplement voir comment google procède, pas réellement faire des stats sur les moteurs qui me visitent.

Edit: ah non ils ont sorti un version 1.3 cette anée, mais elle est pas sur le site officiel, mais sur WRI

Pour google : épluche tes logs apache, tu devrais y trouver du google.

ah ouai bonne idée

je vois du "Yahoo! slurp" et "msnbot", mais google doit pas aimer mon blog ^^

awstats est pas mal comme analyser de logs

Mieux vaut un logiciel, et pas un script ^^ t’as des analyseurs de logs apache encore plus complets :slight_smile:

tu peux me donner un nom de logiciel plus complet qu’awstats ? parce que cela m’interresse :oui:

: o robostats est vraiment codé par un pied.

aucune vérification des données, utilisation forcée de register_globals, etc…

alors Startide, c’est quoi ce logiciel miracle ?

[:shy]

J’ai plus en tête, sorry :smiley:

Le dernier User-Agent du GoogleBot que j’ai vu passé sur mon site c’est :
Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)

:slight_smile:

66.249.64.7 - - [22/Sep/2005:06:29:41 +0200] "GET /egroupware/login.php HTTP/1.0 " 200 4973 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"

:slight_smile:

J’ai le même la plupart du temps, mais quelquefois, j’ai celui là :
Googlebot/2.1 (+http://www.google.com/bot.html)

C’est quoi la différence entre les 2 ? Si quelqu’un sait.

Sinon, tu fais un gethostbyaddr et tu auras le mot "google" dedans hein…

Si c’est un script qui se charge à chaque page, le gethostbyaddr est bien la pire idée qu’on puisse lui conseiller.

Sinon, il peut aussi récupérer les domaines de google. Ils doivent avoir acheter des plages d’ip, donc bon :slight_smile:

pfffffff

Yahoo est passé
MSN Search est passé
Exabot
Pompos

Mais google ne passe pas !

J’ai envoyé mon url avec leur formulaire, je fait des sitemap que je renvoie tout le temps. et pourtant il n’est pas venu une seule fois !

y se passe quoi ? :’/

NeGo ou tu l’a pris la photo de ton avatar ?

c’est une bombe !!!!!

chez tasoeur !

(pour rester charte compliant, et si t’es malin tu va trouver le site ;))