zurück zum Allgemeines | Seiten

brian

06.06.2007, 18:04
 

Blacklist so O.K.? (Allgemeines)

Hallo,

ich bin eigentlich sehr begeistert von Spider Trap.
Trotz dem hinterlässt es immer ein komisches Gefühl wenn
angeblich der bot von MSN oder Yahoo raus geworfen wird.
Vermutlich sind das alles Fakes. Dennoch würde ich gerne
hier mal meine Blacklist posten. Es könnte ja sein das
ich als newbie etwas falsch mache.

80.253.80.54|29.05.2007|16.01.08|no referer|Microsoft URL Control - 6.00.8862|
88.74.35.174|30.05.2007|20.52.53|no referer|Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 1.1.4322)|
217.234.209.73|30.05.2007|22.30.21|no referer|Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 1.1.4322)|
74.6.86.162|31.05.2007|13.35.14|no referer|Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)|
193.108.10.139|31.05.2007|14.46.37|no referer|Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)|
212.183.99.45|31.05.2007|22.10.14|no referer|Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322)|
84.162.112.246|31.05.2007|23.06.56|no referer|Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; .NET CLR 1.1.4322)|
65.55.235.141|02.06.2007|15.09.44|no referer|msnbot-media/1.0 (+http://search.msn.com/msnbot.htm)|
74.6.72.251|02.06.2007|20.08.10|no referer|Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)|
65.55.208.189|02.06.2007|23.19.31|no referer|msnbot/1.0 (+http://search.msn.com/msnbot.htm)|
72.44.58.113|03.06.2007|19.19.04|no referer|ilial/Nutch-0.9 (Ilial, Inc. is a Los Angeles based Internet startup company. For more information please visit http://www.ilial.com/crawler; http://www.ilial.com/crawler; crawl@ilial.com)|
196.37.192.223|04.06.2007|07.31.11|no referer|ISC Systems iRc Search 2.1|
65.54.188.92|04.06.2007|16.37.42|no referer|msnbot/1.0 (+http://search.msn.com/msnbot.htm)|
74.6.17.218|04.06.2007|18.49.29|no referer|Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)|
74.6.25.73|05.06.2007|10.55.51|no referer|Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)|
72.14.194.32|05.06.2007|22.25.38|no referer|cks|



Hat das wirklich so seine Richtigkeit denn wenn ich
auf die Whois Abfragen klicke wird mir Teilweise wirklich
MS oder yahoo e.t.c. als Besitzer der Ip angezeigt.

Es wäre nett wenn mir einer aus meiner Verwirrung helfen könnte.

Gruß

Micha

JR-EWING

06.06.2007, 19:31

Blacklist so O.K.?

Hm einige davon stammen wirklich von Yahoo.

http://help.yahoo.com/help/us/ysearch/slurp/slurp-02.html
Hier steht auch klar drin dass sich der Slurp an die robots.txt hält.

Ich schau am Freitag mal ob ich das beheben kann durch einen RDNS Check ähnlich wie bei Google....

Gruß Thomas


Suche noch Programmierer für das Spider Trap Team, die mir helfen die Software weiterzuentwickeln.

brian

06.06.2007, 20:45

Blacklist so O.K.?

Hallo Thomas,

uff dann freu ich mich das meine Installaion doch
funktioniert.

Wie läuft das dann müssen wir dann unsere Spider-Trap
Version updaten ?


Sorry das ich so dumm Frage aber ich bin mit der Materie
bots htaccess noch sehr neu.

Vielen Dank

Gruß

Micha

JR-EWING

06.06.2007, 21:37

Blacklist so O.K.?

Hallo,

» uff dann freu ich mich das meine Installaion doch
» funktioniert.

Falls folgendes in der robots.txt in deinem Hauptverzeichnis steht - ja ;-)

User-agent: *
Disallow: /spider-trap

User-agent: googlebot
Disallow: /spider-trap

» Wie läuft das dann müssen wir dann unsere Spider-Trap
» Version updaten ?
»

ja aber ich denke nur ein Source Datei. Wahrscheinlich die functions.php


» Sorry das ich so dumm Frage aber ich bin mit der Materie
» bots htaccess noch sehr neu.

kein Problem - lieber mal nachfragen...


Suche noch Programmierer für das Spider Trap Team, die mir helfen die Software weiterzuentwickeln.

Naphta

18.06.2007, 09:07

Blacklist so O.K.?

Gibts in dem Fall Neuigkeiten?

Bei mir sind zwei Slurps in der Falle gelandet (wogegen ich eigentlich fast gar nichts habe)

IP: 74.6.17.137
User-Agent: Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)

IP: 74.6.19.13
User-Agent: Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)

Vielleicht liegt's daran:
Kann es sein, dass sich Slurp in der robots.txt zwar an die spezifisch an ihn gerichteten Direktiven hält, aber nicht an die mit Wildcard (User-agent: *), sofern die spezifische an erster Stelle kommt?

>>Yahoo! Slurp beachtet den ersten Eintrag in der robots.txt Datei mit einem User-Agent „Slurp". Ist ein solcher nicht vorhanden, beachtet Yahoo! Slurp der ersten Eintrag mit einem User-Agent „*".>> <http://help.yahoo.com/help/de/ysearch/slurp/slurp-02.html>

JR-EWING

18.06.2007, 09:48

Blacklist so O.K.?

Leider hab ich aber von meinem Yahoo Kontakt keine Antwort diesbezüglich bekommen.

Aber das kann gut sein. Ich denke vielleicht sollte man den Slurp ähnlich wie den Googlebot direkt inder robots ansprechen.

Kannst du das mal austesten und mir bitte dein Feedback geben ?

Gruß Thomas


Suche noch Programmierer für das Spider Trap Team, die mir helfen die Software weiterzuentwickeln.

Naphta

18.06.2007, 10:18

Blacklist so O.K.?

» Ich denke vielleicht sollte man den Slurp ähnlich
» wie den Googlebot direkt inder robots ansprechen.
»
» Kannst du das mal austesten und mir bitte dein Feedback geben ?

Mach ich mal. Nach dem Schema:

User-agent: msnbot
Crawl-Delay: 20
Disallow: /mausefalle

User-agent: Slurp
Crawl-Delay: 20
Disallow: /mausefalle

User-agent: googlebot
Disallow: /mausefalle

User-agent: *
Disallow: /mausefalle

Naphta

29.06.2007, 16:09

Blacklist so O.K.?

» » Ich denke vielleicht sollte man den Slurp ähnlich
» » wie den Googlebot direkt inder robots ansprechen.
» »
» » Kannst du das mal austesten und mir bitte dein Feedback geben ?
»
» Mach ich mal. Nach dem Schema:
»
» User-agent: msnbot
» Crawl-Delay: 20
» Disallow: /mausefalle
»
» User-agent: Slurp
» Crawl-Delay: 20
» Disallow: /mausefalle
»
» User-agent: googlebot
» Disallow: /mausefalle
»
» User-agent: *
» Disallow: /mausefalle

So, das scheint erfolgreich zu sein:
1. Slurp kommt noch
2. und tappt nicht in die Falle

JR-EWING

29.06.2007, 19:42

Blacklist so O.K.?

» So, das scheint erfolgreich zu sein:
» 1. Slurp kommt noch
» 2. und tappt nicht in die Falle

Super danke für den Test....
werde ich in die nächste Version packen...


Suche noch Programmierer für das Spider Trap Team, die mir helfen die Software weiterzuentwickeln.


Ähnliche Beiträge
Thema Author Antworten Letzter Beitrag
Fehler: Couldnt get lock for blacklist.txtblack_kite026.05.2008, 21:16
blacklist ist immer noch leerTorstenMo204.12.2006, 09:47
FAQ für Whitelist und Blacklist...hartiberlin030.05.2008, 09:20
htaccess oder Blacklist ?AC-Commo613.07.2008, 12:02
Usability Blacklist und Whitelist können sich widersprechender.brain202.04.2009, 08:44



zurück zum Allgemeines | Seiten