| Josh |
Geschrieben am: Mi 5.01.2005, 13:32
|
![]() AyomRank 9 Gruppe: Moderatoren Beiträge: 2142 Mitglied seit: 19.10.2003 |
Hi alle
Ich wollte gerne mal wissen, wie Spider mit weitergeleiteten Headers umgehen. Beispiel: Ich habe einen Link, der auf die Seite aaa.php führt. Auf aaa.php wird nun gleich zu Beginn die Seite per Header weitergeleitet auf bbb.php, z.B. mit PHP's header("location: bbb.php"); Der Surfer kriegt von all dem eigentlich nichts mit, ausser dass in der Browseradresszeile statt aaa.php nun bbb.php steht. Doch wie gehen Spider damit um? Ignorieren sie einfach aaa.php, als würde es das gar nicht geben, und fahren mit bbb.php fort? Also wenn ich in einer Suchmaschine aaa.php suchen würde, würde das nicht aufgeführt? Oder merkt sich der Spider, dass aaa.php nach bbb.php führt, und gibt bei der Suche nach aaa.php automatisch den Link nach bbb.php aus? Irgendwie verwirrt mich diese Geschichte etwas! Danke für Info. Grüsse Josh -------------------- Mein letztes Projekt: Atelier-Schmuck.ch
"Das habe ich nie getan und werden es auch nie wieder tun!" :lol: |
![]() |
| SloMo |
#2 Geschrieben am: Mi 5.01.2005, 14:47 (+01:15)
|
||
|
AyomRank 5 ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Gruppe: Member (aktiv) Beiträge: 249 Mitglied seit: 15.11.2004 |
Hi Josh, zuerst einmal fehlt da der Status. Dem Besucher sollte die Zusatzinfo gegeben werden, ob es sich um eine zeitweilige oder dauerhafte Umleitung handelt. Nur der Ordnung halber, denn ich glaube nicht, dass es überhaupt einen Effekt hat. Da Header-Informationen vom Server kommen, ist nicht zu erwarten, dass im Zuge einer Umleitung noch ein sinnvolles Dokument übertragen wird. Eine ordentliche Suchmaschine wird also jedenfalls bei einem Location-Header sofort die Verbindung kappen (schon um meine Bandbreite und Rechenleistung nicht unnötig zu belasten), und die Zielseite entweder direkt abfragen, oder sie auf den Stapel der zu crawlenden Seiten legen. Von Slurp weiß ich übrigens, dass er die Zielseite _direkt_ abfragt. Zuerst holt er sich aaa.php, direkt danach holt er sich bbb.php von der selben IP aus. Er ersetzt in seinem Index innerhalb einiger Wochen aaa.php durch bbb.php. Gruß, SloMo -------------------- Tools für Webdesigner --- PR6!
|
||
![]() |
| oli181 |
#3 Geschrieben am: Mi 5.01.2005, 16:04 (+01:16)
|
||
|
AyomRank 5 ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Gruppe: Member (aktiv) Beiträge: 264 Mitglied seit: 3.09.2004 |
Slurp fragt bei mir aber immernoch Seiten ab, die schon Seite einiger Zeit mit 301 Redirect an einen neuen Ort permanent weitergeleitet werden (.htaccess). Warum fragt er die alte Seite immernoch ab? Sogar Seiten bei denen ich den 410 Gone sende, möchte Inktomi immernoch spidern... |
||
![]() |
| Alain_Aubert |
#4 Geschrieben am: Mi 5.01.2005, 17:47 (+01:43)
|
||
|
Ayom Slave Gruppe: Admin Beiträge: 4826 Mitglied seit: 25.09.2003 |
Mache als Webmaster niemals den Fehler dem Spider die Möglichkeit zu geben, selber zu denken. Wenn er anfängt zu denken, kann er sich irren. Wenn Du eine Umleitung möchtest, sag ihm, dass es eine permanente 301 Umleitung ist. Bei dem was Du machst, resultiert eine 302. Ich habe die Erfahrung gemacht, dass es einen Effekt hat. Google hat hier so lange die aaa.php indiziert, bis ich ihm ganz klar gemacht habe, dass wir einen 301 möchten. PS Also so: header("HTTP/1.0 301 Moved Permanently"); header("Location: bbb.php"); |
||
![]() |
| bull |
#5 Geschrieben am: Mi 5.01.2005, 18:00 (+00:12)
|
||||
|
AyomRank 5 ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Gruppe: Member (aktiv) Beiträge: 259 Mitglied seit: 18.08.2004 |
Warum nicht in die .htaccess
und sich nicht mehr sorgen?
ist, was die Implementierung von Standards wie RFC2616 angeht, nur als Schrott zu bezeichnen. Im übrigen ist die 410-Implementierung auch bei Googlebot noch nicht sonderlich weit gediehen |
||||
![]() |
| SloMo |
#6 Geschrieben am: Mi 5.01.2005, 18:54 (+00:54)
|
||
|
AyomRank 5 ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Gruppe: Member (aktiv) Beiträge: 249 Mitglied seit: 15.11.2004 |
Angenommen, eine gehackte Site könnte mit diesen Mitteln innerhalb weniger Crawl-Zyklen aus allen relevanten Suchmaschinen gestrichen oder auf eine konkurrierende Site umgeleitet werden... die Folgen kann sich jeder selbst ausmalen. Diese Methode wäre noch beliebter als Denial-Of-Service Attacken. Deshalb werden selbst 301,302 und 410 nicht beim ersten Auftreten akzeptiert, sondern noch lange Zeit gegengecheckt. Gruß, SloMo -------------------- Tools für Webdesigner --- PR6!
|
||
![]() |
| spacefun |
|
![]() AyomRank 5 ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Gruppe: Member (aktiv) Beiträge: 260 Mitglied seit: 24.01.2004 |
Hallo Josh
Die aaa.php wird ignoriert. Hier bei einer kleinen Website die ich bei einem Re-Design so gelöst habe. Ich wollte die Originaldateien die nicht von mir waren noch belassen. Website :http://www.hoteljaco.com und wird per Php auf /en/ weitergeleitet. Vor ca 6Wochen gemacht und alles wunderbar. Gruss Space |
![]() |
| oli181 |
#8 Geschrieben am: Fr 21.01.2005, 13:09 (+15d 12:21)
|
||
|
AyomRank 5 ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Gruppe: Member (aktiv) Beiträge: 264 Mitglied seit: 3.09.2004 |
Was aber nur inktomi macht. Alle anderen begnügen sich mit einer Umleitung, bzw. der 404er Fehlermeldung und spidern dann die neue Site. Nur inktomi möchte noch Sachen spidern die seit sehr langem nicht mehr existieren. Vernünftig wäre das ja. Aber wenn eine Seite seit über zwei Monaten nicht mehr da ist, dann sollte sie aus dem Index kommen. Denn wenn eine Seite gehackt wurde, so sollte ja nach einer Woche wieder der richtige Content drauf sein und wenn nicht, dann nütz das gegenchecken auch nix. Aber nach einem Jahr noch Seiten crawlen, die es nicht mehr gibt? Komische Sachen, die es gibt. Wahrscheinlich haben die zuviel Resourcen. |
||
![]() |
Thema wird von 0 Benutzer(n) gelesen (0 Gäste und 0 anonyme Benutzer)
0 Mitglieder:
Trackback-Url: http://www.ayom.com/track/t/5382
![]() |
![]() ![]() ![]() |
| Themen Titel | Autor | Views | Antworten | Letzte Aktion |
| Neuer Header | Japs | 275 | 8 | Fr 31.10.2008, 08:48 |
| Ansturm der Bots und Spider | littlefish | 173 | 0 | Sa 11.10.2008, 22:11 |
| Blog Header | Antoine Johannes | 338 | 13 | Di 23.09.2008, 10:58 |
| Wordpress Kommentar Links gehen nicht | Huggy | 590 | 3 | Di 5.08.2008, 19:40 |
| Dein Logo, Banner, Header in 1h fertig! Für 20€! | TGDESIGN | 1058 | 34 | Sa 28.06.2008, 10:35 |
| Header wird in Firefox nicht richtigt dargestellt | webdoktor | 219 | 5 | Do 22.05.2008, 10:58 |
| Besucherwerte gehen plötzlich in den Keller | attila.rufius | 320 | 4 | So 20.04.2008, 07:29 |
| Bildschirmauflösungen aus dem Weg gehen! | woody | 365 | 15 | Do 28.02.2008, 00:21 |
| Suche Joomla Template bzw. Header im Bereich Poker | Norbert Hofmann | 529 | 2 | Mo 25.02.2008, 13:09 |
| Aufräumaktion: ab 50 - 200 Euro gehen in Auktion.. | omc | 345 | 0 | Mo 18.02.2008, 21:59 |
Anzeige - [Hier werben / Mediadaten]















