Anleitung: Druckvorschau-Seiten aus Google-Index entfernen

In Typo3 gibt es eine nützliche Funktion, um Inhalte in einer vereinfachten Darstellungsweise als Druckvorschau anzeigen zu lassen. Somit verfügt der Leser über die Möglichkeit, Inhalte auf dem heimischen Drucker auszudrucken, ohne dass Inhalte verschoben, falsch dargestellt oder kryptisch angezeigt werden. In Typo3 lässt sich die Druckvorschau wiefolgt einrichten:

&nb

  druck = PAGE
   druck {
   typeNum = 98
   config.index_enable = 0
  
   10 = CONTENT
   10.table = tt_content
   10.select.OrderBy = sorting
   10.select.colPos = 0
  
      }

Somit lässt sich auf jeder Typo3-Seite ein Link setzen, der auf die Druckvorschau der jeweiligen Seite zeigt. Ein solcher Link sieht wiefolgt aus:https://www.pc-erfahrung.de/index.php?id=1&type=98

An die jeweilige ID wird einfach ein &type=98 angehängt. Das Problem aber ist, dass auch Suchmaschinen wie Google diese Seiten gerne in den Index aufnehmen, da der HTML-Code bei der Druckvorschau sehr einfach gehalten ist und dem XHTML-Standard entspricht, was für Google natürlich ein "Leckerhappen" ist. Daraus folgt, dass in den Trefferergebnissen von Google die Druckvorschau ganz weit oben platziert wird. Es macht aber wenig Sinn, dem Leser die Druckvorschau anzubieten, wenn er nach Inhalten im WWW sucht.

Um zu verhindern, muss man eine Datei namens robots.txt auf dem Root-Verzeichnis (also dem Verzeichnis, wo sich die Webseite auf dem Server befindet) ablegen, in der man Google und Konsorten sagt, welche Seiten indiziert werden dürfen und welche nicht. Wenn man keine "Speaking URL" wie RealUrl einsetzt, kann man das Indizieren der Druckvorschau wiefolgt verhindern:

Ohne Speaking-URL

User-agent: *

Disallow: *&type=98

Dieser Eintrag bedeutet, dass alle Links, die auf &type=98 enden, nicht in den Index aufgenommen werden sollen. Wenn man eine Extension wie RealURL einsetzt, kann man auch verhindern, dass generell alle Links mit index.php ignoriert werden sollen:

Mit Speaking-URL

User-agent: *
Disallow: /index.php?

Dieser Eintrag bedeutet, dass alle Hyperlinks, die mit /index.php? beginnen, nicht indiziert werden. Dieses ist auch gewünscht, da nur die suchmaschinenfreundlichen sprechenden Links aufgenommen werden sollen.

Diese Beispiele müssen bei dem einen oder anderen noch angepasst werden. Google bietet mittlerweile einen Dienst an, wo man überprüfen kann, wann und wie Google die Webseite indiziert hat. Dieser Dienst eignet sich hervorragend zur Fehlerdiagnose und Verbesserung des Page-Ranks.

Hier kann man sich anmelden:

http://www.google.de/intl/de/about.html