Pfade und Seiten aus dem SharePoint 2010 Suchindex ausschliessen

Um URLs, Pfade oder Seiten vom Crawling resp. dem Suchindex auszuschliessen, werden Crawl Rules genutzt. Mit Hilfe dieser können einerseits Seiten innerhalb von SharePoint ausgeschlossen werden. Andererseits kann auch verhindert werden, dass verlinkte externe URLs oder Dokumente in den Suchindex aufgenommen werden.

  • Öffnen Sie in der Central Administration unter Application Management die Seite Manage service applications.
  • Klicken Sie auf den Namen Ihrer bereits erstellten Search Service Application, um diese zu öffnen.
  • Sie befinden Sie jetzt auf der Seite Search Administration.
  • In der linken Spalte klicken Sie unter Crawling auf Crawl Rules.
  • Erstellen Sie mittels New Crawl Rule eine neue Regel.

Crawl Pfade einschliessen oder ausschliessen
Im Feld Path tragen Sie nun den Pfad für auszuschliessenden resp. einzuschliessenden Bereich ein.
https://www.techtask.com/* schliesst den gesamten Inhalt dieser Domain respektive Subdomain aus/ein.
https://www.techtask.com/sharepoint/* schliesst alles im und unter dem Verzeichnis SharePoint aus/ein.
Die Kombinationen kennen mit der Verwendung des Wildcard-Zeichens (*) fast keine Grenzen.

Crawl Rules konfigurieren
Wird Exclude all items in this path markiert, werden die angegebenen Pfade vom Suchindex ausgeschlossen.
Wird Include all items in this path markiert, werden die angegebenen Pfade explizit in den Suchindex eingeschlossen.

Zugriff festlegen
Im Bereich Specify Authentication wird definiert, wie dem Crawler Zugriff auf die angegebenen Ressourcen gewährt werden soll.

Manage crawl rules (SharePoint Server 2010)
http://technet.microsoft.com/en-us/library/ee792871.aspx

Plan for crawling and federation (SharePoint Server 2010)
http://technet.microsoft.com/en-us/library/cc262926.aspx