PDF Indizierung Exchange 2010

Bei der Installation von Exchange 2010 wird standardmäßig das Filterpack von Microsoft installiert. Dieses ermöglich die Volltext-Indizierung von nachfolgenden Dokumenten:

  • Filter für ältere Office-Versionen (97-2003; .doc, .ppt, .xls)
  • Filter für Metro-Office (2007; .docx, .pptx, .xlsx)
  • Zip-Filter
  • OneNote-Filter
  • Visio-Filter
  • Publisher-Filter
  • Filter für Open Document-Format

Wie zu sehen ist, wird das PDF-Format in dieser Sammlung nicht aufgelistet. Da PDF ja einen quasistandard darstellt, sollte die Funktion zur Volltext-Indizierung dieses Formats nachträglich installiert werden. Dies ist durch den Adobe PDF iFilter möglich.

Dieser kann  unter http://www.adobe.com/support/downloads/detail.jsp?ftpID=4025 bezogen werden.

Leider ist es mit der reinen Installation nicht getan. Es müssen einige Konfigurationsschritte manuell auf den entsprechenden Exchange Servern erfolgen.

  1. Installieren des iFilters
  2. Aufnehmen des Installationspfads in die Pfadvariable
  3. Konfiguration PDF iFilter
  4. Konfigurieren der Registry, zunächst importieren der folgenden Einstellungen:
[HKEY_LOCAL_MACHINESOFTWAREMicrosoftExchangeServerv14MSSearchCLSID{E8978DA6-047F-4E3D-9C78-CDBE46041603}]
@="PDFFilter.dll"
"ThreadingModel"="Both"
"Flags"=dword:00000001
[HKEY_LOCAL_MACHINESOFTWAREMicrosoftExchangeServerv14MSSearchFilters.pdf]
@="{E8978DA6-047F-4E3D-9C78-CDBE46041603}"

Sobald diese Schritte durchgeführt wurden, muss der Server neu gestartet werden.
Um nun auch die PDF Dokumente mit in den Index zu bekommen, muss dieser neu erstellt werden.
Dies geht am besten über die Powershell unter Eingabe von “./ResetSearchIndex.ps1 -force -all” im Scripts-Verzeichnis des Exchange 2010 Installationsverzeichnisses.

Leider dauert der Vorgang mehrere Stunden, aber danach sind nun auch die PDF Dokumente durchsuchbar.

Leave a Reply

Your email address will not be published. Required fields are marked *