Kürzlich habe ich mich mit dem Thema Windows Suche etwas intensiver auseinandergesetzt. Im speziellen ging es darum über die Windows Suche eines Client Computers Inhalte von Dateien einer Dateifreigabe durchsuchen zu können.
Ich habe die Anforderung auf einem Windows Server 2012 R2 Dateiserver und einem Windows 8.1 Client umgesetzt. Bei der Umsetzung bin ich jedoch auf ein unvorhersehbares Problem gestoßen.
Nach dem ich Stichprobenartig nach Dateiinhalten suchte musste ich Feststellen das die Suche nicht durchgängig für alle Dateien funktionierte. Zunächst vermutete ich das es mit dem Dateityp zusammenhängt. Vorzugweise sollten PDF Dokumente indiziert werden. Nachdem ich mich vergewissert hatte das der Dateityp für die Inhaltsindizierung ausgewählt wurde ging ich gezielter vor und merkte das neben PDF Dokumenten auch Office 2013 Dateien wie DOCX, XLSX usw. betroffen waren.
Mit dieser Erkenntnis versuchte ich nun direkt im Explorer die Datei aufzufinden. Dabei verzichtete ich bewusst auf den Inhalt der Datei und fokusierte mich auf den Dateinamen. Die Datei die ich eben im Explorer noch sehen konnte war über die Suche nicht mehr aufzufinden. Den Begriff aus der Suche entfernt tauchten die Dateien wieder im Detailbereich des Explorers auf.
Schließlich schaute ich mir die Dateieigenschaften an und stellte fest das die Datei 0 kb auf der Festplatte belegt.
Wer sich bereits mit der Windows Server 2012 R2 Deduplizierung auseinandergesetzt hat der kann erahnen das es sich bei einer solchen Datei um einen Link (Stub) einer deduplizierten Datei handelt.
Mit dieser Erkenntnis versuchte ich weitere Informationen über das Problem zu sammeln. Das Ergebnis war ernüchternd. Es handelt sich dabei um eine „inkompatibilität“ zwischen der Windows Suche und der Deduplikation.
Windows Server 2012 R2 Indexing vs. DeDup
Um zu verifizieren das dies tatsächlich so ist holte ich einige Datei aus dem Deduplikationsspeicher zurück. Anschließend indizierte ich das Laufwerk neu.
Nach der Reindizierung konnte die Datei am Dateinamen und auch am Inhalt identifiziert werden.
Leider ist als Lösung scheinbar nur das abschalten der Deduplikation möglich. Alternativ können natürlich auch Dateiendungen oder Ordner von der Deduplikation ausgenommen werden.