PDF-Indexing

Diese Erweiterung ermöglicht es, den textuellen Inhalt von PDF-Dokumenten in ein Nodeset zu konvertieren. Dadurch ist der Inhalt eines PDF-Dokuments beispielsweise für die Ausgabe auf deer Website verwendbar. Der wohlhäufigste Anwendungsfall ist die Indizierung der PDF-Inhalte für die normale Volltextsuche einer Website.

Damit die Methoden zur Textextraktion aus .pdf-Dateien zur Verfügung stehen, muss das Modul wie folgt in der web.config der Render Engine konfiguriert werden:

<module type="Onion.RenderEngine.CommonModules.PDFIndexing.Module, Onion.RenderEngine.CommonModules.PDFIndexing" />
Namensraum: http://www.getit.de/2008/indexing/pdf
NameArgumenteRückgabetypBeschreibung
parsePdf xlink:xlink
[fromDataSource:boolean]
nodeset Gibt den textuellen Inhalt einer PDF-Datei als NodeSet zurück.