indexed_search

Die indizierte Suche ist im System enthalten und funktioniert gut, abgesehen von der nicht allzu guten Performance.

Installation

Installieren der System-Extension indexed_search.
Installieren der Extension crawler 11.0.7

Installieren des Packets xpdf (für pdftotext und pdfinfo binaries).

Installieren von catdoc, ppthtml, unrtf und xlhtml

Content anlegen mit dem Plugin Indexed Search.

Konfiguration

Konfiguration

Folgendes in das Setup des Templates aufnehmen:


# ------------------------------------
# Indexed Search
# ------------------------------------

page.config.index_enable = 1
page.config.index_externals = 1
   
plugin.tx_indexedsearch {
    #_CSS_DEFAULT_STYLE >
    templateFile =fileadmin/layout/html/indexed_search.tmpl
   
    # Setting default values
    _DEFAULT_PI_VARS {
        extResume = 1
       
        # default-mäßig ein Teilwort suchen (1)
        type = 1
        lang < config.sys_language_uid
     
        # show extended search initially
        ext = 0
     
        # grouping: flat/sections
        group = flat
   
        results = 5
    }
 
    # wrappings
    rules_stdWrap {
    }
 
    sectionlinks_stdWrap {
    }
 
    path_stdWrap {
    }
 
    # config
    search {
    rootPidList = 1
    page_links = 10
    detect_sys_domain_records = 0
    #defaultFreeIndexUidList = 0,1,2
    }
     
    # show
    show {
 
        # rules
        rules = 0
       
        # hash creation
        parsetimes=1
     
        # second level in section dropdown
        L2sections=1
     
        # first level in section dropdown
        L1sections=1
     
        # show "not in menu" or "hide from menu" but not hidden pages in section
        LxALLtypes=0
   
        # empty formfield after search
        clearSearchBox = 0
     
        # add searchterm to history
        clearSearchBox.enableSubSearchCheckBox=1
   
        forbiddenRecords = 0
        alwaysShowPageLinks = 0
        advancedSearchLink = 0
        resultNumber = 1
        mediaList = 1
    }
 
    # show fields for parameters
    blind {
     
        # type (word, subpart of word, ..)
        type=0
   
        # default option (and, or)
        defOp=0
   
        # sections of website
        sections=0
   
        # search in mediatypes
        media=0
       
        # sort
        order=0
   
        # view (section hierarchye / list)
        group=0
   
        # language selection
        lang=0
   
        # select sorting
        desc=0
   
        # results per page
        results=20
   
        # extended preview
        extResume = 0
         
        #freeIndexUid = 0
    }
}

Anlegen eines Ordners und von Content des Typs Record des Typs indexing configuration

Kategorien

Kategorien im Suchformular (Erweiterte Suche) kann man definieren mit folgendem Eintrag:

plugin.tx_indexedsearch.search.defaultFreeIndexUidList= 2,3,4

Dies ist eine Liste von Uid's von Indexing Configuration Records. Die Reihenfolge bestimmt auch die Sortierung der Suchergebnisse.

Suche in Sektionen

Um nur in einer bestimmten Sektion und den Unterseiten zu suchen muss man ein Extension Template anlegen für die Seite mit dem Suchfeldund folgendes ins  TSsetup aufnehmen:

# Search only in Templates section

plugin.tx_indexedsearch._DEFAULT_PI_VARS.sections=rl1_75

Wobei:

rl1 für 1te Ebene über root
rl2 für 2te  Ebene über root
_75 für Seite mit der id=75

Index Administration

Verwenden des Info Moduls: Indexed Search -> Technical Details. Dort kann man sehen was indiziert wurde. Hier ein Bild das zeigt warum die Indexeinträge nicht für alle Seiten gleich sind:

Indizierung Externer Dokumente

Update Versionen TYPO3 > 12. Beim Indizieren externer PDFs via Crawler Extension traten komische Effekte auf: Es wurden statt ca. 100 verlinkter Dokumente nur 7 Indiziert.

Dann ist mir die Einstellung aufgefallen in der Backend Konfiguratin von Extensions:

Max external files to index (basic.maxExternalFiles [int])

Dies steht per Default auf 5. Ich habe es auf 500 gesetzt. Dann waren es 10 Indizierte Dokumente, wenn man im Backend mit dem Modul “Indizierung / Detaillierte Statistik” nachsieht.

Und hier kommt der “Bug”: De facto waren alle 100 indiziert, hier werden aber nur 10 angezeigt. Wenn man “alle” löscht, kommen plötzlich die nächsten 10 zum Vorschein. Also ist es hier wie ien Paging a'10 Einträge, aber keine Navigation um die “nächsten 10 Einträge” anzusehen.

Unlogisch bleibt aber warum es Anfangs 7 waren, kaut Einstellung hätten es nur 5 sein dürfen. Aber in jeden Fall ist es nötig die Konfiguration von 5 hochzusetzen und zu wissen dass im Backend nicht alle angezeigt werden, obwohl sie alle korrekt Indiziert sind.