indexed_search
Die indizierte Suche ist im System enthalten und funktioniert gut, abgesehen von der nicht allzu guten Performance.
Installation
Installieren der System-Extension indexed_search.
Installieren der Extension crawler 11.0.7
Installieren des Packets xpdf (für pdftotext und pdfinfo binaries).
Installieren von catdoc, ppthtml, unrtf und xlhtml
Content anlegen mit dem Plugin Indexed Search.
Konfiguration
Konfiguration
Folgendes in das Setup des Templates aufnehmen:
# ------------------------------------
# Indexed Search
# ------------------------------------
page.config.index_enable = 1
page.config.index_externals = 1
plugin.tx_indexedsearch {
#_CSS_DEFAULT_STYLE >
templateFile =fileadmin/layout/html/indexed_search.tmpl
# Setting default values
_DEFAULT_PI_VARS {
extResume = 1
# default-mäßig ein Teilwort suchen (1)
type = 1
lang < config.sys_language_uid
# show extended search initially
ext = 0
# grouping: flat/sections
group = flat
results = 5
}
# wrappings
rules_stdWrap {
}
sectionlinks_stdWrap {
}
path_stdWrap {
}
# config
search {
rootPidList = 1
page_links = 10
detect_sys_domain_records = 0
#defaultFreeIndexUidList = 0,1,2
}
# show
show {
# rules
rules = 0
# hash creation
parsetimes=1
# second level in section dropdown
L2sections=1
# first level in section dropdown
L1sections=1
# show "not in menu" or "hide from menu" but not hidden pages in section
LxALLtypes=0
# empty formfield after search
clearSearchBox = 0
# add searchterm to history
clearSearchBox.enableSubSearchCheckBox=1
forbiddenRecords = 0
alwaysShowPageLinks = 0
advancedSearchLink = 0
resultNumber = 1
mediaList = 1
}
# show fields for parameters
blind {
# type (word, subpart of word, ..)
type=0
# default option (and, or)
defOp=0
# sections of website
sections=0
# search in mediatypes
media=0
# sort
order=0
# view (section hierarchye / list)
group=0
# language selection
lang=0
# select sorting
desc=0
# results per page
results=20
# extended preview
extResume = 0
#freeIndexUid = 0
}
}
Anlegen eines Ordners und von Content des Typs Record des Typs indexing configuration
Kategorien
Kategorien im Suchformular (Erweiterte Suche) kann man definieren mit folgendem Eintrag:
plugin.tx_indexedsearch.search.defaultFreeIndexUidList= 2,3,4
Dies ist eine Liste von Uid's von Indexing Configuration Records. Die Reihenfolge bestimmt auch die Sortierung der Suchergebnisse.
Suche in Sektionen
Um nur in einer bestimmten Sektion und den Unterseiten zu suchen muss man ein Extension Template anlegen für die Seite mit dem Suchfeldund folgendes ins TSsetup aufnehmen:
# Search only in Templates section
plugin.tx_indexedsearch._DEFAULT_PI_VARS.sections=rl1_75
Wobei:
rl1 für 1te Ebene über root
rl2 für 2te Ebene über root
_75 für Seite mit der id=75

Index Administration
Verwenden des Info Moduls: Indexed Search -> Technical Details. Dort kann man sehen was indiziert wurde. Hier ein Bild das zeigt warum die Indexeinträge nicht für alle Seiten gleich sind:
Indizierung Externer Dokumente
Update Versionen TYPO3 > 12. Beim Indizieren externer PDFs via Crawler Extension traten komische Effekte auf: Es wurden statt ca. 100 verlinkter Dokumente nur 7 Indiziert.
Dann ist mir die Einstellung aufgefallen in der Backend Konfiguratin von Extensions:
Max external files to index (basic.maxExternalFiles [int])
Dies steht per Default auf 5. Ich habe es auf 500 gesetzt. Dann waren es 10 Indizierte Dokumente, wenn man im Backend mit dem Modul “Indizierung / Detaillierte Statistik” nachsieht.
Und hier kommt der “Bug”: De facto waren alle 100 indiziert, hier werden aber nur 10 angezeigt. Wenn man “alle” löscht, kommen plötzlich die nächsten 10 zum Vorschein. Also ist es hier wie ien Paging a'10 Einträge, aber keine Navigation um die “nächsten 10 Einträge” anzusehen.
Unlogisch bleibt aber warum es Anfangs 7 waren, kaut Einstellung hätten es nur 5 sein dürfen. Aber in jeden Fall ist es nötig die Konfiguration von 5 hochzusetzen und zu wissen dass im Backend nicht alle angezeigt werden, obwohl sie alle korrekt Indiziert sind.