Discussion:
[TYPO3-german] crawler für indexed_search einrichten
Tamas Szalai
2007-08-13 12:10:58 UTC
Permalink
Hallo Liste,

ich m?chte den crawler f?r indexed_search konfigurieren. Dazu habe ich
mir die Anleitung im Typo3-wiki[1] durchgelesen und auf meine
Installation hin angepasst. Mein TS sieht folgendermassen aus:

----->8----->8----->8----->8----->8----->8----->8----->8----->8----->8-----

page = PAGE

...


################
#indexed_search#
################

#Config Indexed Search Engine
#einschalten:
page.config.index_enable = 1
page.config.index_externals = 0

#Vorgaben:

plugin.tx_indexedsearch {
#Suchregeln:
show.rules = 0
#Ziel f?r die Links der Suchausgabe:
result_link_target = _self
#Var-Type, wonach wird gesucht (hier Wortteil):
_DEFAULT_PI_VARS.type = 1
#CSS-Layout ? (n?, hier nicht)
_CSS_DEFAULT_STYLE >
#Wo ist das Plugin?
searchpagePID = 193
}

...

#########
#crawler#
#########

#set up a crawl for users that arent logged in
tx_crawler.crawlerCfg.paramSets.test =
tx_crawler.crawlerCfg.paramSets.test {
cHash = 1
procInstrFilter = tx_indexedsearch_reindex, tx_indexedsearch_crawler
baseUrl = http://MEINE_GEHEIME_URL.de/
}

#set up a crawl for users who have group id of 1,4,5
tx_crawler.crawlerCfg.paramSets.grp1 <
tx_crawler.crawlerCfg.paramSets.test
tx_crawler.crawlerCfg.paramSets.grp1{
userGroups = 0,-2,1,4,5
}

#set up a crawl for users who have group id of 6,7,8
tx_crawler.crawlerCfg.paramSets.grp2 <
tx_crawler.crawlerCfg.paramSets.test
tx_crawler.crawlerCfg.paramSets.grp2{
userGroups = 0,-2,6,7,8
}

#set up a crawl for users who have group id of 11,12,14,15
tx_crawler.crawlerCfg.paramSets.grp3 <
tx_crawler.crawlerCfg.paramSets.test
tx_crawler.crawlerCfg.paramSets.grp3{
userGroups = 0,-2,11,12,14,15
}

-----8<-----8<-----8<-----8<-----8<-----8<-----8<-----8<-----8<-----8<-----

Schaue ich nun unter Web/Info/Site Crawler -> Start Crawling steht bei
jeder Seite ?berall nur "No Entries". Als n?chstes schaue ich mir den
Crawler Log unter Web/Info/Site Crawler -> Crawler Log an und stelle
fest, dass jede URL z.B. folgendermassen aussieht:

http://MEINE_GEHEIME_URL.deindex.php?id=2

Da fehlt doch offensichtlich der Schr?gstrich zwischen .de und
index.php ... deswegen nun meine Frage:

Ist die Konfiguration soweit erstmal in Ordnung?

Die Konfiguration f?r die indexed_search ist hier aus dem Archiv der
Mailinglist - und funktioniert soweit ich das beurteilen kann -> es
werden Suchergebnisse angezeigt.

Die Konfiguration f?r den crawler stammt wie gesagt aus der wiki und da
bin ich mir ebend nicht so sicher, ob die soweit auch stimmt ...


TIA

[1] = http://wiki.typo3.org/index.php/Ext_crawler
Tamas Szalai
2007-08-13 14:31:59 UTC
Permalink
Post by Tamas Szalai
Hallo Liste,
...
habe mittlerweile (wieder mal) selber die L?sung gefunden
Post by Tamas Szalai
Schaue ich nun unter Web/Info/Site Crawler -> Start Crawling steht bei
jeder Seite ?berall nur "No Entries". Als n?chstes schaue ich mir den
Crawler Log unter Web/Info/Site Crawler -> Crawler Log an und stelle
http://MEINE_GEHEIME_URL.deindex.php?id=2
das waren wahrscheinlich noch Reste von meinem Versuch am Freitag
Post by Tamas Szalai
Da fehlt doch offensichtlich der Schr?gstrich zwischen .de und
Ist die Konfiguration soweit erstmal in Ordnung?
War sie nicht ... die Konfiguration des crawler erfolgt im TS f?r die
Seite und nicht im TS f?r das Template.

Am Freitag hatte ich es noch so nur hab ich da irgendwas gel?scht ...
aber ?bers WE hab ich das wohl wieder vergessen :D

jetzt funktioniert alles wunderbar

Loading...