"Tom Iversen" <
tom@kimschumacher.dk> wrote:
>Hej Mikkel!
>
>"Mikkel Breiler" <
mibm@tiscali.dk> wrote in message
>news:
Bwo7PrjqMvq44ZJ9WLyOnEeMfTyq@4ax.com...
>
>> Kunne du ikke blot at k?re den fundne side igennem et filter
>> som smider en reverse p? de ord som optr?der i teksten, og
>> huske de tre f?rste s?danne linier
>
>Jeg ahr et s?geord, der teknisk set fungerer som n?gle til en tabel med en
>masse id'er p? hvilke(n) side(r) dette ord forekommer p? (samt orders
>position p? siden). Derudover er der til hver side ogs? tilknyttet en titel
>og en description.
>
>Nu snakker du om en reverse. T?nker du p? at jeg skal genloade siden for at
>hente det originale indhold tilbage og pr?sentere dette (eller ihvertfald
>dele deraf)?
Reverse er et d?rligt ord, Inverteret tekst er bedre. Duved s? at man hurtigt ser sit
s?geord i teksten.
>Jeg har simpelthen ikke en nem l?sning p? hvordan jeg ellers skal lave
>s?gealgoritmen (udover at lave to seperate s?gealgoritmer: en index-baseret
>og en db-baseret).
>Du burde aldrig kunne f? _f?rre_ hits end f?r (med mindre du s?ger med flere
>ord - der fungerede som OR i den gamle).
Netop et irriterende punkt, n?r tydeligheden over hvad som er fundet mindskes s?
betragteligt og m?ngden der findes samtidigt bliver st?rre.
>> og dem jeg kan se skal jeg g? igennem en for en for at finde
>
>Det er det der er kernen i problemet. Som sagt: jeg aner ikke lige hvordan
>jeg l?ser det her smartest. Men jeg skal nok komme p? noget. Hvis s?gningen
>er et big issue, s? venter jeg med at opdatere ks.dk - s? meget haster det
>heller ikke.
Det er et big issue for mig, jeg bruger det ofte. Med betasitet kan jeg lige s? godt
tage et ?rsindex og plukke tilf?ldigt _hvis_ jeg har en anelse om hvorn?r KS spillede
en bestemt sang, det er langt fra altid tilf?ldet, men ganske ofte.
>> Kunne man s? afgr?nse s?gning til blot enkelte felter?
>> Forslag til opdeling, er 6 m?der at s?ge p?: Kunstner, sang,
>> kommentar, speak, gruppeinfo og andet?
>
>Her faldt jeg lige af. Du snakker Db-s?gning nu, ikke? (Hvis ja, s? jow
Ja. Jeg ved godt at indexs?gning er hurtigere, men at det er s? h?mmende havde jeg
ikke forestillet mig. Nu har du vel ikke kodet dig ind i et hj?rne?
>Min f?rste crawler p? beta.ks.dk (for et ?rs tid siden) var en hybrid af db
>og index-s?geren. Den crawlede selve databasen og huskede hvilke tabeller
>(og felter) den havde hentet hvert ord fra. S? var det blot op til GUI'en at
>pr?sentere de rigtige "tabeller" korrekt. I teorien en fin id?, men i
>praksis var det ret langsomt, og GUI-delen virkede langt fra altid godt,
>fordi det samme ord jo sagtens kunne forekomme i to forskellige sammenh?nge
>i samme side (da de fleste sider jo bruger flere tabeller). Desuden virkede
>crawleren ikke n?r/hvis jeg senere hen opdaterede databasen - og s? blev der
>jo naturligvis aldrig s?gt p? statiske sider.
Det er jo f?rst nu de statiske er med.
>M?ske man skal lave et specielt HTML-tag, som crawleren kan forst? og tr?kke
>relevant info ud af - a'la:
>
><kimschumacher type="gruppe">Gruppe: Alphaville</kimschumacher>
>
>(s? ved crawleren at denne side er af typen 'gruppe', og description skal
>v?re 'Gruppe: alphaville' - ekstremt simplificeret).
>
>Det er nonstandard og er at betegne som et hack - men det vil virke (tror
>jeg ...

.. <meta>-tags kan muligvis ogs? bruges (de bliver godtnok
>allerede brugt - men m?ske kan de udnyttes bedre?)
Uha, det er snavs, der m? v?re en mere elegant m?de at g?re det p?.
Jeg ville nok udforske db-s?gning lidt mere. Din indexering er jo ikke lavet udfra
databasen, men efter indholdet af hver f?rdig side, ikke sandt? Det er to forskellige
m?der at tage fat p? s?gningen. Den ene er mere sand over for hvordan det der s?ges
optr?der medens den anden er sorteret op i dele som letter selve s?gningen. Men det
sidste sker alts? p? bekostning af friheden til at arbejde med s?geresultatet.
N?men jeg skal op til mine for?ldre og spise fint her til aften, jeg har travlt men
jeg vil t?nke over problematikken til mandag. Jeg vil blot n?dig ende med en database
som jeg ikke orker at s?ge i.
-breiler