Lucia Jastrzembská - včely vyhľadávanie

  - focused crawler inspirovany spravanim vciel

  - pouzit heuristiku na vyber dalsej linky pomocou okolia linky

  - porovnat s povodnym riesenim

  Včelí focused crawler

  Včelí focused crawler sa skladá z dvoch základných modelov správania sa včiel - správanie sa včely v úli (implementoval Tomáš Jelínek) a správanie sa včely mimo úľa (implementovala Lucia Jastrzembská).Oba modely sú zobrazené na obrázku.

   

  nasModel.jpg

  Model správania sa včiel v úli

  Úľ má 3 základné časti - tančiareň, hľadisko a dispečerňu. Tančiareň slúži na propagovanie nejakého zdroja, hľadisko na pozorovanie propagovaných zdrojov a v dispečerni sa nachádzajú štartovacie stránky z ktorých si pri odchode z dispečerne včely náhodne vyberajú.

  Pri štarte vyhľadávania sa všetky včely nachádzajú v dispečerni, odkiaľ si náhodne vyberú jednu zo štartovacích stránok. Včela sa v tomto momente dostane mimo úľa a jej správanie sa odvíja od modelu správania sa včely mimo úľa. 

  Včela sa po návrate do úľa rozhoduje na základe kvality nájdenej stránky q. Jej ďalšie rozhodovanie je zobrazené na obrázku.

  Model správania sa včiel mimo úľa

  Včela sa pri každom navštívení stránky rozhoduje na základe jej kvality, či sa vráti späť do úľa alebo bude nasledovať niektorý z odkazov. V prípade, že stránka neobsahuje ďalšie odkazy, včela sa na základe kvality stránky vráti buď so skutočnou kvalitou stránky alebo s nulovou kvalitou stránky. Včela si z liniek na stránke vyberá náhodne.

  Výpočet kvality stránok

  Kvalita stránky sa určuje iba na základe výskytu slov na stránke a ich dôležitosti (title, nadpisy). Do úvahy sa neberie linkové prepojenie stránok.

  Cieľ tohto predmetu

  V rámci tohto predmetu by som chcela vyskúšať, ako sa zmenia výsledky a priebeh vyhľadávania v prípade, že sa ďalšia linka nebude vyberať náhodne ale na základe váhy linky. Táto sa učí na základe toho, či sa hľadané slovo vyskytuje v okolí linky, jeho popise, atď.

  Tag page (Edit tags)
  • No tags
  You must login to post a comment.
  Powered by MindTouch Core