Marian Bán - Prieskum trhu

    Table of contents
    No headers

    Prieskum trhu ubytovacích zariadení napr. hotelov, chatiek, penziónov.

    Implementacia v ASP.NET - C#

    Ako zdroj pouzijem stranky v podobe katalogov takychto zariadeni:

    www.dovolenky.sk
    www.limba.com
    www.kiska.sk
    www.top-hotely.sk ...

    Zameriam sa na ziskanie informacii:

    Nazov objektu napr. hotel reduta - (budem predpoklodat ze je uvedeny v url, titulke stranky alebo v nadpise)

    Izby - pomocou regularneho vyrazu narp. 1x3

    Fotografie - ak zistim nazov objektu tak prehladam vsetky obrazky na stranke, ktorych atribut src, alt, tilte sa podoba nazvu(podobnost urcim ako ciselnu hodnotu)

    Parkovanie - pomocou regularneho vyrazu

    Cena ubytovania - regularny vyraz - vecsinou sa uvadza viac cien (podla rocneho obdobia) / budem musiet pripojit aj dalsie info k cenam

     

    Pouzijem crawler - vlastna implementacia.

    Budem prechadzat jednotlive stranky podla toho ci url, titluok, nadpisi obsahuju klucove slovo (napr. hotel, chata) sa rozhodnem ci stranku zaradim do spracovania. Snazim sa najst stranky ktore obsahuju informacie len o jednom konkretnom zariadeni - zvycajne je to stranka detailu zariadenia.

    Ziskane inforamcie planujem uchovat a umoznit v nich nasledne vyhladavat.

     

    zatial mam crawler spracovanu vsetkych extrakciu informacii, este to doladujem a ako dalsie budem riesit uchovavanie a vyhladavanie vo vysledkoch

    Tag page (Edit tags)
    • No tags
    You must login to post a comment.
    Powered by MindTouch Core