Peter Holic - Metadáta o firme cez OR SR a SK-NIC

    Table of contents
    No headers

    rok 2008/2009, zimny semester

    Vyhladavanie informacii o firmach s vyuzitim obchodneho registra SR (http://www.orsr.sk) a registrovancyh domen SR (https://www.sk-nic.sk dalej SK-NIC). Vyhladanie informacii bude pozostavat zo zadania mena firmy, o ktorej sa maju najst informacie. Zo zadaneho mena firmy sa v obchodnom registry zisti ICO firmy, pomocou ktoreho sa zisti v registrovanych domenach, ci ma zadana firma registrovanu domenu. Ak existuje domena registrovana na tuto firmu, tak sa na nej vyhladaju informacie o firme ako adresa, telefon, e-mail a dalsie.

    Aplikacia bude vypracovany v Jave.

     

    Vyhladavanie bude zabezpecovat konzolova aplikacia, ktorej sa budu zadavat argumenty. Aplikacia bude mat 2 vystupy, na konzolu, kde sa budu priebezne vypisovat informacie o cinnosti aplikacie a do suboru, kde sa budu ukladat informacie o najdenej firme/firmach.

    Spomenuty stav, najdenie informacii o firme a firmach vznika pri zadani pri vyhladavani firmy v obchodnom registry. Po zadani retezca na vyhladanie su ako vysledok vratene vsetky firmy, v mene ktorych je obsiahnuty vyhladavany retazec. Tento stav vznika ak je vyhladavany kratky retazec (3-4 znaky), firma ma kratky nazov alebo nevieme presne meno firmy a pouzije sa kratsi retazec, co zvysuje sancu na vratenie adekvatnej informacie. Vyhladanie bude pokracovat pre vsetky najdene firmy, ak ich pocet nepresiahne unosne mnozsvto.

    Zo zisteneho ICO firmy v obchodnom registry nasleduje vyhladanie domeny pre najdene ICO. Kedze SK-NIC poskytuje vyhladavanie len podla domeny alebo osoby, ktora registrovala domenu je potrebne vykonat hladanie nad kompletnym zoznamom vsetkych registrovanych domen. Zoznam registrovanych domen ma vsak velkost cca 16MB, co by bolo neefektivne stahovat pre kazde nove vyhladavanie a preto sa bude lokalne v PC drzat upravena kopia tohto zoznamu, nad ktorym sa bude vykonavat hladanie. Upravenie kopie pozostava z ponechania len adekvatnych informacii a to ICO firmy a registrovana domena, pretoze zoznam okrem tychto informacii obsahuje nadbytocne informacie, ktore nie su potrebne pre riesenie zadanej ulohy. Upravou kopie sa docieli zefektivnenie vyhladavania v zozname. Lokalnu kopiu zoznamu registrovanych domen, bude mozne pomocou aplikacie stiahnut a sucasne aj upravit zadanim prislusnych argumentov aplikacie.

    V najdenych domenach sa vyhladaju informacie o firme. Na vyhladanie informacii budu pouzite regularne vyrazy, ale aj ine postupy z dovodu rozmanitosti webovych stranok pre rozne firmy. Vysledky hladania budu ulozene do suboru s uvedenim aky retazec sa vyhladaval a ake firmy sa nasli spolu s informaciami o nich.

    Tag page (Edit tags)
    • No tags

    Files 9

    FileSizeDateAttached by 
     Application.jar
    Testovaci verzia programu s pracou len v rezime online.
    4.34 MB06:19, 11 Dec 2008peter.holicActions
     Application.src.jar
    Zdrojove subory aplikacie.
    7.21 kB23:34, 16 Dec 2008peter.holicActions
     Firm crawler.ppt
    Podporna prezentacia.
    74 kB11:31, 12 Dec 2008peter.holicActions
     firmCrawler.zip
    Verzia programu s osetrenim vstupov podporujuca pracu v rezime online aj offline na vybranej vzorke webovych stranok.
    4.52 MB15:37, 11 Dec 2008peter.holicActions
     pages (1).zip
    Doplnena verzia pre plnu funkcnost.
    179.66 kB15:23, 11 Dec 2008peter.holicActions
    vi_dokumentacia.doc
    Finalna dokumentacia k projektu.
    70 kB06:19, 11 Dec 2008peter.holicActions
     vi_dokumentacia.rev1.doc
    Opravenie prikazu na spustenie aplikacie.
    70 kB11:42, 11 Dec 2008peter.holicActions
     vi_dokumentacia.rev2.doc
    Uprava najdenych gramatickych a formatovych chyb. Doplnenie pouzivatelskej prirucky.
    72.5 kB11:45, 12 Dec 2008peter.holicActions
     vi_dokumentacia.rev3.doc
    Doplnene pouzite regularne vyrazy.
    80.5 kB23:31, 16 Dec 2008peter.holicActions
    You must login to post a comment.
    Powered by MindTouch Core