Michal Drahoš - IE, ľudia, google API, java, regex

    Table of contents
    No headers

    Zadanie:

    -umožniť zadať meno človeka, cez Google API vyhľadá stránky, ktoré obsahujú info. o človeku

    -z nájdených stránok pomocou regulárnych výrazov vyextrahovať info. o človeku (adresu, mail, telefón, prípadne iné informácie)

    -aplikácia v programovacom jazyku Java

     

    Zdroje nájdené cez google API nie vždy postačujú (veľa krát neobsahujú žiadne, alebo len veľmi málo informácii o človeku), preto som skúšal hľadať informácie pre rôzne mená, vybral som dve, pre ktoré som ručne stiahol stránky obsahujúce informácie o ľuďoch s týmito menami. Stránky som vyberal tak, aby boli informácie, ktoré obsahujú zapísané čo najrôznejšími spôsobmi. Na tejto vzorke budem testovať vyvíjanú aplikáciu.

    Odkazy na adresáre obsahujúce stiahnuté stránky (textové súbory, prvý riadok je odkaz na pôvodnú stiahnutú stránku, nasleduje prázdny riadok za ktorým je zdrojový kod stránky, súbor info obsahuje moje poznámky k jednotlivým stránkam...).

    Testovacie subory

    Priklad stranok ktore vratil google pre meno steven smith


     

     

    Tag page (Edit tags)
    • No tags

    Files 2

    FileSizeDateAttached by 
     AdrTelOnlineExtractor.jar
    Program (jar subor, v ktorom je aj spustitelny program aj zdrojovy kod)
    115.6 kB04:07, 11 Dec 2008Michal.DrahosActions
     ExtrakciaInfoLudiaDokumentaciaFinal (1).doc
    Dokumantacia (finalna verzia)
    148 kB10:19, 12 Dec 2008Michal.DrahosActions
    You must login to post a comment.
    Powered by MindTouch Core