Juraj Tomaschek - Indexovanie PDF dokumentu a vlastný algoritmus zoradenia nájdených výsledkov podľa relevancie

    Table of contents
    No headers

    Cieľom projektu je implementovať program na indexovanie PDF súborov na disku a vlastného algoritmu zoradenie nájdených výsledkov a otestovanie funkčnosti algoritmu a kvality (relevancia, pokrytie, ..) ponúkaných výsledkov na vybranej vzorke súborov. Porovnať s inými podobnými programami ako napríklad Google Desktop Search.

     

    Program bude implementovaný v jazyku C# za pomoci Lucene.NET

    Tag page (Edit tags)
    • No tags
    You must login to post a comment.
    Powered by MindTouch Core