Každý študent si vytvorí podstránku so svojim projektom ako podstranku svojej "User" stranky.

    Na svoj projekt si treba nastaviť práva tak aby iba študent mohol editovať svoju stranku projektu

    Bolo by vhodné aby bola verejne viditeľná ale ak si to niekto nepraje môže nastaviť práva iba pre vyučujúcich a seba.

    Témy projektov a ich priradenie študentom

    Už obsadené témy sú vyznačené červenou

    Pozrite si kto je Váš vedúcich projektu s ktorým budete konzultovať projekt. Zistíte to podľa písmena pred menom (L: Laclavík, S: Šeleng, D: Dlugolinský) v zozname študentov na rok 2010

     

    • Tag Cloud
      • Jan Chlpek - tag cloud, slovencina, linka ako vstup, vystup tag cloud
      • Miroslav Miklus – Tag cloud – pre firemen stranky
      • Michal Noskovic – Tag cloud – ludia s Facebooku, aplikacia na facebooku ktora vyrobi TagCloud.
    • T9
      • Matej Pruzinsky – T9, PHP, frekvencny a zoznam
      • Jaroslav Balik – T9, frekvencny slovnik, diakritika, java, Lucene
      • Michal Sokolsky – doplnanie slov na mobile, android, klasicka klavesnica, slovencina. 
    • Regulárne výrazy
    • Stahovač
      • Ondrej Buch – stahovac, sf.net 
      • Miroslav Kacera – stahovac, sf.net, cieleny 
      • Maros Urbanec – regex, ontea, rozsirenie, Alebo - stahovac, linky 
      • Petra Majzunova: focused crawler zamerany na audio.
    • Stahovač v suvislosti so spracovanim liniek
      • statisticky prekladac na základe anchor textov liniek
      • Tomáš Tomašovič: vyhladavac podla liniek
      • Frederik Ferencz: sťahovač, indexer (priindexovanie) a vyhľadávač (podbných stránok)
    • Extrakcia udalostí
      • Ladislav Clementis – extrakcia udalosti, slovenske emaily vlastne, google calendar
      • Michal Pavlík: extrakcia udalostí z mestských stránok
      • Robert Švajdlenka: extrakcia udalostí, anglické emaily
    • Využitie Tagov pri vyhľadávaní (YouTube, Delicious, ..)
      • Matej Krchniak – YouTube, tagy, lucene, 
      • Martin Repta - youtube, flicker, del.icio.us, twitter - dohodnut presnejsie, napisat predstavu na wiki
      • Peter Student – twiter, najvyznamnejsi ludia 
      • Tomáš Majer - twitter linky  zoradit podobne ako pagerank
    • Extrakcia pomocou Gazeteera (Slovníka)
      • Matej Valcuha: tokenizacia a linearnost
      • Linearna zlozitost
      • Aliasy pomocou regulárnych výrazov
    • Rozpoznavanie slovnych druhov alebo vetnej skladby / POS Taging
      • Jacala Martin – POS Tag statisticky.
      • Peter Voroňák - POS Taging, slovníkovo (slovesá, príd. mená, zámená, číslovky)
      • Peter Mikuška: POS Taging, slovnikovo - doplniť info o slovnikoch ktore sa pouziju a datach na ktorych sa bude testovat
    • Java programy pre podporu učebného textu (https://sourceforge.net/projects/irlesons/)
      • Sťahovanie, regexy sú už pokryté, viď projekty vyššie. Regex príklady na extrakciu ešte môžu byť
      • Matus Juhas: ?priklady extrakcie Mien, firiem, datumov, ... z ukazkovych dát
      • Samuel Števaňák: extrakcia (mien, firiem, datum)
      • Peter Korenek: Indexovanie (zmazanie, priindexovanie) a vyhľadávanie v pdf (vlastná implementácia)
      • Andrej Kozák: Indexovanie (zmazanie, priindexovanie) a vyhľadávanie v dokumentoch (vlastná implementácia)
      • Ondrej Urban: Indexovanie a Vyhladávanie
      • priindexovanie textov liniek k dokumentom na ktore ukazuju
      • Roman Táborský: pageRank a iné rank algoritmy
      • Ján Zdechovan: Analyza textu, tokenizácia príklady
      • Marek Mego: IRlessons, Analyzer + lematizer? v Lucene
      • Aurel Paulovič: Hadoop, Hive ?dáta?
      • dokumentácia, testovanie
      • dalšie témy
    • Prieskum trhu
      • Andrej Hopko: prieskum trhu - extrakcia dát z autobazárov, indexovanie (priindexovanie), search
      • Peter Krajník: indexovanie a extrakcia cestovných zájazdov podľa letiska a ceny
      • Michal Macko: preiskum trhu - chyba zamer/tema (mobily, auta, ..) data.
      • Róbert Korduliak: prieskum trhu - extrakcia dát z portálov o ubytovaní (krátkodobom), search
    • Štatistický prekladač
      • Peter Abelovský: prekladač slovenčina <=> angličtina na základe anchor textov
      • Maroš Unčík: prekladač slovenčina <=> čeština na základe hociakých textov - štatistické metódy
      • Marek Barilla: prekladač slovenčina <=> angličtina na základe hociakých textov - štatistické metódy
      • Pri podobných jazykoch by mohol byť menší problém s tým že nevieme rozpoznať slovné druhy (POS taging)
    • OpenNLP
      • alebo iné metódy umelej inteligencie na extrakciu informácií, focused crawling alebo search
      • Michal Jesenský: extrakcia Name Entity z dokumentov aj z trénovaním na slovenskom texte (OpenNLP)
    • Hadoop, Hive, Pig ...
    • Dalsie témy nájdete v prezentácii ...
    • ....
    • Distance Search

    Ďalšie pridelené témy

    • Marian Honsch -  latentna sem analyza SME
    • Pavol Sokol -  eShop, extrakcia informacii, Java, 
    • Stefan Sabo – doplňovanie diakritiky, využitie okolia slova (opinion mining, data dodefinovat)
    • Pavol Fabik -  Podobnost konferencii, extrakcia z DBWord na zaklade hlavicky
    • Michal Lulco – Divoke kmene, spracovat log a urobit historiu ako hrava hru. 
    • Lubomir Elko: Prerobenie/rozsirenie Team Projektu: indexovania a vyhladavania v lucene 
    • Tomas Micko: Prerobenie/rozsirenie Team Projektu: grafy
    • Zdenko Capík: Email Search (vlastna utriedovacia funkcia, JSP)
    • Michal Maslis – stahovac fokusovany, nutch stahovac + plugin, weka
    • Marián Hraško: Name Entity Recognition z anchor textov liniek
    • Matej Sabo: preklad bez diakritiky na diakritiku (pomocou statistickej analyzy textu)
    • Vladimír Krajčovič: KnowItAll vyhľadávanie v rôznych jazykoch
    • Eduard Kuric: Vyhľadávanie fotografií (automatická anotácia) podľa tagov a podobnosti fotografií (s čim porovnať?)
    • Ján Tóth: Extrakcia informácií FIIT (učitelia - predmety)
    •  Ján Janík: Stemmer (lematizátor) ako plugin do Lucene
    • Michal Klinovský: sociálna sieť z komentárov na sme.sk
    • Vladimír Polák: distance search
    • Ivan Hujsi: Spread activation - porovnanie
    • Lendvay András: Extrakcia informácií o ľuďoch z anglických emailov, GATE
    • Anton Balucha – identifikacia ludi na webe, zistenie ci sa jedna o rovnake osoby na zaklade textu a grafu 
    • Jan Hlavac - emaily socialna siet a spracovanie
    • Lukas Durcak: statistika rozpoznavania nazvoslovnych entit z liniek, FIIT stranka
    • Polerecká Marcela: informácie o ľuďoch

    Témy v diskusii

    • Miroslav Soha – vcely diplomka, graf, slovensky text 
    •  viacerí študenti nemajú pridelené témy alebo vytvorené wiki. Pozri tu.
    •  

    Tag page (Edit tags)
    • No tags
    You must login to post a comment.
    Powered by MindTouch Core