My PhD Study: Difference between revisions
No edit summary |
No edit summary |
||
Line 1: | Line 1: | ||
[[Image:Shutterstock_128869777_paidImage_small.jpeg|thumb|''Data is the new oil.'' — Clive Humby, Kellogg School, 2006.|300px|right]] | [[Image:Shutterstock_128869777_paidImage_small.jpeg|thumb|''Data is the new oil.'' — Clive Humby, Kellogg School, 2006.|300px|right]] | ||
My PhD research was related to an iterative ontology-based information extraction. I was working on named entity recognition, relationship extraction and coreference resolution. After developing the novelties I merged the methods into and iterative system. My | My PhD research was related to an iterative ontology-based information extraction. I was working on named entity recognition, relationship extraction and coreference resolution. After developing the novelties I merged the methods into and iterative system. My [File:PhD_thesis_slavko.pdf PhD thesis is available online] along with [https://www.youtube.com/watch?v=3R3Ob5tHL7c the public defense]. | ||
Information Extraction (IE) refers to automatic extraction of structured information from unstructured sources. As a task it can also be seen as flling slots into a database from text. It must pre-process, recognize and convert information from textual documents (e.g web pages, reports, books), structural (e.g. web page structure, indexes) or usage data (e.g. query logs) into human and machine understandable format. As a family of techniques IE combines segmentation, classification, association and clustering. They can be roughly divided into pattern-based and machine learning-based (ML) approaches. The first use manually defined rules or can also learn them for specific type of documents using seed expansion. The latter consist of probabilistic (e.g. sequence models) and induction (e.g. linguistic, structural models) approaches and are currently the main focus of the research in IE community. In knowledge management and semantic web, a machine can ''understand'' the data if it is represented as an ontology. Therefore IE techniques can be used for automatic ontology creation and also population. | Information Extraction (IE) refers to automatic extraction of structured information from unstructured sources. As a task it can also be seen as flling slots into a database from text. It must pre-process, recognize and convert information from textual documents (e.g web pages, reports, books), structural (e.g. web page structure, indexes) or usage data (e.g. query logs) into human and machine understandable format. As a family of techniques IE combines segmentation, classification, association and clustering. They can be roughly divided into pattern-based and machine learning-based (ML) approaches. The first use manually defined rules or can also learn them for specific type of documents using seed expansion. The latter consist of probabilistic (e.g. sequence models) and induction (e.g. linguistic, structural models) approaches and are currently the main focus of the research in IE community. In knowledge management and semantic web, a machine can ''understand'' the data if it is represented as an ontology. Therefore IE techniques can be used for automatic ontology creation and also population. |
Revision as of 21:31, 2 August 2022
My PhD research was related to an iterative ontology-based information extraction. I was working on named entity recognition, relationship extraction and coreference resolution. After developing the novelties I merged the methods into and iterative system. My [File:PhD_thesis_slavko.pdf PhD thesis is available online] along with the public defense.
Information Extraction (IE) refers to automatic extraction of structured information from unstructured sources. As a task it can also be seen as flling slots into a database from text. It must pre-process, recognize and convert information from textual documents (e.g web pages, reports, books), structural (e.g. web page structure, indexes) or usage data (e.g. query logs) into human and machine understandable format. As a family of techniques IE combines segmentation, classification, association and clustering. They can be roughly divided into pattern-based and machine learning-based (ML) approaches. The first use manually defined rules or can also learn them for specific type of documents using seed expansion. The latter consist of probabilistic (e.g. sequence models) and induction (e.g. linguistic, structural models) approaches and are currently the main focus of the research in IE community. In knowledge management and semantic web, a machine can understand the data if it is represented as an ontology. Therefore IE techniques can be used for automatic ontology creation and also population.
1st year (2010/2011)
Veščine v znanstvenem delu 1
- Osnovni principi znanstvenega sporočanja (prof. Jurišić) Naloga
- Sporočanje v angleškem jeziku, dobra praksa in tipične napake (viš. pred. Štros Bračko) Naloga
- Javne bibliografske baze in njihova uporaba v znanstveno raziskovalnem delu, osnove scientometrije (doc. Demšar) Naloga
- Ustno sporočanje, elementi dobre ustne predstavitve oz. predavanja (doc. Demšar) [ Naloga]
- Orodja za urejanje znanstvenih besedil, orodja za vodenje in urejanje bibliografskih zapisov (izr. prof. Lotrič) Naloga
- Osnovni principi pisnega znanstvenega sporočanja v znanosti in citiranje (prof. Jurišić) Naloga
- Sporočanje v obliki plakata 1,2 (doc. Lebar Bajec) Priloga [ Plakat]
- Načrtovanje in pisanje doktorskih disertacij (prof. Solina) Naloga
- Postopek recenziranja (prof. Leonardis) Naloga
- Modeli financiranja raziskav doma in v svetu (prof. Leonardis)
- Etika v znanosti in raziskovanju (prof. Jurišić) Naloga
- Znanost in mediji (prof. Solina)
Seminar 1
V okviru predmeta boste pripravili pregledno predavanje za izbrano področje računalništva. Predavanje bosta skupaj predstavila dva študenta, ki najprej izbereta področje (temo) in predvideni naslov predstavitve, poiščeta vsaj tri pregledne revijske znanstvene članke z izbranega področja, skupaj pripravita predstavitev in to skupaj predstavita pred avditorijem. Predstavitev naj bo dolga 20 minut (+5 minut za vprašanja in komentarje).
Udeležba na vseh seminarjih je za vse študente III. stopnje obvezna. Za pozitivno opravljen predmet je potrebna:
- pravočasna prijava predstavitve (1. korak),
- naložitev predstavitve v PDF obliki vsaj 72 ur pred predstavitvijo (2. korak),
- ustna predstavitev pred avditorijem (3. korak),
- prisotnost na vseh predstavitvah v okviru Seminarja 1, oziroma, če ste na kakšni predstavitvi manjkali, prebran ustrezni pregledni članek in oddan povzetek članka.
Literatura:
- Bourne PE (2007) Ten Simple Rules for Making Good Oral Presentations, PLoS Computational Biology 3(4): e77.
Članek Predstavitev (pdf) Prezi link
Veščine v znanstvenem delu 2
Pisanje prijave na ARRS projekt.
Seminar 2
Na Seminarju 2 bomo spisali članek, ga oddali v recenziranje, recenzirali, pripravili predstavitev in se udeležili (neformalne) mini konference. Vse bomo pripravili v angleščini. Tokrat bo vsak študent pripravil svoj članek in imel svojo predstavitev. Na članku in na predstavitvi naj bo študent edini avtor, sodelovanje mentorjev in morebitne ostale pomoči naj omenite v zahvali. Formalne objave člankov ne bo, zato lahko gradivo, ki ga boste pripravili za ta predmet sami ali pa skupaj s sodelavci uporabiti za pripravo članka, ki ga pošljete na neko mednarodno konferenco ali v revijo.
Članek Predstavitev Prezi predstavitev
Pregledne teme
Izpit iz Preglednih tem računalništva in informatike preverja študentovo znanje s področij, ki jih pokriva tipični dodiplomski kurikulum računalništva in informatike. Študent na začetku prvega semestra reši kvize, s katerimi preveri svoje znanje s posameznih področij. Če se izkaže, da je njegovo znanje pomanjkljivo, nadoknadi zaostanek s študijem ustrezne literature ozitoma, po potrebi, konzultacijami z izvajalci predmeta.
Izpit je razdeljen na štiri sklope, sklopi na podsklope, ki predstavljajo različen delež sklopa. Za uspešno opravljen izpit je potrebno pozitivno opraviti vse štiri sklope.
Matematične metode v računalništvu
[ Naloga 1 navodila] Naloga 1 rešitev
Naloga 2 navodila Naloga 2 rešitev
Naloga 3 navodila Naloga 3 rešitev
Naloga 4 navodila Naloga 4 rešitev
Naloga 5 navodila Naloga 5 rešitev
Naloga 6 navodila Naloga 6 rešitev
Naloga 7 navodila Naloga 7 rešitev
Naloga 8 navodila Naloga 8 rešitev
Naloga 9 navodila Naloga 9 rešitev
Naloga 10 navodila Naloga 10 rešitev
[ Naloga 11 navodila] Naloga 11 rešitev
Naloga 12 navodila Naloga 12 rešitev
Naloga 13 navodila Naloga 13 rešitev
Seminarska naloga: Iskanje hamiltonovega cikla na ravninskih grafih z malo notranjimi točkami Izvorna koda se nahaja na: https://github.com/szitnik/Hamiltonian-Cycle-with-Few-Inner-Points
Velika omrežja
Gradivo in vse dostopno na pajek.imfm.si.
Seminarska 1 Seminarska 2 Seminarska 3
Umetna inteligenca
Predmet je razdeljen na 3 sklope, vsak traja 5 tednov in vsakega izvaja drug izvajalec. En sklop sestavljajo 2-3x predavanja, 1-2x vaje, zadnji teden pa je namenjen samostojnemu delu, dokončanju in oddaji domačih nalog.
Vsak sklop se zaključi z delno oceno. V vsakem sklopu je nujno doseči oceno najmanj 50%. Končna ocena bo zaokroženo povprečje vseh treh delnih ocen.
Multivariatna analiza
Predavanja je izvajala prof. dr. Anuška Ferligoj in zadnje predavanje o strukturnih modelih Germa Coenders.
Naloga 0 Naloga 1 Naloga 2 Naloga 3 Naloga 4 Naloga 5 Naloga 6
Raziskovalno delo
Program Vmesno poročilo Končno poročilo
2nd year (2011/2012)
Seminar 3
V okviru predmeta boš pripravil kratko, deset minutno ustno predstavitev tvojega tekočega raziskovalnega dela. Predstavitev boš pripravil sam v sodelovanju s tvojim mentorjem. Predstavitev naj obsega:
- Uvod in pregled področja: s katerim raziskovalnim področjem se ukvarjaš? Katera so glavna znanstvena dela na tem področju oz. kakšno je stanje raziskav na tem področju. Sorodna dela, ki podajo stanje na področju, predstavi na kratko, izpostavi seveda del, ki je pomemben za tvoje raziskovanje)?
- Motivacija: zakaj je to področje zanimivo? Kaj raziskuješ oziroma razvijaš ti? Zakaj je to pomembno?
- Metode: katere metode razvijaš? Kaj si že razvil? Kako preveriš, če to, kar si razvil, dobro deluje? Opiši tvoje rezultate.
- Diskusija in zaključek: Si primerjal tvojo rešitev z ostalimi znanimi rešitvami? V čem so prednosti in slabosti tvojo rešitve?
Članek Predstavitev Prezi link
Seminar 4
Članek Predstavitev Prezi link
Raziskovalno delo
Program Vmesno poročilo Končno poročilo Predstavitev končnega poročila
Tema doktorske disertacije
Pravilnik UL glede doktorskega študija Kratka navodila za pripravo teme doktorske disertacije
Prijava teme doktorske disertacije Javna predstavitev teme doktorske disertacije
3rd year (2012/2013)
Research work going on ...
4th year (2013/2014)
Seminar 5
Zaključna predstavitev doktorskega dela pred končnim zagovorom doktorske disertacije.
Oddan osnutek disertacije pred predstavitvijo: Osnutek disertacije
Predstavitev: Predstavitev
Zagovor doktorske disertacije
Doktorsko delo: Platnica, Disertacija
Predstavitev na javnem zagovoru: Predstavitev
Posnetek javnega zagovora: Youtube posnetek
Izvorna koda predlaganih postopkov: https://bitbucket.org/szitnik/iobie