DAT550_1
Datautvinning
Læringsutbytte
- Teori og praksis om data forberedelse, utvelgelse og utvinning.
- Konsepter, metoder og teknikker for å få innsikt fra store data.
Ferdigheter:
- Prosessere og forberede store data for ulike datautvinningsoppgaver
- Frequent itemset mining, utvinning av assosieringsregler (association rule mining), klynging (clustering), klassifisering, og datautvinning fra grafer og datastrømmer
- Implementere data mining pipelines, vurdere og stille parameterne for ulike data mining modeller ved hjelp av state-of-the-art verktøy
Generell kompetanse
- Identifisere de teoretiske og praktiske utfordringene bak ulike data mining teknikker. Å kunne liste opp og beskrive styrker, begrensninger og avveininger mellom ulike data mining teknikker og velg de riktige teknikker for å løse datavitenskapelige problemer for ulike applikasjoner.
Innhold
- Datarensing, transformasjon og forberedelse
- Dimensjonalitetsreduksjon
- Anbefalingssystemer
- Datautvinning fra grafer
- Klassifisering
- Nevrale nett og dyplæring
- Gruppering
- Utvinning av vanlige mønstre, sammenhenger og korrelasjoner
- Utvinning av data fra datastrømmer
Forkunnskapskrav
Anbefalte forkunnskaper
Eksamen/vurdering
Vekting | Varighet | Karakter | Hjelpemiddel | |
---|---|---|---|---|
Skriftlig eksamen | 3/5 | 4 timer | A - F | 1) |
Prosjektrapport | 2/5 | A - F |
Vilkår for å gå opp til eksamen/vurdering
Alle programmeringsøvelser må bestås for å få delta på skriftlig eksamen og for å få godkjent prosjekt.
Ferdigstillelse av obligatoriske laboratorieoppgaver skal gjøres på tider og i gruppene som er tildelt. Fravær på grunn av sykdom eller av andre årsaker skal meddeles laboratoriepersonalet snarest mulig. Man kan ikke forvente at bestemmelser for ferdigstillelse av laboratorieoppdragene på andre tidspunkter utføres med mindre avtale med laboratoriepersonalet er avtalt.
Hvis du ikke fullfører de tildelte laboratoriene i tide eller ikke har godkjent dem, vil det føre til at du ikke tar eksamen på kurset.
Fagperson(er)
- Emneansvarlig
- Vinay Jayarama Setty
- Instituttleder
- Tom Ryen
Arbeidsformer
Overlapping
Emne | Reduksjon (SP) |
---|---|
Websøk og data mining (DAT630_1) | 5 |
Ã…pent for
Datateknologi - Master program
Emneevaluering
Litteratur
- Data Mining: Practical Machine Learning Tools and Techniques, Third Editiion, by Ian H. Witten, Eibe Frank, Mark A. Hall
- An Introduction to Data Mining, 2nd edition, Pang-Ning Tan, Michael Steinbach, Vipin Kumar, Anuj Karpatne, Pearson, 2018
- For lab: Python Data Science Handbook by Jake VanderPlas https://jakevdp.github.io/PythonDataScienceHandbook/ (free ebook available no need to buy)
Sist oppdatert: 10.12.2019