en_GB
Hold Ctrl-tasten nede. Trykk på + for å forstørre eller - for å forminske.

DAT550_1

Datautvinning

Dette er studietilbudet for studieår 2019-2020. Endringer kan komme.


Formålet med dette kurset er at studentene skal få kunnskap og praktisk erfaring med datautvinning (data mining) teknikker. Forelesningene skal gi studentene dyp kjennskap til teknologier for datautvinning. Studentene skal kunne forberede storskala data for datautvinning (forbehandling) og bruke en rekke datautvinningsmetoder for å trekke ut brukbar kunnskap fra data. Kurset skal gi studentene mulighet til å lære moderne datautvinningsalgoritmer og verktøy. Studentene vil få praktisk erfaring gjennom å prøve disse verktøyene på ekte data.

Læringsutbytte

Kunnskap:
  • Teori og praksis om data forberedelse, utvelgelse og utvinning.
  • Konsepter, metoder og teknikker for å få innsikt fra store data.

Ferdigheter:
  • Prosessere og forberede store data for ulike datautvinningsoppgaver
  • Frequent itemset mining, utvinning av assosieringsregler (association rule mining), klynging (clustering), klassifisering, og datautvinning fra grafer og datastrømmer
  • Implementere data mining pipelines, vurdere og stille parameterne for ulike data mining modeller ved hjelp av state-of-the-art verktøy

Generell kompetanse
  • Identifisere de teoretiske og praktiske utfordringene bak ulike data mining teknikker. Å kunne liste opp og beskrive styrker, begrensninger og avveininger mellom ulike data mining teknikker og velg de riktige teknikker for å løse datavitenskapelige problemer for ulike applikasjoner.

Innhold

  • Datarensing, transformasjon og forberedelse
  • Dimensjonalitetsreduksjon
  • Anbefalingssystemer
  • Datautvinning fra grafer
  • Klassifisering
  • Nevrale nett og dyplæring
  • Gruppering
  • Utvinning av vanlige mønstre, sammenhenger og korrelasjoner
  • Utvinning av data fra datastrømmer

Forkunnskapskrav

Ingen.

Anbefalte forkunnskaper

DAT540 Introduksjon til datavitenskap, STA500 Sannsynlighetsregning og statistikk 2

Eksamen/vurdering

Skriftlig eksamen og prosjektrapport
Vekting Varighet Karakter Hjelpemiddel
Skriftlig eksamen3/54 timerA - F1)
Prosjektrapport2/5 A - F
1) Lærebøker og forelesningsnotater

Vilkår for å gå opp til eksamen/vurdering

Obligatoriske øvinger
Tre obligatoriske øvelser / programmeringsoppgaver som må være godkjent. Disse evalueres til godkjent / ikke godkjent.
Alle programmeringsøvelser må bestås for å få delta på skriftlig eksamen og for å få godkjent prosjekt.
Ferdigstillelse av obligatoriske laboratorieoppgaver skal gjøres på tider og i gruppene som er tildelt. Fravær på grunn av sykdom eller av andre årsaker skal meddeles laboratoriepersonalet snarest mulig. Man kan ikke forvente at bestemmelser for ferdigstillelse av laboratorieoppdragene på andre tidspunkter utføres med mindre avtale med laboratoriepersonalet er avtalt.
Hvis du ikke fullfører de tildelte laboratoriene i tide eller ikke har godkjent dem, vil det føre til at du ikke tar eksamen på kurset.

Fagperson(er)

Emneansvarlig
Vinay Jayarama Setty
Instituttleder
Tom Ryen

Arbeidsformer

4 timer forelesninger / øvingsgjennomgang og 2 timer veiledede programmeringsøvelser og prosjekt. Programmeringsøvelser krever ytterligere ikke-veiledet arbeidsinnsats.

Overlapping

Emne Reduksjon (SP)
Websøk og data mining (DAT630_1) 5

Åpent for

Enkeltemner ved Det teknisk-naturvitenskaplige fakultet
Datateknologi - Master program

Emneevaluering

Skjer vanligvis gjennom skjema og/eller samtaler i henhold til gjeldende retningslinjer. 

Litteratur

  1. Data Mining: Practical Machine Learning Tools and Techniques, Third Editiion, by Ian H. Witten, Eibe Frank, Mark A. Hall
  2. An Introduction to Data Mining, 2nd edition, Pang-Ning Tan, Michael Steinbach, Vipin Kumar, Anuj Karpatne, Pearson, 2018
  3. For lab: Python Data Science Handbook by Jake VanderPlas https://jakevdp.github.io/PythonDataScienceHandbook/ (free ebook available no need to buy)


Dette er studietilbudet for studieår 2019-2020. Endringer kan komme.

Sist oppdatert: 10.12.2019

Historikk