en_GB
Hold Ctrl-tasten nede. Trykk på + for å forstørre eller - for å forminske.

DAT640_1

Informasjonsgjenfinning og tekstutvinning

Dette er studietilbudet for studieår 2020-2021.


Kurset tilbyr en innføring i teknikker og metoder for behandling, uthenting og søk i store tekstlige datasamlinger. Kurset tar for seg ulike applikasjoner og gir en "hands-on" eksperimentering med "state-of-the-art" algoritmer ved hjelp av eksisterende programvareverktøy og datasamlinger.

Læringsutbytte

Kunnskap:
  • Teori og praksis innen datautvinning og informasjonssøk. Ulike metoder og teknikker vil bli gjennomgått.

Ferdigheter:
  • Prosessere og forberede storskala tekstlige datasamlinger for utvinning og søk.
  • Bruke clustering, klassifisering og rangeringsmetoder til en rekke informasjonstilgangsoppgaver.
  • Evaluere resultater og utføre feilanalyse.

Generell kompetanse:
  • Forstå styrker og begrensninger av populære datautvinning- og informasjonssøkteknikker. Kunne identifisere gode forretningsapplikasjoner og være aktiv deltaker og lede slike prosjekter.

Innhold

  • Søkemotorarkitektur
  • Tekstpreprosessering og indeksering
  • Gjenfinningsmetoder (vektor-rom modell, probabilistiske modeller, learning-to-rank, nevrale modeller)
  • Gjenfinningsevaluering
  • Query modellering, relevant tilbakemelding
  • Websøk (gjennomsøking, indeksering, lenkeanalyse)
  • Semantisk søk (kunnskapsbaser, enhetsgjenfinning, enhetslenking)
  • Gruppering av tekst
  • Kategorisering av tekst
  • Emneanalyse
  • Meningsutvinning og sentimentanalyse

Forkunnskapskrav

Ingen.

Eksamen/vurdering

Prosjektoppgave og skriftlig eksamen
Vekting Varighet Karakter Hjelpemiddel
Prosjektoppgave2/5 A - F
Skriftlig eksamen3/54 timerA - F
Prosjektet gjennomføres individuelt eller i grupper på 2 eller 3. Prosjektet gjennomføres i de grupper som blir satt opp av faglærer. Hvis en student ikke består prosjektet, må hun/han ta denne delen neste gang emnet foreleses.
Hjelpemidler til eksamen:alt skriftlig og trykt materiale, og godkjent enkel kalkulator

Fagperson(er)

Emneansvarlig
Krisztian Balog
Instituttleder
Tom Ryen

Arbeidsformer

6 timer forelesning/laboratorieøvinger pr. uke.

Overlapping

Emne Reduksjon (SP)
Websøk og data mining (DAT630_1) 5

Åpent for

Enkeltemner ved Det teknisk-naturvitenskaplige fakultet
Datateknologi - Master program
Kybernetikk og robotteknologi - Master i teknologi/siv.ing. - 5 år

Emneevaluering

Skjer vanligvis gjennom skjema og/eller samtaler i henhold til gjeldende retningslinjer.

Litteratur


Lenke til pensumliste


Dette er studietilbudet for studieår 2020-2021.

Sist oppdatert: 30.09.2020

Historikk