Grundlæggende Data Science (GDS)

NDAB23000U - SCIENCE

Passed: 84%, Average grade: 8.23, Median grade: 7

Description

Dette kursus gennemgår de forskellige komponenter der indgår i en komplet data science pipeline, fra indsamling, processering og oprensning af data, til implementation af statistiske modeller, og udforskning af data gennem visualisering. Kurset vil omhandle håndtering af data fra flere kilder, og der lægges vægt på fundamentelle udfordringer i data science, såsom bias i data, og hvordan dette kan påvirke beslutningstagning på baggrund og trænede modeller.

Viden om

Model design og implementation
- Basale begreber i modellering
- Struktureret model design
- Model test strategier
Data udforskning og visualisering
- Eksplorativ data analyse
- Nøglebegreber i visualisering

Færdigheder

Skrive scripts til indsamling og processering af data, og indlæsning af struktureret tekst
Design af modulær pipeline til dataanalyse af et konkret problem
Design af meningsfulde visualiseringer

Kompetencer

Den studerende forstår de centrale udfordringer i at designe et effektivt data science work-flow, der understøtter data fra flere kilder og flere forskellige analyser. Den studerende

er i stand til at designe og forstå modulære data science pipelines
kan producere meningsfulde visualiseringer af data
kan klart og præcist dokumentere data science workflows, metoder og resultater

Recommended qualifications

Den studerende bør have grundlæggende viden om programmering, algoritmer, lineær algebra, matematisk analyse og statistik. Denne viden kan opnås via følgende kurser:

PoP

MASD og MAD eller MatIntro og SS

DMA eller IDMA (tidligere kaldet DMFS). IDMA kan følges sideløbende i blok 3.

LinAlgDat (LinAlgDat kan følges sideløbende i blok 4)

Coordinators

Desmond Elliott

de@di.ku.dk

Exam

Assignment

Course Info

Level: Bachelor

ECTS: 7.5

Block(s): 3

Group(s): A

Go to official page

Department(s)

Computer Science

Workload

Lectures	36h
Preparation	78h
Theory Exercises	36h
Project Work	56h

Total: 206h