Grundlæggende Data Science (GDS)
NDAB23000U - SCIENCE
Passed: 84%, Average grade: 8.23, Median grade: 7
Description
Dette kursus gennemgår de forskellige komponenter der indgår i en komplet data science pipeline, fra indsamling, processering og oprensning af data, til implementation af statistiske modeller, og udforskning af data gennem visualisering. Kurset vil omhandle håndtering af data fra flere kilder, og der lægges vægt på fundamentelle udfordringer i data science, såsom bias i data, og hvordan dette kan påvirke beslutningstagning på baggrund og trænede modeller.
Viden om
- Model design og implementation
- Basale begreber i modellering
- Struktureret model design
- Model test strategier
- Data udforskning og visualisering
- Eksplorativ data analyse
- Nøglebegreber i visualisering
Færdigheder
- Skrive scripts til indsamling og processering af data, og indlæsning af struktureret tekst
- Design af modulær pipeline til dataanalyse af et konkret problem
- Design af meningsfulde visualiseringer
Kompetencer
Den studerende forstår de centrale udfordringer i at designe et effektivt data science work-flow, der understøtter data fra flere kilder og flere forskellige analyser. Den studerende
- er i stand til at designe og forstå modulære data science pipelines
- kan producere meningsfulde visualiseringer af data
- kan klart og præcist dokumentere data science workflows, metoder og resultater
Recommended qualifications
Den studerende bør have grundlæggende viden om programmering, algoritmer, lineær algebra, matematisk analyse og statistik. Denne viden kan opnås via følgende kurser:PoP
MASD og MAD eller MatIntro og SS
DMA eller IDMA (tidligere kaldet DMFS). IDMA kan følges sideløbende i blok 3.
LinAlgDat (LinAlgDat kan følges sideløbende i blok 4)
Coordinators
Desmond Elliott
de@di.ku.dk
Exam
Assignment
Course Info
Department(s)
- Computer Science
Workload
| Lectures | 36h |
| Preparation | 78h |
| Theory Exercises | 36h |
| Project Work | 56h |
Total: 206h