Ich schreib kurz alles runter an das ich mich erinnere:
Aufgabe 1
CRISP DP schritte aufschreiben
Supervised Unsupervised erläutern
Reinforcement learning erläutern
Exploitation vs. Exploring
Aufgabe 2
Boxplot zeichnen (Werte für 25%(0,1), 50%(0,2), 75% (0,3)- waren iwelche geschwindigkeiten für irgendeinen lager
--> oberer unterer Whisker soll = 1,5 IQR sein
--> min max (0; 1,5) wert auch gegeben
--> in nächster teilaufgabe soll man erkennen, dass es sich bei bmin/max um putlier handelt, was kann man da machen nach dem verständnis von diesen lagern
Overfitting erläutern, maßnahme
BIAS VAR erläutern
Precision und Recall ausrechnen für Predictive Maintenance
ist der ML Algo gut (Nein, weil viele false negatives)
Aufgabe 3
Hot encoding durchführen
Green
Blue
Yellow
Blue
Yellow
Green
Red
Warum sind viele Features schlecht
PCA erläutern
aus einem Plot mit den Verteilungen auslesen wieviele PC um mehr als 90% der Varianz zu erklärem
Soll man werte scalen bevor man PCA durchführt?
Z-Score erläutern und formel angeben (Bruder was los, statistikklausur oder was)
weighted Gini Ausrechnen für Feature 1> 3 und mit einem anderen Splti vergleichen Feature 2> 3
gegeben war eien tabelle mit Feature 1 und Feature 2 mit werten und den target values 0 und 1
iwie gabs glaub bei den Splits also Feature X>Y keine angabe als was es dann klassifiziert wird
Node branch leaf erläutern - decision tree
Predictive reactive quality mit vor und nachteilen
---------------------
Zeit war gerade so ausreichend
kp mehr ob die aufgaben richtig zugeordnet sind...
es kam kein Deep learnign dran oder Energy forecast
kann gerne ergänzt werden