Gedächtnisprotokoll 2023

  • Ich schreib kurz alles runter an das ich mich erinnere:


    Aufgabe 1
    CRISP DP schritte aufschreiben

    Supervised Unsupervised erläutern

    Reinforcement learning erläutern

    Exploitation vs. Exploring


    Aufgabe 2
    Boxplot zeichnen (Werte für 25%(0,1), 50%(0,2), 75% (0,3)- waren iwelche geschwindigkeiten für irgendeinen lager

    --> oberer unterer Whisker soll = 1,5 IQR sein

    --> min max (0; 1,5) wert auch gegeben

    --> in nächster teilaufgabe soll man erkennen, dass es sich bei bmin/max um putlier handelt, was kann man da machen nach dem verständnis von diesen lagern


    Overfitting erläutern, maßnahme


    BIAS VAR erläutern

    Precision und Recall ausrechnen für Predictive Maintenance

    ist der ML Algo gut (Nein, weil viele false negatives)


    Aufgabe 3

    Hot encoding durchführen

    Green

    Blue

    Yellow

    Blue

    Yellow

    Green

    Red


    Warum sind viele Features schlecht

    PCA erläutern

    aus einem Plot mit den Verteilungen auslesen wieviele PC um mehr als 90% der Varianz zu erklärem

    Soll man werte scalen bevor man PCA durchführt?


    Z-Score erläutern und formel angeben (Bruder was los, statistikklausur oder was)



    weighted Gini Ausrechnen für Feature 1> 3 und mit einem anderen Splti vergleichen Feature 2> 3

    gegeben war eien tabelle mit Feature 1 und Feature 2 mit werten und den target values 0 und 1
    iwie gabs glaub bei den Splits also Feature X>Y keine angabe als was es dann klassifiziert wird

    Node branch leaf erläutern - decision tree


    Predictive reactive quality mit vor und nachteilen

    ---------------------

    Zeit war gerade so ausreichend

    kp mehr ob die aufgaben richtig zugeordnet sind...

    es kam kein Deep learnign dran oder Energy forecast
    kann gerne ergänzt werden:)