Zum Inhalt wechseln
LG4ML
  • Start
  • Idee
  • Projekte
  • Über uns
  • Wiki
  • Blog

Buzzwords

7
  • Transfer Learning
  • Machine Learning
  • Künstliche Intelligenz
  • Deep Learning
  • Data Science Workflow
  • Computer Vision
  • Big Data

Computer Vision

3
  • YOLOv4
  • Object Tracking
  • Frame Differencing

Grundlagen

14
  • Unüberwachtes Lernen
  • Überwachtes Lernen
  • Trainingsphase
  • Sampling
  • Regression
  • Preprocessing
  • Metrics
  • Klassifikation
  • Hyperparameter Tuning
  • Hyperparameter
  • Distanzmetriken
  • Data Science Workflow
  • Data Exploration
  • Cross Validation

Lernverfahren

8
  • Support Vector Machine
  • Principal Component Analysis
  • Perceptron
  • Logistische Regression
  • Lineare Regression
  • K-Nearest-Neighbours
  • K-Means
  • Decision Tree

Neuronale Netze

5
  • Verlustfunktion
  • Transfer Learning
  • Künstliches Neuron
  • Early Stopping
  • Aktivierungsfunktion

Preprocessing

8
  • Value Imputation
  • Scaling
  • Principal Component Analysis
  • Outlier Detection Basic
  • Outlier Detection Advanced
  • Frequenz Filter
  • Feature Engineering
  • Data Augmentation

Python Pakete

1
  • Data-Science Pakete
View Categories
  • Startseite
  • Docs
  • Grundlagen
  • Metrics

Metrics

3 min read

Metrics oder auch zu deutsch Metriken sind Kennzahlen, die zur Bewertung der Performance von Machine Learning Modellen genutzt werden. Je nach Art des Problems, also entweder Klassifikation oder Regression, stehen verschiedene Metriken zur Auswahl. Die Metriken werden jeweils berechnet, indem die wahren Werte (auch Ground Truth genannt) mit den Vorhersagen des Modells verglichen werden – also allgemein ausgedrückt als

metric = f(y-true, y-pred)

wobei die Funktion f je nach Metric variiert. Nachfolgend werden die wichtigsten Metriken für Klassifikation und Regression vorgestellt.

Regression #

Da Regressionsprobleme kontinuierlich sind, geben alle Metriken im Bereich der Regression an, wie weit die wahren Werte und die Vorhersagen auseinander liegen – also wie groß die Differenz zwischen ihnen ist. Dabei werden die folgenden drei Metriken am häufigsten verwendet:

  • Mean Absolute Error (MAE): Der Mean-Absolute-Error gibt an, wie weit die Vorhersagen mit Mittel absolut von den wahren Werten abweichen. Da nur die absolute Differenz betrachtet wird, werden große Abweichungen  im Verhältnis genau so viel bestraft wie Abweichungen.
  • Mean Squared Error (MSE): Der Mean-Squared-Error gibt an, wie groß im Mittel die quadrierten Abweichungen zwischen wahren Werten und Vorhersagen sind. Im Gegensatz zum Mean Absolute Error fallen große Abweichungen mehr ins Gewicht, da die Abweichung quadriert wird. Beim MSE ist zu beachten, dass die Metrik nicht direkt auch die Skalenbereiche der Werte gelegt werden kann.
  • Root Mean Squared Error (RMSE): Der Root-Mean-Squared-Error ist die Wurzel des MSE. Der Vorteil des RMSE besteht unter anderem darin, dass eine direkte Vergleichbarkeit mit der Skala der Werte besteht.

Klassifikation #

Klassifikationsprobleme beschäftigen sich mit einer endlichen Anzahl an Klassen, in die Datenpunkte eingeordnet werden. Die Metriken für Klassifikation basieren darauf zu überprüfen, ob ein Datenpunkt in die richtige Klasse eingeordnet wurde oder nicht. Nachfolgend wird zunächst die sogenannte Confusion Matrix vorgestellt. Daran können dann die weiteren Metriken erläutert und gezeigt werden.

Confusion Matrix #

Generell stellen Konfusionsmatrizen einen Vergleich zwischen tatsächlicher Klasse (Label) und vorhergesagter Klasse (Prediction) dar. Je nachdem wie viele Klassen das Problem hat, gibt es entsprechend viele Einträge auf den Seiten und damit Zellen in der Matrix. Die Felder in der Diagonale stehen für richtig klassifizierte Datenpunkte, alles weiteren Felder stellen die fehlerhaft klassifizierten Datenpunkte dar. Die Konfusionsmatrix für binäre Klassifikationsprobleme besteht aus nur 2*2=4 Feldern. Sie könnte bspw. so aussehen: 

Abbildung 1: Binäre Konfusionsmatrix. TN = True Negatives, TP = True Positives, FN = False Negatives, FP = False Positives (Quelle)

Für binäre Probleme werden korrekte Predictions auch als True Positives und True Negatives bezeichnet, also vorhersagen, die korrekt getroffen wurden. Falsche Punkte werden als False Positives (= fälschlicherweise als positiv klassifiziert) bzw. False Negatives (= fälschlicherweise  bezeichnet. Daraus ergeben sich die folgenden Metriken:

  • Accuracy = Anzahl korrekt vorhergesagter Datenpunkte / Anzahl aller Datenpunkte
  • Recall (auch Sensitivity genannt)
    = Anzahl vorhergesagter Positives / Anzahl aller Positives
    = Anteil der korrekt als Positiv vorhersagten Punkte
    = (True Positives) / (True Positives + False Negatives)
  • Specificity = Anzahl vorhergesagter Negatives / Anzahl aller Negatives
    = Anteil der korrekt als Negativ vorhersagten Punkte)
    = (True Negatives) / (True Negatives + False Positives)
  • Precision = Anzahl korrekt als Positiv vorhergesagter Punkte / Anzahl aller als Positives vorhergesagten Punkte
    = (True Positives) / (True Positives + False Positives)
  • F1-Score = 2 * [ (Precision * Recall) / (Precision + Recall) ]

Eine Konfusionsmatrix für ein Klassifikationsproblem mit mehr als zwei Klassen könnte bspw. so aussehen:

Abbildung 2: Eine Konfusionsmatrix für ein Klassifikationsproblem mit 13 Klassen (Quelle).

Weiterführende Links:
Confusion matrix (Scikit-Learn): https://scikit-learn.org/stable/auto_examples/model_selection/plot_confusion_matrix.html 
Accuracy, Precision, Recall or F1: https://towardsdatascience.com/accuracy-precision-recall-or-f1-331fb37c5cb9 
Data Science Performance Metric for Everyone: https://towardsdatascience.com/data-science-performance-metrics-for-everyone-4d68f4859eef 

Updated on 11/03/2022

What are your Feelings

  • Happy
  • Normal
  • Sad
Share This Article :
  • Facebook
  • X
  • LinkedIn
  • Pinterest

Schreibe einen Kommentar Antworten abbrechen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Inhalt
  • Regression
  • Klassifikation
    • Confusion Matrix

LG4ML

Promoting Machine Learning from Lüneburg!

© 2025 LG4ML

Navigation

  • Kontakt
  • Datenschutzerklärung
  • Impressum

Folge uns auf

Github Slack Instagram

Made with 🍺 in Lüneburg.

Cookie-Hinweis
Wir verwenden Cookies auf unserer Website, um Ihnen die bestmögliche Erfahrung zu bieten, indem wir uns an Ihre Präferenzen und wiederholten Besuche erinnern. Wenn Sie auf "Alle akzeptieren" klicken, erklären Sie sich mit der Verwendung aller Cookies einverstanden. Sie können jedoch die Einstellungen besuchen, um eine kontrollierte Zustimmung zu erteilen.
EinstellungenAlle akzeptieren
Zustimmung verwalten

Privacy Overview

This website uses cookies to improve your experience while you navigate through the website. Out of these, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may affect your browsing experience.
Necessary
immer aktiv
Necessary cookies are absolutely essential for the website to function properly. These cookies ensure basic functionalities and security features of the website, anonymously.
CookieDauerBeschreibung
cookielawinfo-checkbox-analytics11 monthsThis cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional11 monthsThe cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary11 monthsThis cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others11 monthsThis cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance11 monthsThis cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy11 monthsThe cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.
Functional
Functional cookies help to perform certain functionalities like sharing the content of the website on social media platforms, collect feedbacks, and other third-party features.
Performance
Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.
Analytics
Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics the number of visitors, bounce rate, traffic source, etc.
Advertisement
Advertisement cookies are used to provide visitors with relevant ads and marketing campaigns. These cookies track visitors across websites and collect information to provide customized ads.
Others
Other uncategorized cookies are those that are being analyzed and have not been classified into a category as yet.
SPEICHERN & AKZEPTIEREN