Data Mining at Universität Bamberg

Flashcards and summaries for Data Mining at the Universität Bamberg

Arrow Arrow

It’s completely free

studysmarter schule studium
d

4.5 /5

studysmarter schule studium
d

4.8 /5

studysmarter schule studium
d

4.5 /5

studysmarter schule studium
d

4.8 /5

Study with flashcards and summaries for the course Data Mining at the Universität Bamberg

Exemplary flashcards for Data Mining at the Universität Bamberg on StudySmarter:

Informationsgewinn

Exemplary flashcards for Data Mining at the Universität Bamberg on StudySmarter:

Gründe für Overfitting

Exemplary flashcards for Data Mining at the Universität Bamberg on StudySmarter:

Was versteht man unter Pruning?

Exemplary flashcards for Data Mining at the Universität Bamberg on StudySmarter:

Fehlerreduktions-Pruning

Exemplary flashcards for Data Mining at the Universität Bamberg on StudySmarter:

Ziel von Clusteringverfahren

Exemplary flashcards for Data Mining at the Universität Bamberg on StudySmarter:

Distanzmaße für Datensätze:

Exemplary flashcards for Data Mining at the Universität Bamberg on StudySmarter:

Gower Koeffizient

Exemplary flashcards for Data Mining at the Universität Bamberg on StudySmarter:

Vorgehensweise bei agglomerativen Verfahren:

Exemplary flashcards for Data Mining at the Universität Bamberg on StudySmarter:

Vorgehensweise für das partitionierende Verfahren

Exemplary flashcards for Data Mining at the Universität Bamberg on StudySmarter:

Erwartungsmaximierungsverfahren (EM Algorithmus) zum Clustering

Exemplary flashcards for Data Mining at the Universität Bamberg on StudySmarter:

Fuzzy Clustering

Exemplary flashcards for Data Mining at the Universität Bamberg on StudySmarter:

Einsatzgebiete von künstliche neuronale Netzen

Your peers in the course Data Mining at the Universität Bamberg create and share summaries, flashcards, study plans and other learning materials with the intelligent StudySmarter learning app.

Get started now!

Flashcard Flashcard

Exemplary flashcards for Data Mining at the Universität Bamberg on StudySmarter:

Data Mining

Informationsgewinn

Beschreibt die erwartete Reduktion der Entropie, wenn die Ausprägung a des Attributs A bekannt ist.

Data Mining

Gründe für Overfitting

  • Fehlerhafte Testdaten 
  • Geringe Aussagekraft der Daten 
  • Zu kleine Datenbasis

Data Mining

Was versteht man unter Pruning?

Nachträgliches modifizieren des Entscheidungsbaumes mit dem Ziel, die Fehlerklassifikationsquote zu verringern 

Abschneiden von überspezialisierten Ästen

Data Mining

Fehlerreduktions-Pruning

Derjenige Teilbaum T wird entfernt, der den Klassifikationsfehler auf der Validierungsmenge am stärksten verringert

Data Mining

Ziel von Clusteringverfahren

Ziel der Anwendung von Clustering-Verfahren ist das Erkennen und Bewerten von Clustern.

Beim Clustering sind die Klassen a priori unbekannt

Data Mining

Distanzmaße für Datensätze:

  • Hamming Distanz für nominale, ordinale und metrische Werte 
  • Manhatten Distanz für ordinale und metrische Werte 
  • Euklidische Distanz nur für metrische Werte

Data Mining

Gower Koeffizient

Zur Bestimmung der Distanz zweier Datensätze mit nominalen und numerischen Attributen:

Data Mining

Vorgehensweise bei agglomerativen Verfahren:

1. Ausgehend von m Clustern (Anzahl aller Elemente) 

2. Erstelle eine Distanzmatrix 

3. Vereinigung der beiden Cluster mit dem geringsten Abstand zu einem neuen Cluster. 

4. Wiederhole ab Schritt 2, bis sich alle Objekte in einem einzigen Cluster befinden.

Data Mining

Vorgehensweise für das partitionierende Verfahren

1. Wähle K Objekte zufällig als initiale Clustercentroide 

2. Ordne die Objekte jeweils dem Cluster zu, zu dessen Centroid der geringste Abstand vom Objekt besteht 

3. Bestimme in den Clustern die aktuellen Centroide 

4. Prüfe, ob alle Objekte den Clustern mit dem geringsten Abstand zum Centroiden zugeordnet sind, wenn nein, springe zu 2.


(Beispiel: K-Means)

Data Mining

Erwartungsmaximierungsverfahren (EM Algorithmus) zum Clustering

Basiert auf Wahrscheinlichkeitsverteilungen für die Clusterzugehörigkeit eines Objekts

Data Mining

Fuzzy Clustering

Ein Objekt kann zu verschiedenen Clustern gehören.

Die scharfe Trennung geht dadurch verloren

Data Mining

Einsatzgebiete von künstliche neuronale Netzen

  • Mustererkennung 
  • Erstellung von Klassifikations- oder Prognosemodellen 
  • Clusterbildung

Sign up for free to see all flashcards and summaries for Data Mining at the Universität Bamberg

Singup Image Singup Image
Wave

Other courses from your degree program

For your degree program Data Mining at the Universität Bamberg there are already many courses on StudySmarter, waiting for you to join them. Get access to flashcards, summaries, and much more.

Back to Universität Bamberg overview page

IT-Prozess- und Wertmanagement

Prozessorientierte Informationssysteme POI

What is StudySmarter?

What is StudySmarter?

StudySmarter is an intelligent learning tool for students. With StudySmarter you can easily and efficiently create flashcards, summaries, mind maps, study plans and more. Create your own flashcards e.g. for Data Mining at the Universität Bamberg or access thousands of learning materials created by your fellow students. Whether at your own university or at other universities. Hundreds of thousands of students use StudySmarter to efficiently prepare for their exams. Available on the Web, Android & iOS. It’s completely free.

Awards

Best EdTech Startup in Europe

Awards
Awards

EUROPEAN YOUTH AWARD IN SMART LEARNING

Awards
Awards

BEST EDTECH STARTUP IN GERMANY

Awards
Awards

Best EdTech Startup in Europe

Awards
Awards

EUROPEAN YOUTH AWARD IN SMART LEARNING

Awards
Awards

BEST EDTECH STARTUP IN GERMANY

Awards