Business Intelligence, Data Mining an der Duale Hochschule Baden-Württemberg | Karteikarten & Zusammenfassungen

Lernmaterialien für Business intelligence, Data Mining an der Duale Hochschule Baden-Württemberg

Greife auf kostenlose Karteikarten, Zusammenfassungen, Übungsaufgaben und Altklausuren für deinen Business intelligence, Data Mining Kurs an der Duale Hochschule Baden-Württemberg zu.

TESTE DEIN WISSEN

Beschreibe die Varianzanalyse.

Lösung anzeigen
TESTE DEIN WISSEN
  • Untersucht wie Regressionsanalyse Einfluss von unabhängigen Variablen auf abhängige Variablen
  • Unterschied zur Regressionsanalyse:
    • unabhängige Variablen = nominales Skalenniveau
    • abhängige Variablen = metrisches Skalenniveau


Lösung ausblenden
TESTE DEIN WISSEN

Nenne und beschreibe 3 Verfahren die der Clusteranalyse zuzuordnen sind.

Lösung anzeigen
TESTE DEIN WISSEN
  • partitionierende Clusterverfahren
    • best. Clusterzahl & Gruppierung vorgegeben 
    •  Umgruppierung folgt
  • hierarchisch-divisive Clusterverfahren
    • bei Verfahrenstart alle Objekte in Cluster
    • Zerlegung folgt
  • hierarchisch-agglomerative Clusterverfahren​​​​
    • bei Start: jedes Objekt = eigener Cluster
    • Zusammenfassung folgt
Lösung ausblenden
TESTE DEIN WISSEN

Welches Skalenniveau wird für die Regressionsanalyse benötigt? Welche Abhängigkeiten bestehen in den meisten Fällen?

Lösung anzeigen
TESTE DEIN WISSEN
  • Nötig für abhängige & unabhängige Variablen ist metrisches Skalenniveau d.h. Kardinalskala.
  • Ausnahme: Dummy-Variablen = binäre unabhängige Variablen --> Nominalskala ausreichend.
  • Meist Annahme linearer Abhängigkeiten.


Lösung ausblenden
TESTE DEIN WISSEN

Beschreibe Anwendungsgebiete von Dummy-Variablen.

Lösung anzeigen
TESTE DEIN WISSEN
  • Probleme bei Modellannahmen oft bedingt durch Strukturbrüche. --> Schätzung der linearen Regressionsgerade führt zu unbefriedigenden Ergebnissen.
    --> Lösung: Einsatz von Dummy-Variablen zur Modellierung von Niveau- & Steigungsänderungen
  • Aufnahmen nominal skalierter Merkmale durch Dummy-Variablen als erklärende Größen in Regressionsanalyse.
    --> Falls nominal skalierte Variable m untersch. Ausprägungen hat (Haarfarben), dann m-1 Dummy-Variablen nötig
    --> Anzahl der Dummy-Variablen sollte möglichst gering sein
    --> Alternative zu Regressionsanalyse mit Dummy-Variablen bei gemischter Skalierung der erklärenden Größen = Kovarianzanalyse


Lösung ausblenden
TESTE DEIN WISSEN

Beschreibe den Grundgedanken der Varianzanalyse.

Lösung anzeigen
TESTE DEIN WISSEN
  • Zerlegung der Gesamtstreuung in Streuung innerhalb der Gruppen
    & in eine Streuung zwischen den Gruppen (=Faktorkombinationen)
  • Streuungen über Varianzen gemessen & in Beziehung zueinander gesetzt.
  • F-Tests zur Messung der Signifikanz.
  • Bei mehrfaktorieller Varianzanalyse Wechselwirkunge zw. erklärenden Größen möglich.


Lösung ausblenden
TESTE DEIN WISSEN

Beschreibe die Clusteranalyse.

Lösung anzeigen
TESTE DEIN WISSEN
  • versch. Verfahren zur Gruppenbildung
  • Bildung homogener Teilmengen aus heterogener Objekt-/Personengesamtheit
  • Gruppenmitglieder sollen möglichst ähnlich sein
  • Gruppen sollen möglichst untersch. sein


Lösung ausblenden
TESTE DEIN WISSEN

Nenne mögliche Befragungsprobleme.

Lösung anzeigen
TESTE DEIN WISSEN
  • Antwortverweigerung (mündlich)
  • Falschangaben (schriftlich)
  • Fehlende Motivation (zu lange Befragungen)
  • Fehlende Anonymität (mündlich)
  • Zu hohe Komplexität der Fragen (schriftlich)
  • Fehlende Repräsentativtät (beide)
Lösung ausblenden
TESTE DEIN WISSEN

Welche Methode wird zur Schätzung der Regressionsfunktion verwendet? Was ist das Ziel der Schätzung?

Lösung anzeigen
TESTE DEIN WISSEN
  • Schätzung meist über KQ-Methode ('Methode der kleinsten Quadrate')
  • Ziel: quadrierte Abstand zw. realisierten & geschätzten Werten ('Restgrößen') zu minimieren
Lösung ausblenden
TESTE DEIN WISSEN

Nenne Eigenschaften die den Stichprobenumfang beeinflussen. Wofür kann der Umfang verwendet werden? Welche Faustregel gibt es für den Stichprobenumfang?

Lösung anzeigen
TESTE DEIN WISSEN
  • Eigenschaften
    • gewünschte Genauigkeit
    • Streuung des gesuchten Merkmals in der Grundgesamtheit
    • Große der Grundgesamtheit (schwacher Einfluss)
    • Praxis: meist Zeit und Kosten als wichtigster Faktor
  • Verwendung
    • für Verfahren der Zufallsauswahl
  • Faustregel
    • Stichprobenumfang sollte immer > 30 liegen
    • bei großen Grundgesamtheiten mind. xxx-Bereich '3-stellig'
Lösung ausblenden
TESTE DEIN WISSEN

Welche Kennzahl wird zum Vergleich verschiedener Regressionsanalysen verwendet ?

Lösung anzeigen
TESTE DEIN WISSEN
  • Das korrigierte R^2, dieses berücksichtigt nämlich die Anzahl der erklärenden (unabhängigen) Variablen
Lösung ausblenden
TESTE DEIN WISSEN

Beschreibe häufig vorkommende stat. Fehler der Datenerhebung.

Lösung anzeigen
TESTE DEIN WISSEN
  • systematisch (stichprobenfremde) Fehler
    • Fehler die bei jeder Stichprobe und Vollerhebung auftreten können
    • bspw. 'Nichbeantwortungsproblematik'
  • Stichprobenfehler
    • fehlende Repräsentativität der Stichprobe (Minimierung durch geeignete Auswahlverfahren)
Lösung ausblenden
TESTE DEIN WISSEN

Wie unterscheiden sich die Verfahren der Clusteranalyse zur Diskriminanzanalyse?

Lösung anzeigen
TESTE DEIN WISSEN
  • Gruppenbildung erst im Laufe des Verfahrens aus Merkmalausprägungen der betrachteten Variablen
  • Clusteranalysen für versch. Skalenniveaus durchführbar
  • Vorgehensweisen je nach Skalierung unterschiedlich
Lösung ausblenden
  • 173927 Karteikarten
  • 3586 Studierende
  • 205 Lernmaterialien

Beispielhafte Karteikarten für deinen Business intelligence, Data Mining Kurs an der Duale Hochschule Baden-Württemberg - von Kommilitonen auf StudySmarter erstellt!

Q:

Beschreibe die Varianzanalyse.

A:
  • Untersucht wie Regressionsanalyse Einfluss von unabhängigen Variablen auf abhängige Variablen
  • Unterschied zur Regressionsanalyse:
    • unabhängige Variablen = nominales Skalenniveau
    • abhängige Variablen = metrisches Skalenniveau


Q:

Nenne und beschreibe 3 Verfahren die der Clusteranalyse zuzuordnen sind.

A:
  • partitionierende Clusterverfahren
    • best. Clusterzahl & Gruppierung vorgegeben 
    •  Umgruppierung folgt
  • hierarchisch-divisive Clusterverfahren
    • bei Verfahrenstart alle Objekte in Cluster
    • Zerlegung folgt
  • hierarchisch-agglomerative Clusterverfahren​​​​
    • bei Start: jedes Objekt = eigener Cluster
    • Zusammenfassung folgt
Q:

Welches Skalenniveau wird für die Regressionsanalyse benötigt? Welche Abhängigkeiten bestehen in den meisten Fällen?

A:
  • Nötig für abhängige & unabhängige Variablen ist metrisches Skalenniveau d.h. Kardinalskala.
  • Ausnahme: Dummy-Variablen = binäre unabhängige Variablen --> Nominalskala ausreichend.
  • Meist Annahme linearer Abhängigkeiten.


Q:

Beschreibe Anwendungsgebiete von Dummy-Variablen.

A:
  • Probleme bei Modellannahmen oft bedingt durch Strukturbrüche. --> Schätzung der linearen Regressionsgerade führt zu unbefriedigenden Ergebnissen.
    --> Lösung: Einsatz von Dummy-Variablen zur Modellierung von Niveau- & Steigungsänderungen
  • Aufnahmen nominal skalierter Merkmale durch Dummy-Variablen als erklärende Größen in Regressionsanalyse.
    --> Falls nominal skalierte Variable m untersch. Ausprägungen hat (Haarfarben), dann m-1 Dummy-Variablen nötig
    --> Anzahl der Dummy-Variablen sollte möglichst gering sein
    --> Alternative zu Regressionsanalyse mit Dummy-Variablen bei gemischter Skalierung der erklärenden Größen = Kovarianzanalyse


Q:

Beschreibe den Grundgedanken der Varianzanalyse.

A:
  • Zerlegung der Gesamtstreuung in Streuung innerhalb der Gruppen
    & in eine Streuung zwischen den Gruppen (=Faktorkombinationen)
  • Streuungen über Varianzen gemessen & in Beziehung zueinander gesetzt.
  • F-Tests zur Messung der Signifikanz.
  • Bei mehrfaktorieller Varianzanalyse Wechselwirkunge zw. erklärenden Größen möglich.


Mehr Karteikarten anzeigen
Q:

Beschreibe die Clusteranalyse.

A:
  • versch. Verfahren zur Gruppenbildung
  • Bildung homogener Teilmengen aus heterogener Objekt-/Personengesamtheit
  • Gruppenmitglieder sollen möglichst ähnlich sein
  • Gruppen sollen möglichst untersch. sein


Q:

Nenne mögliche Befragungsprobleme.

A:
  • Antwortverweigerung (mündlich)
  • Falschangaben (schriftlich)
  • Fehlende Motivation (zu lange Befragungen)
  • Fehlende Anonymität (mündlich)
  • Zu hohe Komplexität der Fragen (schriftlich)
  • Fehlende Repräsentativtät (beide)
Q:

Welche Methode wird zur Schätzung der Regressionsfunktion verwendet? Was ist das Ziel der Schätzung?

A:
  • Schätzung meist über KQ-Methode ('Methode der kleinsten Quadrate')
  • Ziel: quadrierte Abstand zw. realisierten & geschätzten Werten ('Restgrößen') zu minimieren
Q:

Nenne Eigenschaften die den Stichprobenumfang beeinflussen. Wofür kann der Umfang verwendet werden? Welche Faustregel gibt es für den Stichprobenumfang?

A:
  • Eigenschaften
    • gewünschte Genauigkeit
    • Streuung des gesuchten Merkmals in der Grundgesamtheit
    • Große der Grundgesamtheit (schwacher Einfluss)
    • Praxis: meist Zeit und Kosten als wichtigster Faktor
  • Verwendung
    • für Verfahren der Zufallsauswahl
  • Faustregel
    • Stichprobenumfang sollte immer > 30 liegen
    • bei großen Grundgesamtheiten mind. xxx-Bereich '3-stellig'
Q:

Welche Kennzahl wird zum Vergleich verschiedener Regressionsanalysen verwendet ?

A:
  • Das korrigierte R^2, dieses berücksichtigt nämlich die Anzahl der erklärenden (unabhängigen) Variablen
Q:

Beschreibe häufig vorkommende stat. Fehler der Datenerhebung.

A:
  • systematisch (stichprobenfremde) Fehler
    • Fehler die bei jeder Stichprobe und Vollerhebung auftreten können
    • bspw. 'Nichbeantwortungsproblematik'
  • Stichprobenfehler
    • fehlende Repräsentativität der Stichprobe (Minimierung durch geeignete Auswahlverfahren)
Q:

Wie unterscheiden sich die Verfahren der Clusteranalyse zur Diskriminanzanalyse?

A:
  • Gruppenbildung erst im Laufe des Verfahrens aus Merkmalausprägungen der betrachteten Variablen
  • Clusteranalysen für versch. Skalenniveaus durchführbar
  • Vorgehensweisen je nach Skalierung unterschiedlich
Business intelligence, Data Mining

Erstelle und finde Lernmaterialien auf StudySmarter.

Greife kostenlos auf tausende geteilte Karteikarten, Zusammenfassungen, Altklausuren und mehr zu.

Jetzt loslegen

Das sind die beliebtesten StudySmarter Kurse für deinen Studiengang Business intelligence, Data Mining an der Duale Hochschule Baden-Württemberg

Für deinen Studiengang Business intelligence, Data Mining an der Duale Hochschule Baden-Württemberg gibt es bereits viele Kurse, die von deinen Kommilitonen auf StudySmarter erstellt wurden. Karteikarten, Zusammenfassungen, Altklausuren, Übungsaufgaben und mehr warten auf dich!

Das sind die beliebtesten Business intelligence, Data Mining Kurse im gesamten StudySmarter Universum

Business Intelligence

Technische Hochschule Mittelhessen

Zum Kurs
Business Intelligence

FernUniversität in Hagen

Zum Kurs
Business Intelligence

Technische Hochschule Mittelhessen

Zum Kurs
Business Intelligence

FernUniversität in Hagen

Zum Kurs

Die all-in-one Lernapp für Studierende

Greife auf Millionen geteilter Lernmaterialien der StudySmarter Community zu
Kostenlos anmelden Business intelligence, Data Mining
Erstelle Karteikarten und Zusammenfassungen mit den StudySmarter Tools
Kostenlos loslegen Business intelligence, Data Mining