Data Sience an der TU München

Arrow Arrow

Komplett kostenfrei

studysmarter schule studium
d

4.5 /5

studysmarter schule studium
d

4.8 /5

studysmarter schule studium
d

4.5 /5

studysmarter schule studium
d

4.8 /5

Lerne jetzt mit Karteikarten und Zusammenfassungen für den Kurs Data Sience an der TU München.

Beispielhafte Karteikarten für Data Sience an der TU München auf StudySmarter:

Was definiert eine Maschine?

Beispielhafte Karteikarten für Data Sience an der TU München auf StudySmarter:

Was versteht man unter Mittelwert/Durchschnitt?

Beispielhafte Karteikarten für Data Sience an der TU München auf StudySmarter:

Wie macht eine Maschine Erfahrungen?

Beispielhafte Karteikarten für Data Sience an der TU München auf StudySmarter:

Was versteht man bei der Datenqualität und Datenaufbereitung unter Umformen und Manipulieren?

Beispielhafte Karteikarten für Data Sience an der TU München auf StudySmarter:

Was versteht man unter Kausalität?

Beispielhafte Karteikarten für Data Sience an der TU München auf StudySmarter:

Was versteht man bei der Datenqualität und Datenaufbereitung unter Menge?

Beispielhafte Karteikarten für Data Sience an der TU München auf StudySmarter:

Was versteht man bei der Datenqualität und Datenaufbereitung unter Zusammenführen mehrerer Datenquellen?

Beispielhafte Karteikarten für Data Sience an der TU München auf StudySmarter:

Wie kann man Daten untersuchen?

Beispielhafte Karteikarten für Data Sience an der TU München auf StudySmarter:

Was versteht man unter Kovarianz?

Beispielhafte Karteikarten für Data Sience an der TU München auf StudySmarter:

Was versteht man unter Varianz & Standardabweichung?

Beispielhafte Karteikarten für Data Sience an der TU München auf StudySmarter:

Was versteht man bei der Datenqualität und Datenaufbereitung unter Compliance?

Beispielhafte Karteikarten für Data Sience an der TU München auf StudySmarter:

Was sind Datenbanken und wieso werden Sie benötigt?

Kommilitonen im Kurs Data Sience an der TU München. erstellen und teilen Zusammenfassungen, Karteikarten, Lernpläne und andere Lernmaterialien mit der intelligenten StudySmarter Lernapp. Jetzt mitmachen!

Jetzt mitmachen!

Flashcard Flashcard

Beispielhafte Karteikarten für Data Sience an der TU München auf StudySmarter:

Data Sience

Was definiert eine Maschine?

○ Mathematisches Modells
○ Zweck und Einsatzgebiet des Modells (
Klassifikation (Clustering), Regression
○ Parametrisierung (Anzahl der Cluster,
Linear bei Regression)

Data Sience

Was versteht man unter Mittelwert/Durchschnitt?

○ Summe aller Elemente/Anzahl Elemente
○ Gewicht = [12, 13, 14, 15, 137] => avg = 38.2

Data Sience

Wie macht eine Maschine Erfahrungen?

Training/Lernen mittels vorhandener
und bewerteter Daten

Data Sience

Was versteht man bei der Datenqualität und Datenaufbereitung unter Umformen und Manipulieren?

○ Datenformat (JSON, XML, CSV)
○ Datentypen und Datenstrukturen (List, Dict)
○ Skalierung
○ Sortierung und Gruppierung (Histogram, Buckets von Wertebereichen)

Data Sience

Was versteht man unter Kausalität?

○ Beziehung zwischen Ursache und Wirkung
○ Obwohl eine starke Korrelation besteht muß keine Kausalität vorhanden sein
○ Damit ist die Korrelation nur scheinbar (verfälschte Daten, zu wenige Daten, anderen Zusammenhang nicht bedacht)

Data Sience

Was versteht man bei der Datenqualität und Datenaufbereitung unter Menge?

○ gibt es genügend oder gibt es “zu viele”
○ Reduktion der vorhandenen Daten auf das wesentliche für die Fragestellung
○ Für ML: Aufteilung in Trainings und Testmenge

Data Sience

Was versteht man bei der Datenqualität und Datenaufbereitung unter Zusammenführen mehrerer Datenquellen?

○ Eigenschaften die als Relation dienen (siehe relationale Datenbanken)
○ Datenquellen beziehen sich auf denselben Datenauszug (zeitlich, Kunden, örtlich)
○ Umwandlung der Datenformate und Speicherung in einheitlichen Format

Data Sience

Wie kann man Daten untersuchen?

Statistik
○ Mean, Median, Range
○ Quartile
○ Standardabweichung
○ Ausreißer
○ Korrelationen

Visualisierung
○ Verteilungskurve (Histogramme)
○ Korrelationsdarstellungen
○ Scheinkorellation

Data Sience

Was versteht man unter Kovarianz?

● Zusammenhang (oder nicht) zwischen zwei Eigenschaften

       a = [1, 3, 5]
b = [7, 5, 3]
x = cov(a,b)
x = -4.0

Positiver Wert
○ großes a geht mit großem b einher
○ kleines b geht mit kleinem b einher
Negativer Wert
○ großes a geht mit kleinem b einher
○ kleines a geht mit großem a einher

0 = es besteht kein monotoner Zusammenhang
Der Wert selbst sagt wenig aus
⇒ Korrelation

Data Sience

Was versteht man unter Varianz & Standardabweichung?

● Varianz
○ Maß Streuung um den Mittelwert
○ mittlere quadratischer Abstand vom Mittelwert
sum([(xi-avg)**2 for xi in x])/float(len(x)) oder numpy.var(x)
               var = 2441.36

● Standardabweichung
○ math.sqrt(varianz) oder numpy.std(x)
               std_dev (sigma) = 49.41

● Problem mit Ausreißern
○ Abhilfe: Spannweite zwischen 0.25 – 0.75 des Wertebereichs oder +-2sigma

Data Sience

Was versteht man bei der Datenqualität und Datenaufbereitung unter Compliance?

○ Darf man diese Daten verwenden bzw. zusammenführen (HR, Finanzdaten, …)
○ Hat man das Recht diese Daten weiter zu verarbeiten (Besitzer, Erlaubnis, DSGVO)
○ Wer besitzt die neu generierten Daten
○ Nur wenn wenn man an die Daten gekommen ist heißt das nicht dass man sie verwenden darf (Bsp: hacking, Facebook,…)

Data Sience

Was sind Datenbanken und wieso werden Sie benötigt?

Große bzw. komplexe Datenmengen benötigen entsprechende Verwaltungsprogramme. Man verwendet daher Datenbanken.

Bei einer Datenbank wird zwischen dem Programm und dem Massenspeicher (Festplatte,..) ein Zwischenlayer (Datenbanksystem) eingeführt.

Allgemeines:
● Das Datenbanksystem nimmt dabei Abfragen, sogenannte Queries (Anfragen) entgegen und gibt Datensätze zurück.
● Hier verwenden wir relationale Datenbanken, die einen Datenbestand in Tabellen organisieren.
● Für Abfragen von relationalen Datenbanken wurde die Sprache SQL (Structured
Query Language) entwickelt.
● Python stellt die Module mySQLdb und splite3 zur Verfügung um via SQL mit einer Datenbank zu kommunizieren.

Melde dich jetzt kostenfrei an um alle Karteikarten und Zusammenfassungen für Data Sience an der TU München zu sehen

Singup Image Singup Image
Wave

Andere Kurse aus deinem Studiengang

Für deinen Studiengang an der TU München gibt es bereits viele Kurse auf StudySmarter, denen du beitreten kannst. Karteikarten, Zusammenfassungen und vieles mehr warten auf dich.

Zurück zur TU München Übersichtsseite

Was ist StudySmarter?

Was ist StudySmarter?

StudySmarter ist eine intelligente Lernapp für Studenten. Mit StudySmarter kannst du dir effizient und spielerisch Karteikarten, Zusammenfassungen, Mind-Maps, Lernpläne und mehr erstellen. Erstelle deine eigenen Karteikarten z.B. für Data Sience an der TU München oder greife auf tausende Lernmaterialien deiner Kommilitonen zu. Egal, ob an deiner Uni oder an anderen Universitäten. Hunderttausende Studierende bereiten sich mit StudySmarter effizient auf ihre Klausuren vor. Erhältlich auf Web, Android & iOS. Komplett kostenfrei. Keine Haken.

Awards

Bestes EdTech Startup in Deutschland

Awards
Awards

European Youth Award in Smart Learning

Awards
Awards

Bestes EdTech Startup in Europa

Awards
Awards

Bestes EdTech Startup in Deutschland

Awards
Awards

European Youth Award in Smart Learning

Awards
Awards

Bestes EdTech Startup in Europa

Awards

So funktioniert's

Top-Image

Individueller Lernplan

StudySmarter erstellt dir einen individuellen Lernplan, abgestimmt auf deinen Lerntyp.

Top-Image

Erstelle Karteikarten

Erstelle dir Karteikarten mit Hilfe der Screenshot-, und Markierfunktion, direkt aus deinen Inhalten.

Top-Image

Erstelle Zusammenfassungen

Markiere die wichtigsten Passagen in deinen Dokumenten und bekomme deine Zusammenfassung.

Top-Image

Lerne alleine oder im Team

StudySmarter findet deine Lerngruppe automatisch. Teile deine Lerninhalte mit Freunden und erhalte Antworten auf deine Fragen.

Top-Image

Statistiken und Feedback

Behalte immer den Überblick über deinen Lernfortschritt. StudySmarter führt dich zur Traumnote.

1

Lernplan

2

Karteikarten

3

Zusammenfassungen

4

Teamwork

5

Feedback