Data Sience at TU München

Arrow Arrow

It’s completely free

studysmarter schule studium
d

4.5 /5

studysmarter schule studium
d

4.8 /5

studysmarter schule studium
d

4.5 /5

studysmarter schule studium
d

4.8 /5

Study with flashcards and summaries for the course Data Sience at the TU München

Exemplary flashcards for Data Sience at the TU München on StudySmarter:

Data Science Process - Was versteht man unter dem Schritt Darstellen und Verbreiten des Ansatzes und des Ergebnisses?

Exemplary flashcards for Data Sience at the TU München on StudySmarter:

Was versteht man unter Varianz & Standardabweichung?

Exemplary flashcards for Data Sience at the TU München on StudySmarter:

Datenakquise - Was sind die möglichen Formate?

Exemplary flashcards for Data Sience at the TU München on StudySmarter:

Datenakquise - Was sind die Eigenschaften und Voraussetzungen?

Exemplary flashcards for Data Sience at the TU München on StudySmarter:

Datenakquise - Was sind die möglichen Quellen?

Exemplary flashcards for Data Sience at the TU München on StudySmarter:

Wie macht eine Maschine Erfahrungen?

Exemplary flashcards for Data Sience at the TU München on StudySmarter:

Was definiert eine Maschine?

Exemplary flashcards for Data Sience at the TU München on StudySmarter:

Was sind Datenbanken und wieso werden Sie benötigt?

Exemplary flashcards for Data Sience at the TU München on StudySmarter:

Grundlagen Tabellenformat CSV

Exemplary flashcards for Data Sience at the TU München on StudySmarter:

Was versteht man unter Mittelwert/Durchschnitt?

Exemplary flashcards for Data Sience at the TU München on StudySmarter:

Vergleich CSV vs XML

Exemplary flashcards for Data Sience at the TU München on StudySmarter:

Was versteht man unter Kovarianz?

Your peers in the course Data Sience at the TU München create and share summaries, flashcards, study plans and other learning materials with the intelligent StudySmarter learning app.

Get started now!

Flashcard Flashcard

Exemplary flashcards for Data Sience at the TU München on StudySmarter:

Data Sience

Data Science Process - Was versteht man unter dem Schritt Darstellen und Verbreiten des Ansatzes und des Ergebnisses?

○ Ohne Beschreibung keine Wirkung
○ Prüfen der Schlussfolgerungen
○ Review der Ergebnisse und des Ansatzes erlaubt diesen zu Verbessern
○ Blog, Paper, Powerpoint, Email, Gespräch
○ Wichtig: Visualisierung der Daten

Data Sience

Was versteht man unter Varianz & Standardabweichung?

● Varianz
○ Maß Streuung um den Mittelwert
○ mittlere quadratischer Abstand vom Mittelwert
sum([(xi-avg)**2 for xi in x])/float(len(x)) oder numpy.var(x)
               var = 2441.36

● Standardabweichung
○ math.sqrt(varianz) oder numpy.std(x)
               std_dev (sigma) = 49.41

● Problem mit Ausreißern
○ Abhilfe: Spannweite zwischen 0.25 – 0.75 des Wertebereichs oder +-2sigma

Data Sience

Datenakquise - Was sind die möglichen Formate?

● CSV
● XML
● SQL
● Webpage (HMTL)
● Webservice (JSON)
● …

Data Sience

Datenakquise - Was sind die Eigenschaften und Voraussetzungen?

● Digitale Form
● Verfügbarkeit
● Format
● Wandelbarkeit und Kombinierbarkeit

Data Sience

Datenakquise - Was sind die möglichen Quellen?

● Internet (API, Webpage)
● Datenbanken
● Dateien im Firmennetzwerk

Data Sience

Wie macht eine Maschine Erfahrungen?

Training/Lernen mittels vorhandener
und bewerteter Daten

Data Sience

Was definiert eine Maschine?

○ Mathematisches Modells
○ Zweck und Einsatzgebiet des Modells (
Klassifikation (Clustering), Regression
○ Parametrisierung (Anzahl der Cluster,
Linear bei Regression)

Data Sience

Was sind Datenbanken und wieso werden Sie benötigt?

Große bzw. komplexe Datenmengen benötigen entsprechende Verwaltungsprogramme. Man verwendet daher Datenbanken.

Bei einer Datenbank wird zwischen dem Programm und dem Massenspeicher (Festplatte,..) ein Zwischenlayer (Datenbanksystem) eingeführt.

Allgemeines:
● Das Datenbanksystem nimmt dabei Abfragen, sogenannte Queries (Anfragen) entgegen und gibt Datensätze zurück.
● Hier verwenden wir relationale Datenbanken, die einen Datenbestand in Tabellen organisieren.
● Für Abfragen von relationalen Datenbanken wurde die Sprache SQL (Structured
Query Language) entwickelt.
● Python stellt die Module mySQLdb und splite3 zur Verfügung um via SQL mit einer Datenbank zu kommunizieren.

Data Sience

Grundlagen Tabellenformat CSV

Ein sehr verbreitetes Import- und Exportformat für Datenbanken und Tabellenkalkulationen ist das CSV-Format (Comma Separated Values).

CSV-Dateien sind Textdateien, die zeilenweise Datensätze enthalten welche mit Trennzeichen (, | t ; usw.) versehen sind z.B.:

Marke,Modell,Leistung
Porsche,911,350
Skoda,Octavia,140
Audi,Q3,110

Dabei ist die erste Zeile die Datenbezeichnung.

Data Sience

Was versteht man unter Mittelwert/Durchschnitt?

○ Summe aller Elemente/Anzahl Elemente
○ Gewicht = [12, 13, 14, 15, 137] => avg = 38.2

Data Sience

Vergleich CSV vs XML

Das CSV Format ist
● einfach lesbar, aber
● nicht einfach erweiterbar und wartbar.

Alternative: 

Das XML Format (Extensible Markup Language). Dieses Format ist :
● eine hierarchisch aufgebaute Datenstruktur (erweiterbar), welche
● in einem lesbaren Textformat verfasst ist.

Data Sience

Was versteht man unter Kovarianz?

● Zusammenhang (oder nicht) zwischen zwei Eigenschaften

       a = [1, 3, 5]
b = [7, 5, 3]
x = cov(a,b)
x = -4.0

Positiver Wert
○ großes a geht mit großem b einher
○ kleines b geht mit kleinem b einher
Negativer Wert
○ großes a geht mit kleinem b einher
○ kleines a geht mit großem a einher

0 = es besteht kein monotoner Zusammenhang
Der Wert selbst sagt wenig aus
⇒ Korrelation

Sign up for free to see all flashcards and summaries for Data Sience at the TU München

Singup Image Singup Image
Wave

Other courses from your degree program

For your degree program at the TU München there are already many courses on StudySmarter, waiting for you to join them. Get access to flashcards, summaries, and much more.

Back to TU München overview page

What is StudySmarter?

What is StudySmarter?

StudySmarter is an intelligent learning tool for students. With StudySmarter you can easily and efficiently create flashcards, summaries, mind maps, study plans and more. Create your own flashcards e.g. for Data Sience at the TU München or access thousands of learning materials created by your fellow students. Whether at your own university or at other universities. Hundreds of thousands of students use StudySmarter to efficiently prepare for their exams. Available on the Web, Android & iOS. It’s completely free.

Awards

Best EdTech Startup in Europe

Awards
Awards

EUROPEAN YOUTH AWARD IN SMART LEARNING

Awards
Awards

BEST EDTECH STARTUP IN GERMANY

Awards
Awards

Best EdTech Startup in Europe

Awards
Awards

EUROPEAN YOUTH AWARD IN SMART LEARNING

Awards
Awards

BEST EDTECH STARTUP IN GERMANY

Awards

How it works

Top-Image

Get a learning plan

Prepare for all of your exams in time. StudySmarter creates your individual learning plan, tailored to your study type and preferences.

Top-Image

Create flashcards

Create flashcards within seconds with the help of efficient screenshot and marking features. Maximize your comprehension with our intelligent StudySmarter Trainer.

Top-Image

Create summaries

Highlight the most important passages in your learning materials and StudySmarter will create a summary for you. No additional effort required.

Top-Image

Study alone or in a group

StudySmarter automatically finds you a study group. Share flashcards and summaries with your fellow students and get answers to your questions.

Top-Image

Statistics and feedback

Always keep track of your study progress. StudySmarter shows you exactly what you have achieved and what you need to review to achieve your dream grades.

1

Learning Plan

2

Flashcards

3

Summaries

4

Teamwork

5

Feedback