Data Sience at TU München

Flashcards and summaries for Data Sience at the TU München

Arrow Arrow

It’s completely free

studysmarter schule studium
d

4.5 /5

studysmarter schule studium
d

4.8 /5

studysmarter schule studium
d

4.5 /5

studysmarter schule studium
d

4.8 /5

Study with flashcards and summaries for the course Data Sience at the TU München

Exemplary flashcards for Data Sience at the TU München on StudySmarter:

Wie kann man Daten untersuchen?

Exemplary flashcards for Data Sience at the TU München on StudySmarter:

Grundlagen Tabellenformat CSV

Exemplary flashcards for Data Sience at the TU München on StudySmarter:

Was sind Datenbanken und wieso werden Sie benötigt?

This was only a preview of our StudySmarter flashcards.
Flascard Icon Flascard Icon

Millions of flashcards created by students

Flascard Icon Flascard Icon

Create your own flashcards as quick as possible

Flascard Icon Flascard Icon

Learning-Assistant with spaced repetition algorithm

Sign up for free!

Exemplary flashcards for Data Sience at the TU München on StudySmarter:

Was versteht man bei der Datenqualität und Datenaufbereitung unter Menge?

Exemplary flashcards for Data Sience at the TU München on StudySmarter:

Data Science Process - Was versteht man unter dem Schritt Data Exploration?

Exemplary flashcards for Data Sience at the TU München on StudySmarter:

Data Science Process - Was versteht man unter dem Schritt Modellierung?

Exemplary flashcards for Data Sience at the TU München on StudySmarter:

Data Science Process - Was versteht man unter dem Schritt Darstellen und Verbreiten des Ansatzes und des Ergebnisses?

This was only a preview of our StudySmarter flashcards.
Flascard Icon Flascard Icon

Millions of flashcards created by students

Flascard Icon Flascard Icon

Create your own flashcards as quick as possible

Flascard Icon Flascard Icon

Learning-Assistant with spaced repetition algorithm

Sign up for free!

Exemplary flashcards for Data Sience at the TU München on StudySmarter:

Datenakquise - Was sind die Eigenschaften und Voraussetzungen?

Exemplary flashcards for Data Sience at the TU München on StudySmarter:

Datenakquise - Was sind die möglichen Quellen?

Exemplary flashcards for Data Sience at the TU München on StudySmarter:

Datenakquise - Was sind die möglichen Formate?

Exemplary flashcards for Data Sience at the TU München on StudySmarter:

Was sind Informationen?

This was only a preview of our StudySmarter flashcards.
Flascard Icon Flascard Icon

Millions of flashcards created by students

Flascard Icon Flascard Icon

Create your own flashcards as quick as possible

Flascard Icon Flascard Icon

Learning-Assistant with spaced repetition algorithm

Sign up for free!

Exemplary flashcards for Data Sience at the TU München on StudySmarter:

Was versteht man unter dem Data Science Process?

Your peers in the course Data Sience at the TU München create and share summaries, flashcards, study plans and other learning materials with the intelligent StudySmarter learning app.

Get started now!

Flashcard Flashcard

Exemplary flashcards for Data Sience at the TU München on StudySmarter:

Data Sience

Wie kann man Daten untersuchen?

Statistik
○ Mean, Median, Range
○ Quartile
○ Standardabweichung
○ Ausreißer
○ Korrelationen


Visualisierung
○ Verteilungskurve (Histogramme)
○ Korrelationsdarstellungen
○ Scheinkorellation

Data Sience

Grundlagen Tabellenformat CSV

Ein sehr verbreitetes Import- und Exportformat für Datenbanken und Tabellenkalkulationen ist das CSV-Format (Comma Separated Values).


CSV-Dateien sind Textdateien, die zeilenweise Datensätze enthalten welche mit Trennzeichen (, | \t ; usw.) versehen sind z.B.:


Marke,Modell,Leistung
Porsche,911,350
Skoda,Octavia,140
Audi,Q3,110


Dabei ist die erste Zeile die Datenbezeichnung.

Data Sience

Was sind Datenbanken und wieso werden Sie benötigt?

Große bzw. komplexe Datenmengen benötigen entsprechende Verwaltungsprogramme. Man verwendet daher Datenbanken.


Bei einer Datenbank wird zwischen dem Programm und dem Massenspeicher (Festplatte,..) ein Zwischenlayer (Datenbanksystem) eingeführt.


Allgemeines:
● Das Datenbanksystem nimmt dabei Abfragen, sogenannte Queries (Anfragen) entgegen und gibt Datensätze zurück.
● Hier verwenden wir relationale Datenbanken, die einen Datenbestand in Tabellen organisieren.
● Für Abfragen von relationalen Datenbanken wurde die Sprache SQL (Structured
Query Language) entwickelt.
● Python stellt die Module mySQLdb und splite3 zur Verfügung um via SQL mit einer Datenbank zu kommunizieren.

Data Sience

Was versteht man bei der Datenqualität und Datenaufbereitung unter Menge?

○ gibt es genügend oder gibt es “zu viele”
○ Reduktion der vorhandenen Daten auf das wesentliche für die Fragestellung
○ Für ML: Aufteilung in Trainings und Testmenge

Data Sience

Data Science Process - Was versteht man unter dem Schritt Data Exploration?

○ Sich mit den Daten vertraut machen
○ Ein “Gespür” für die vorhanden Daten finden
○ Welcher Teil der Daten ist relevant
○ Datenkonsistenz (Widersprüche etc.)
○ Muster finden

Data Sience

Data Science Process - Was versteht man unter dem Schritt Modellierung?

○ Schlussfolgerungen

■ Facebook: Benutzer lesen weniger politisch widersprechende Artikel

○ Vorhersagen

■ Netflix: Welche Filme gefallen dem Benutzer

○ Statistik und/oder Maschinelles Lernen

Data Sience

Data Science Process - Was versteht man unter dem Schritt Darstellen und Verbreiten des Ansatzes und des Ergebnisses?

○ Ohne Beschreibung keine Wirkung
○ Prüfen der Schlussfolgerungen
○ Review der Ergebnisse und des Ansatzes erlaubt diesen zu Verbessern
○ Blog, Paper, Powerpoint, Email, Gespräch
○ Wichtig: Visualisierung der Daten

Data Sience

Datenakquise - Was sind die Eigenschaften und Voraussetzungen?

● Digitale Form
● Verfügbarkeit
● Format
● Wandelbarkeit und Kombinierbarkeit

Data Sience

Datenakquise - Was sind die möglichen Quellen?

● Internet (API, Webpage)
● Datenbanken
● Dateien im Firmennetzwerk

Data Sience

Datenakquise - Was sind die möglichen Formate?

● CSV
● XML
● SQL
● Webpage (HMTL)
● Webservice (JSON)
● ...

Data Sience

Was sind Informationen?

○ Daten auf komplexere Ebene
○ Verknüpfung mit weiteren Daten
○ Verbindung der Daten mit Kontext ergibt Information
○ Relevante oder Irrelevante Informationen


Beispiel: Die Information über ein Geburtsdatum hat immer noch recht wenig Wert, wenn unbekannt ist, um welche Person es sich handelt. Werden jetzt weitere Informationen,
wie der Name hinzugefügt und beide Informationen verknüpft entsteht Wissen über eine
Person.

Data Sience

Was versteht man unter dem Data Science Process?

● Iterativer Prozess
● Interaktion zwischen den einzelnen
Schritten
● Alles startet mit einer Frage
○ Fragen kommen nicht von Data
Analysten
● Die entscheidenden Schritte:
○ Gibt es für diese Frage die notwendigen
Daten?
○ Haben die Daten die notwendige
Qualität?
○ Säubern und Aufbereiten der Daten

Sign up for free to see all flashcards and summaries for Data Sience at the TU München

Singup Image Singup Image

BigData & DataScience at

FOM Hochschule für Oekonomie & Management

Datascience at

Universität Giessen

Science at

Swami Ramanand Teerth Marathwada University

Science at

Indian Institute of Technology, Bombay

Big Data at

FOM Hochschule für Oekonomie & Management

Similar courses from other universities

Check out courses similar to Data Sience at other universities

Back to TU München overview page

What is StudySmarter?

What is StudySmarter?

StudySmarter is an intelligent learning tool for students. With StudySmarter you can easily and efficiently create flashcards, summaries, mind maps, study plans and more. Create your own flashcards e.g. for Data Sience at the TU München or access thousands of learning materials created by your fellow students. Whether at your own university or at other universities. Hundreds of thousands of students use StudySmarter to efficiently prepare for their exams. Available on the Web, Android & iOS. It’s completely free.

Awards

Best EdTech Startup in Europe

Awards
Awards

EUROPEAN YOUTH AWARD IN SMART LEARNING

Awards
Awards

BEST EDTECH STARTUP IN GERMANY

Awards
Awards

Best EdTech Startup in Europe

Awards
Awards

EUROPEAN YOUTH AWARD IN SMART LEARNING

Awards
Awards

BEST EDTECH STARTUP IN GERMANY

Awards
X

StudySmarter - The study app for students

StudySmarter

4.5 Stars 1100 Rating
Start now!
X

Good grades at university? No problem with StudySmarter!

89% of StudySmarter users achieve better grades at university.

50 Mio Flashcards & Summaries
Create your own content with Smart Tools
Individual Learning-Plan

Learn with over 1 million users on StudySmarter.

Already registered? Just go to Login