Data Science at Universität Potsdam

Flashcards and summaries for Data Science at the Universität Potsdam

Arrow Arrow

It’s completely free

studysmarter schule studium
d

4.5 /5

studysmarter schule studium
d

4.8 /5

studysmarter schule studium
d

4.5 /5

studysmarter schule studium
d

4.8 /5

Study with flashcards and summaries for the course Data Science at the Universität Potsdam

Exemplary flashcards for Data Science at the Universität Potsdam on StudySmarter:

Häufig haben wir ein Datenset, aber es fehlen Informationen. Was tun?

Exemplary flashcards for Data Science at the Universität Potsdam on StudySmarter:

Warum sind Daten schwer zu beschaffen?

Exemplary flashcards for Data Science at the Universität Potsdam on StudySmarter:

Was ist das am weitesten verbreitete Dateiformat für datasets?

This was only a preview of our StudySmarter flashcards.
Flascard Icon Flascard Icon

Millions of flashcards created by students

Flascard Icon Flascard Icon

Create your own flashcards as quick as possible

Flascard Icon Flascard Icon

Learning-Assistant with spaced repetition algorithm

Sign up for free!

Exemplary flashcards for Data Science at the Universität Potsdam on StudySmarter:

Was bedeutet "Parsing"?

Exemplary flashcards for Data Science at the Universität Potsdam on StudySmarter:

Was ist Web Scraping?

Exemplary flashcards for Data Science at the Universität Potsdam on StudySmarter:

Was sollte man beim Lesen von csv/Log Dateien beachten?

Exemplary flashcards for Data Science at the Universität Potsdam on StudySmarter:

Was sind Eigenschaften einer pdf Datei?

This was only a preview of our StudySmarter flashcards.
Flascard Icon Flascard Icon

Millions of flashcards created by students

Flascard Icon Flascard Icon

Create your own flashcards as quick as possible

Flascard Icon Flascard Icon

Learning-Assistant with spaced repetition algorithm

Sign up for free!

Exemplary flashcards for Data Science at the Universität Potsdam on StudySmarter:

JSON: Was ist das? Wofür wird es verwendet?

Exemplary flashcards for Data Science at the Universität Potsdam on StudySmarter:

Was beschreibt ein HTML Dokument?

Exemplary flashcards for Data Science at the Universität Potsdam on StudySmarter:

Was ist der Unterschied zwischen Data Mining und Web Mining?

Exemplary flashcards for Data Science at the Universität Potsdam on StudySmarter:

Warum möchte man als Webseitenbetreiber Web Crawling schwerer machen? Und wie erreicht man das?

This was only a preview of our StudySmarter flashcards.
Flascard Icon Flascard Icon

Millions of flashcards created by students

Flascard Icon Flascard Icon

Create your own flashcards as quick as possible

Flascard Icon Flascard Icon

Learning-Assistant with spaced repetition algorithm

Sign up for free!

Exemplary flashcards for Data Science at the Universität Potsdam on StudySmarter:

Wann sollte man Web Crawling verwenden?

Your peers in the course Data Science at the Universität Potsdam create and share summaries, flashcards, study plans and other learning materials with the intelligent StudySmarter learning app.

Get started now!

Flashcard Flashcard

Exemplary flashcards for Data Science at the Universität Potsdam on StudySmarter:

Data Science

Häufig haben wir ein Datenset, aber es fehlen Informationen. Was tun?

Wir lassen Menschen, die fehlenden Informationen hinzufügen. Zum Beispiel durch Annotieren von Bildern.

Je nach Thematik (Problemstellung/Datensatz) können wir Experten oder Nicht-Experten engagieren.

Data Science

Warum sind Daten schwer zu beschaffen?

  • nicht zugänglich
  • teuer
  • nicht die "richtigen" Daten
  • Datenschutzgründe

Data Science

Was ist das am weitesten verbreitete Dateiformat für datasets?

csv files. Sie stellen im Prinzip Datenbanktabellen dar.


(Ganz nebenbei:  Log Dateien haben ein sehr ähnliches Format)

Data Science

Was bedeutet "Parsing"?

Dealing with the structure of the data

zum Beispiel: um csv files zu lesen, muss der Computer die Struktur verstehen (Spalten, durch komma getrennt)


Meist besser library functions zu verwenden um Spezialfälle zu umgehen (z.B. Komma in einem Element)

Data Science

Was ist Web Scraping?

the method where data is collected from desired web pages and is also known as data collection and data extraction


https://github.com/Macuyiko/webscrapingfordatascience
https://realpython.com/python-web-scraping-practical-introduction/

Data Science

Was sollte man beim Lesen von csv/Log Dateien beachten?

Da sie sehr groß sein können, sollten sie zeilenweise gelesen werden. Ansonsten dauert es unter Umständen sehr lange (Java schneller als Python)

Data Science

Was sind Eigenschaften einer pdf Datei?

- rein visuelles Format

- Spaltenstruktur nicht definiert

- Tools (Document Importing), die pdf interpretieren und Struktur erkennen

Data Science

JSON: Was ist das? Wofür wird es verwendet?

  • strukturierte Datenrepräsentation
  • Schachtelung möglich
  • bilden Objekte und Klassen ab
  • um Konstrukte im Programm mit Serializer in Datei zu schreiben

Data Science

Was beschreibt ein HTML Dokument?

- HTML-Dokumente definieren die Struktur von Webseiten

- Struktur als DOM

- in der Praxis ab und zu unsauber (Problem beim Web Mining; Tools zur Beseitigung von Unsauberheiten)

Data Science

Was ist der Unterschied zwischen Data Mining und Web Mining?

Data mining: It is a concept of identifying a significant pattern from the data that gives a better outcome. Identifying patterns from where? From the data that are generated from the systems.

(teil)automatischen Extraktion von Informationen aus dem Internet aus HTML


Web mining: The process of performing Data mining on the web is called Web mining. Extracting the web documents and discovering the patterns from it.

Data Science

Warum möchte man als Webseitenbetreiber Web Crawling schwerer machen? Und wie erreicht man das?

Warum? Zu viel Traffic, Serverlast könnte zu hoch werden, Datenschutzrisiken


Wie? fake Links führen Crawler in die Irre, Requests blockieren, CAPTCHAS, langsamere Antworten

Data Science

Wann sollte man Web Crawling verwenden?

Wenn keine offene API vorhanden ist

Sign up for free to see all flashcards and summaries for Data Science at the Universität Potsdam

Singup Image Singup Image

Big Data & Data Science at

FOM Hochschule für Oekonomie & Management

Big Data & Data Science at

FOM Hochschule für Oekonomie & Management

Big Data & Data Science at

FOM Hochschule für Oekonomie & Management

Big Data & Big Data Science at

FOM Hochschule für Oekonomie & Management

Data Science & BI at

International School of Management

Similar courses from other universities

Check out courses similar to Data Science at other universities

Back to Universität Potsdam overview page

What is StudySmarter?

What is StudySmarter?

StudySmarter is an intelligent learning tool for students. With StudySmarter you can easily and efficiently create flashcards, summaries, mind maps, study plans and more. Create your own flashcards e.g. for Data Science at the Universität Potsdam or access thousands of learning materials created by your fellow students. Whether at your own university or at other universities. Hundreds of thousands of students use StudySmarter to efficiently prepare for their exams. Available on the Web, Android & iOS. It’s completely free.

Awards

Best EdTech Startup in Europe

Awards
Awards

EUROPEAN YOUTH AWARD IN SMART LEARNING

Awards
Awards

BEST EDTECH STARTUP IN GERMANY

Awards
Awards

Best EdTech Startup in Europe

Awards
Awards

EUROPEAN YOUTH AWARD IN SMART LEARNING

Awards
Awards

BEST EDTECH STARTUP IN GERMANY

Awards
X

StudySmarter - The study app for students

StudySmarter

4.5 Stars 1100 Rating
Start now!
X

Good grades at university? No problem with StudySmarter!

89% of StudySmarter users achieve better grades at university.

50 Mio Flashcards & Summaries
Create your own content with Smart Tools
Individual Learning-Plan

Learn with over 1 million users on StudySmarter.

Already registered? Just go to Login