Greife auf kostenlose Karteikarten, Zusammenfassungen, Übungsaufgaben und Altklausuren für deinen Einführung in die Digital Humanitäres Kurs an der Universität Stuttgart zu.
Wann werden serverbasiertes Systeme eingesetzt?
o Bei sensiblen Daten mit Zugriff von außen => MySQL o.a.
o Bei mehreren Nutzern, gleichzeitige Nutzung => MySQL o.a.
o Sensiblere Daten (Kundendaten, Nutzerdaten o.a.)
Wie lauten die Distanzmaße in der Stilometrie?
- Manhattan Distanz: Absolutwert der Häufigkeitsdifferenzen aller Wörter zwischen
zwei Texten
- Euklidische Distanz: Wurzel der Summe der quadrierten Differenzen
- Cosine Distance: Winkel der zwei Textvektoren
- Burrow’s Delta standardisiert die Daten:
o Abweichungen zweier Texte vom Gesamtdurchschnitt der Worthäufigkeit
o Geteilt durch die Gesamtstandardabweichung der Worthäufigkeit
o “zufällige” starke Abweichungen zw. Texten werden heruntergewichtet
o => Differenzen im “Stil” haben größere Chance, erkannt zu werden
Was sind relationale Datenbanken?
- eine Datei mit Daten
- eine Datenstruktur (Modell/Methode)
- ein System zur Erstellung, Verwaltung und Speicherung einer Datenbank
o in Hardware
o in Software
- Datenbank (DB) + Datenbankmanagementsystem (DBMS) = Datenbanksystem (DBS)
SQL = Abfragesprache
mySQL = Datenbanksystem
Wann werden Einzelsysteme (sqlite) eingesetzt?
o (Internet)anwendung mit nur wenigen Lesezugriffen
o (Internet)anwendung mit klar definierten Schreibzugriffen
o Datensicherheit nicht relevant
o Lokaler Zugriff, z.B. kleine Forschungsdatenbank
Wann, wo und wie wird R angewendet?
- Primäre Anwendungsfelder: Datenanalyse und Visualisierung
- Skriptsprache (interpretiert)
o R Kommandozeile (ähnlich wie Python oder IPython)
o modulorientiert, Installation sogenannter libraries
o RStudio: GUI für die flexible Datenanalyse (ähnlich Spyder für Python)
o Module wie stylo bieten High-Level-Interfaces und Benutzeroberflächen für
bestimmte Aufgaben
Was ist stylo?
- R-Library
- Sammelpaket und Benutzeroberfläche für statistische Algorithmen, die in Stilometrie
eingesetzt werden
- Anwenderfreundliche Analyse stilistischer Ähnlichkeiten / Differenzen zwischen
Texten
<unclear>
<unclear> enthält ein Wort, einen Satz oder eine Textpassage, welche in der Quelle nicht oder nur schwer lesbar bzw. hörbar ist.
Was wollen Datenbanksysteme?
- Komplexe Hierarchien abbilden
Was ist anders bei Datenbanken?
- Einfache Tabelle -> Excel Spreadsheet reicht aus
- Komplexe, flexible Zusammenhänge zwischen Tabellen -> RDBS
o Tabellen drücken minimal gruppierte Informationen aus
o Daten aus verschiedenen Tabellen werden nach Bedarf per Abfrage
zusammengeführt
o Das geschieht über sogenannte Keys (in Form von Tabellenspalten)
- Customer IDs, Purchase IDs, Product IDs ... bestimmen Relationen zwischen Tabellen
- Multi-User Szenarien: RDBMS schützen vor Datenkorruption (e.g. vor
versehentlichem Überschreiben)
Was sind die Unterschiede zwischen Datenbankmanagementsystemen?
- Serverbasierte Systeme, für Verwaltung mehrerer Projekte
o Multi-User Szenarien: Mehrere Nutzer und Datenbanken in einem DBS
o Zugriff ggf. von “außen” (Webanwendung o.a.)
=> Nutzerverwaltung
=> Betrieb über Server (Client ist das Programm)
- Einzelsysteme, z.B. für kleine Projekte:
o ist eine einzige (u.U. sehr große) Datei
o keine Konfiguration nötig
o keine User und keine Nutzerverwaltung
o z.B. sqlite
Was kann und macht Stilometrie?
- Anwendungsbereich Autorschaftsattribution: Literaturwissenschaft, Forensische
Linguistik, Korpuslinguistik
- Features: unterschiedlich, v.a. unbewusste sprachliche Eigenheiten (Funktionswörter,
Umfang des Vokabulars, most frequent words)
Wie lauten die Distanzmaße in der Stilometrie?
- Manhattan Distanz: Absolutwert der Häufigkeitsdifferenzen aller Wörter zwischen
zwei Texten
- Euklidische Distanz: Wurzel der Summe der quadrierten Differenzen
- Cosine Distance: Winkel der zwei Textvektoren
- Burrow’s Delta standardisiert die Daten:
o Abweichungen zweier Texte vom Gesamtdurchschnitt der Worthäufigkeit
o Geteilt durch die Gesamtstandardabweichung der Worthäufigkeit
o “zufällige” starke Abweichungen zw. Texten werden heruntergewichtet
o => Differenzen im “Stil” haben größere Chance, erkannt zu werden
Greife kostenlos auf tausende geteilte Karteikarten, Zusammenfassungen, Altklausuren und mehr zu.
Jetzt loslegenFür deinen Studiengang Einführung in die Digital Humanitäres an der Universität Stuttgart gibt es bereits viele Kurse, die von deinen Kommilitonen auf StudySmarter erstellt wurden. Karteikarten, Zusammenfassungen, Altklausuren, Übungsaufgaben und mehr warten auf dich!