Text Retrieval und Text Mining an der Hochschule Mittweida

Karteikarten und Zusammenfassungen für Text Retrieval und Text Mining an der Hochschule Mittweida

Arrow Arrow

Komplett kostenfrei

studysmarter schule studium
d

4.5 /5

studysmarter schule studium
d

4.8 /5

studysmarter schule studium
d

4.5 /5

studysmarter schule studium
d

4.8 /5

Lerne jetzt mit Karteikarten und Zusammenfassungen für den Kurs Text Retrieval und Text Mining an der Hochschule Mittweida.

Beispielhafte Karteikarten für Text Retrieval und Text Mining an der Hochschule Mittweida auf StudySmarter:

Erläutere die Idee der Carnfield Evaluation!

Beispielhafte Karteikarten für Text Retrieval und Text Mining an der Hochschule Mittweida auf StudySmarter:

Welche Messparameter möchten wir bei der Evaluation verwenden?

Beispielhafte Karteikarten für Text Retrieval und Text Mining an der Hochschule Mittweida auf StudySmarter:

Erläutere das Gap-Encoding-Verfahren!

Beispielhafte Karteikarten für Text Retrieval und Text Mining an der Hochschule Mittweida auf StudySmarter:

Warum sollte man ein TR-System evaluieren?

Beispielhafte Karteikarten für Text Retrieval und Text Mining an der Hochschule Mittweida auf StudySmarter:

Welche Möglichkeiten zur Indexkompression gibt es?

Beispielhafte Karteikarten für Text Retrieval und Text Mining an der Hochschule Mittweida auf StudySmarter:

Welche Arten von Token gibt es?

Beispielhafte Karteikarten für Text Retrieval und Text Mining an der Hochschule Mittweida auf StudySmarter:

Erkläre die Idee eines Feature-basierten  Retrieval Modells.

Beispielhafte Karteikarten für Text Retrieval und Text Mining an der Hochschule Mittweida auf StudySmarter:

Was bedeutet Querrying?

Beispielhafte Karteikarten für Text Retrieval und Text Mining an der Hochschule Mittweida auf StudySmarter:

Was ist nicht im VSM definiert?

Beispielhafte Karteikarten für Text Retrieval und Text Mining an der Hochschule Mittweida auf StudySmarter:

Angenommen Sie verwenden eine lineare Interpolations-Glättung (Jelinek-Mercer) um die Wahscheinlichkeit von
Wörtern in einem bestimmten Dokument zu schätzen. Was passiert mit der geglätteten Wahrscheinlichkeit von
einem Wort wenn der Parameter λ verringert wird?

Beispielhafte Karteikarten für Text Retrieval und Text Mining an der Hochschule Mittweida auf StudySmarter:

Warum ist DCG besser als nDCG?

Beispielhafte Karteikarten für Text Retrieval und Text Mining an der Hochschule Mittweida auf StudySmarter:

Warum ist Pooling nützlich?

Kommilitonen im Kurs Text Retrieval und Text Mining an der Hochschule Mittweida. erstellen und teilen Zusammenfassungen, Karteikarten, Lernpläne und andere Lernmaterialien mit der intelligenten StudySmarter Lernapp. Jetzt mitmachen!

Jetzt mitmachen!

Flashcard Flashcard

Beispielhafte Karteikarten für Text Retrieval und Text Mining an der Hochschule Mittweida auf StudySmarter:

Text Retrieval und Text Mining

Erläutere die Idee der Carnfield Evaluation!

Labor gestützte Untersuchung von Systemkomponenten (entwickelt in den 1960erJahren)
Idee: Erstellen wiederverwendbarer Testreihen, definierter Maße

  • Sammlung von repräsentativen Musterdokumenten

  • Reihe von repräsentativen Queries/Topics 

  • Bewertung der Relevanz 

  • Quantifizierungsmaße zur Bewertung des Systemergebnisses verglichen mit den idealen Ranglisten

  • Wiederverwendbarkeit des Testdatensatzes für den Vergleich verschiedener Systeme 

Text Retrieval und Text Mining

Welche Messparameter möchten wir bei der Evaluation verwenden?

Genauigkeit

Effizienz 

Bedienbarkeit

Text Retrieval und Text Mining

Erläutere das Gap-Encoding-Verfahren!

Unter Gap-Encoding verstehen wir das abspeichern der Differenz zwischen zwei Doc ID'S

Text Retrieval und Text Mining

Warum sollte man ein TR-System evaluieren?

Bewertung des aktuellen Nutzens eines TR-Systems

  • Maße sollten Anwendbarkeit in der Praxis reflektieren
  • Üblicherweise durch Anwenderstudie (interaktive Evaluation des IR-Systems)

Vergleich verschiedener Systeme und Methoden

  • Der individuelle Nutzen ist nicht direkt messbar, es können jedoch Maße gefunden
    werden, die mit dem Nutzen für eine spezifische Suchaufgabe korreliert sind.
  •  Üblicherweise durch Testreihen (Testreihen-IR-Evaluation)

Text Retrieval und Text Mining

Welche Möglichkeiten zur Indexkompression gibt es?

TF-Kompression

  • kleine Zahlen können üblicherweise häufiger beobachtet werden als große (Zipfsches Gesetz)

  • weniger Bits für kleine (hohe Frequenz) Integer auf Kosten von mehr Bits für große Integer 

Doc ID-Kompression 

  • d-gap“ d-gap (speichere die Differenz): d1, d2 - d1, d3 - d2, . . .

  •  wird durch den sequentiellen Zugriff ermöglicht 

Text Retrieval und Text Mining

Welche Arten von Token gibt es?

Arten von Tokens

  • Zeichen (beim Suchen nicht besonders nützlich)

  • Wort/Begriff

  • Sequenz von Zeichen (n-gram)

  • Phrasen/Absätze

  • Diskursabschnitte 

Text Retrieval und Text Mining

Erkläre die Idee eines Feature-basierten  Retrieval Modells.

  • Betrachten Dokumente als Vektoren von Werten von Featurefunktionen (oder nur Feature) und suchen den besten Weg diese in einem Relevanz-Score zu kombinieren. Typischerweise erfolgt dies durch “learning to rank“-Methoden.

  • Featurefunktionen sind beliebige Funktionen von Dokument und Query und können als solche fast jedes andere Retrieval-Modell als weiteres Feature einbeziehen.

Text Retrieval und Text Mining

Was bedeutet Querrying?

  • Nutzer gibt eine (Schlüsselwort) Query ein 

  • System liefert relevante Dokumente zurück

  • Funktioniert gut, wenn der Nutzer weiß, welche Schlüsselwörter er verwenden muss

Text Retrieval und Text Mining

Was ist nicht im VSM definiert?

  • Wie wir die "Basiskonzepte" definieren/auswählen

  • Wie wir die Queries im Raum platzieren

Text Retrieval und Text Mining

Angenommen Sie verwenden eine lineare Interpolations-Glättung (Jelinek-Mercer) um die Wahscheinlichkeit von
Wörtern in einem bestimmten Dokument zu schätzen. Was passiert mit der geglätteten Wahrscheinlichkeit von
einem Wort wenn der Parameter λ verringert wird?

Sie nähert sich der Wahrscheinlichkeit die mit der Maximum-Likelihood-Methode für das Dokument berechnet
wurde.

Text Retrieval und Text Mining

Warum ist DCG besser als nDCG?

DCG ist besser als nDCG, da sich sein Wert innerhalb von [0,1] befindet .

Text Retrieval und Text Mining

Warum ist Pooling nützlich?

Damit wir nicht jedes Dokument bewerten müssen.

Melde dich jetzt kostenfrei an um alle Karteikarten und Zusammenfassungen für Text Retrieval und Text Mining an der Hochschule Mittweida zu sehen

Singup Image Singup Image
Wave

Andere Kurse aus deinem Studiengang

Für deinen Studiengang Text Retrieval und Text Mining an der Hochschule Mittweida gibt es bereits viele Kurse auf StudySmarter, denen du beitreten kannst. Karteikarten, Zusammenfassungen und vieles mehr warten auf dich.

Zurück zur Hochschule Mittweida Übersichtsseite

Allgemeine Forenisk

Einführung in die Computerforensik

Informatik I: Programmierung

Allgemeine Forensik I

System- und Netz-werkadministration/ Netzwerksicherheit

Datenbanken

Kriminologie

Allgemeine Forensik III

IT-Sicherheit

Computerforensik

Betriebssysteme

Allgemeine Forensik

Mathematik

Computerforensik 1

Computerforensik

Englisch

Forensik II

Rechnernetze und Netztechnologien

Semantische Technologien und Informationsextraktion

Forensik III

Was ist StudySmarter?

Was ist StudySmarter?

StudySmarter ist eine intelligente Lernapp für Studenten. Mit StudySmarter kannst du dir effizient und spielerisch Karteikarten, Zusammenfassungen, Mind-Maps, Lernpläne und mehr erstellen. Erstelle deine eigenen Karteikarten z.B. für Text Retrieval und Text Mining an der Hochschule Mittweida oder greife auf tausende Lernmaterialien deiner Kommilitonen zu. Egal, ob an deiner Uni oder an anderen Universitäten. Hunderttausende Studierende bereiten sich mit StudySmarter effizient auf ihre Klausuren vor. Erhältlich auf Web, Android & iOS. Komplett kostenfrei. Keine Haken.

Awards

Bestes EdTech Startup in Deutschland

Awards
Awards

European Youth Award in Smart Learning

Awards
Awards

Bestes EdTech Startup in Europa

Awards
Awards

Bestes EdTech Startup in Deutschland

Awards
Awards

European Youth Award in Smart Learning

Awards
Awards

Bestes EdTech Startup in Europa

Awards
X

StudySmarter - Die Lernplattform für Studenten

StudySmarter

4.5 Stars 1100 Bewertungen
Jetzt entdecken
X

Gute Noten in der Uni? Kein Problem mit StudySmarter!

89% der StudySmarter Nutzer bekommen bessere Noten in der Uni.

50 Mio Karteikarten & Zusammenfassungen
Erstelle eigene Lerninhalte mit Smart Tools
Individueller Lernplan & Statistiken


Lerne mit über 1 Millionen Nutzern in der kostenlosen StudySmarter App.

Du bist schon registriert? Hier geht‘s zum Login