Text Retrieval und Text Mining at Hochschule Mittweida

Flashcards and summaries for Text Retrieval und Text Mining at the Hochschule Mittweida

Arrow Arrow

It’s completely free

studysmarter schule studium
d

4.5 /5

studysmarter schule studium
d

4.8 /5

studysmarter schule studium
d

4.5 /5

studysmarter schule studium
d

4.8 /5

Study with flashcards and summaries for the course Text Retrieval und Text Mining at the Hochschule Mittweida

Exemplary flashcards for Text Retrieval und Text Mining at the Hochschule Mittweida on StudySmarter:

Erläutere die Idee der Carnfield Evaluation!

Exemplary flashcards for Text Retrieval und Text Mining at the Hochschule Mittweida on StudySmarter:

Welche Messparameter möchten wir bei der Evaluation verwenden?

Exemplary flashcards for Text Retrieval und Text Mining at the Hochschule Mittweida on StudySmarter:

Erläutere das Gap-Encoding-Verfahren!

Exemplary flashcards for Text Retrieval und Text Mining at the Hochschule Mittweida on StudySmarter:

Warum sollte man ein TR-System evaluieren?

Exemplary flashcards for Text Retrieval und Text Mining at the Hochschule Mittweida on StudySmarter:

Welche Möglichkeiten zur Indexkompression gibt es?

Exemplary flashcards for Text Retrieval und Text Mining at the Hochschule Mittweida on StudySmarter:

Welche Arten von Token gibt es?

Exemplary flashcards for Text Retrieval und Text Mining at the Hochschule Mittweida on StudySmarter:

Erkläre die Idee eines Feature-basierten  Retrieval Modells.

Exemplary flashcards for Text Retrieval und Text Mining at the Hochschule Mittweida on StudySmarter:

Was bedeutet Querrying?

Exemplary flashcards for Text Retrieval und Text Mining at the Hochschule Mittweida on StudySmarter:

Was ist nicht im VSM definiert?

Exemplary flashcards for Text Retrieval und Text Mining at the Hochschule Mittweida on StudySmarter:

Angenommen Sie verwenden eine lineare Interpolations-Glättung (Jelinek-Mercer) um die Wahscheinlichkeit von
Wörtern in einem bestimmten Dokument zu schätzen. Was passiert mit der geglätteten Wahrscheinlichkeit von
einem Wort wenn der Parameter λ verringert wird?

Exemplary flashcards for Text Retrieval und Text Mining at the Hochschule Mittweida on StudySmarter:

Warum ist DCG besser als nDCG?

Exemplary flashcards for Text Retrieval und Text Mining at the Hochschule Mittweida on StudySmarter:

Warum ist Pooling nützlich?

Your peers in the course Text Retrieval und Text Mining at the Hochschule Mittweida create and share summaries, flashcards, study plans and other learning materials with the intelligent StudySmarter learning app.

Get started now!

Flashcard Flashcard

Exemplary flashcards for Text Retrieval und Text Mining at the Hochschule Mittweida on StudySmarter:

Text Retrieval und Text Mining

Erläutere die Idee der Carnfield Evaluation!

Labor gestützte Untersuchung von Systemkomponenten (entwickelt in den 1960erJahren)
Idee: Erstellen wiederverwendbarer Testreihen, definierter Maße

  • Sammlung von repräsentativen Musterdokumenten

  • Reihe von repräsentativen Queries/Topics 

  • Bewertung der Relevanz 

  • Quantifizierungsmaße zur Bewertung des Systemergebnisses verglichen mit den idealen Ranglisten

  • Wiederverwendbarkeit des Testdatensatzes für den Vergleich verschiedener Systeme 

Text Retrieval und Text Mining

Welche Messparameter möchten wir bei der Evaluation verwenden?

Genauigkeit

Effizienz 

Bedienbarkeit

Text Retrieval und Text Mining

Erläutere das Gap-Encoding-Verfahren!

Unter Gap-Encoding verstehen wir das abspeichern der Differenz zwischen zwei Doc ID'S

Text Retrieval und Text Mining

Warum sollte man ein TR-System evaluieren?

Bewertung des aktuellen Nutzens eines TR-Systems

  • Maße sollten Anwendbarkeit in der Praxis reflektieren
  • Üblicherweise durch Anwenderstudie (interaktive Evaluation des IR-Systems)

Vergleich verschiedener Systeme und Methoden

  • Der individuelle Nutzen ist nicht direkt messbar, es können jedoch Maße gefunden
    werden, die mit dem Nutzen für eine spezifische Suchaufgabe korreliert sind.
  •  Üblicherweise durch Testreihen (Testreihen-IR-Evaluation)

Text Retrieval und Text Mining

Welche Möglichkeiten zur Indexkompression gibt es?

TF-Kompression

  • kleine Zahlen können üblicherweise häufiger beobachtet werden als große (Zipfsches Gesetz)

  • weniger Bits für kleine (hohe Frequenz) Integer auf Kosten von mehr Bits für große Integer 

Doc ID-Kompression 

  • d-gap“ d-gap (speichere die Differenz): d1, d2 - d1, d3 - d2, . . .

  •  wird durch den sequentiellen Zugriff ermöglicht 

Text Retrieval und Text Mining

Welche Arten von Token gibt es?

Arten von Tokens

  • Zeichen (beim Suchen nicht besonders nützlich)

  • Wort/Begriff

  • Sequenz von Zeichen (n-gram)

  • Phrasen/Absätze

  • Diskursabschnitte 

Text Retrieval und Text Mining

Erkläre die Idee eines Feature-basierten  Retrieval Modells.

  • Betrachten Dokumente als Vektoren von Werten von Featurefunktionen (oder nur Feature) und suchen den besten Weg diese in einem Relevanz-Score zu kombinieren. Typischerweise erfolgt dies durch “learning to rank“-Methoden.

  • Featurefunktionen sind beliebige Funktionen von Dokument und Query und können als solche fast jedes andere Retrieval-Modell als weiteres Feature einbeziehen.

Text Retrieval und Text Mining

Was bedeutet Querrying?

  • Nutzer gibt eine (Schlüsselwort) Query ein 

  • System liefert relevante Dokumente zurück

  • Funktioniert gut, wenn der Nutzer weiß, welche Schlüsselwörter er verwenden muss

Text Retrieval und Text Mining

Was ist nicht im VSM definiert?

  • Wie wir die "Basiskonzepte" definieren/auswählen

  • Wie wir die Queries im Raum platzieren

Text Retrieval und Text Mining

Angenommen Sie verwenden eine lineare Interpolations-Glättung (Jelinek-Mercer) um die Wahscheinlichkeit von
Wörtern in einem bestimmten Dokument zu schätzen. Was passiert mit der geglätteten Wahrscheinlichkeit von
einem Wort wenn der Parameter λ verringert wird?

Sie nähert sich der Wahrscheinlichkeit die mit der Maximum-Likelihood-Methode für das Dokument berechnet
wurde.

Text Retrieval und Text Mining

Warum ist DCG besser als nDCG?

DCG ist besser als nDCG, da sich sein Wert innerhalb von [0,1] befindet .

Text Retrieval und Text Mining

Warum ist Pooling nützlich?

Damit wir nicht jedes Dokument bewerten müssen.

Sign up for free to see all flashcards and summaries for Text Retrieval und Text Mining at the Hochschule Mittweida

Singup Image Singup Image
Wave

Other courses from your degree program

For your degree program Text Retrieval und Text Mining at the Hochschule Mittweida there are already many courses on StudySmarter, waiting for you to join them. Get access to flashcards, summaries, and much more.

Back to Hochschule Mittweida overview page

Allgemeine Forenisk

Einführung in die Computerforensik

Informatik I: Programmierung

Allgemeine Forensik I

System- und Netz-werkadministration/ Netzwerksicherheit

Datenbanken

Kriminologie

Allgemeine Forensik III

IT-Sicherheit

Computerforensik

Allgemeine Forensik

Mathematik

Computerforensik 1

Computerforensik

Englisch

Forensik II

Rechnernetze und Netztechnologien

Forensik III

What is StudySmarter?

What is StudySmarter?

StudySmarter is an intelligent learning tool for students. With StudySmarter you can easily and efficiently create flashcards, summaries, mind maps, study plans and more. Create your own flashcards e.g. for Text Retrieval und Text Mining at the Hochschule Mittweida or access thousands of learning materials created by your fellow students. Whether at your own university or at other universities. Hundreds of thousands of students use StudySmarter to efficiently prepare for their exams. Available on the Web, Android & iOS. It’s completely free.

Awards

Best EdTech Startup in Europe

Awards
Awards

EUROPEAN YOUTH AWARD IN SMART LEARNING

Awards
Awards

BEST EDTECH STARTUP IN GERMANY

Awards
Awards

Best EdTech Startup in Europe

Awards
Awards

EUROPEAN YOUTH AWARD IN SMART LEARNING

Awards
Awards

BEST EDTECH STARTUP IN GERMANY

Awards
X

StudySmarter - The study app for students

StudySmarter

4.5 Stars 1100 Rating
Start now!
X

Good grades at university? No problem with StudySmarter!

89% of StudySmarter users achieve better grades at university.

50 Mio Flashcards & Summaries
Create your own content with Smart Tools
Individual Learning-Plan

Learn with over 1 million users on StudySmarter.

Already registered? Just go to Login