Kommilitonen im Kurs Text Retrieval und Text Mining an der Hochschule Mittweida. erstellen und teilen Zusammenfassungen, Karteikarten, Lernpläne und andere Lernmaterialien mit der intelligenten StudySmarter Lernapp. Jetzt mitmachen!
Jetzt mitmachen!
Text Retrieval und Text Mining
Erkläre die Idee eines Feature-basierten Retrieval Modells.
Betrachten Dokumente als Vektoren von Werten von Featurefunktionen (oder nur Feature) und suchen den besten Weg diese in einem Relevanz-Score zu kombinieren. Typischerweise erfolgt dies durch “learning to rank“-Methoden.
Featurefunktionen sind beliebige Funktionen von Dokument und Query und können als solche fast jedes andere Retrieval-Modell als weiteres Feature einbeziehen.
Text Retrieval und Text Mining
Welche Messparameter möchten wir bei der Evaluation verwenden?
Genauigkeit
Effizienz
Bedienbarkeit
Text Retrieval und Text Mining
Warum ist DCG besser als nDCG?
DCG ist besser als nDCG, da sich sein Wert innerhalb von [0,1] befindet .
Text Retrieval und Text Mining
Erläutere das Gap-Encoding-Verfahren!
Unter Gap-Encoding verstehen wir das abspeichern der Differenz zwischen zwei Doc ID'S
Text Retrieval und Text Mining
Welche Möglichkeiten zur Indexkompression gibt es?
TF-Kompression
kleine Zahlen können üblicherweise häufiger beobachtet werden als große (Zipfsches Gesetz)
weniger Bits für kleine (hohe Frequenz) Integer auf Kosten von mehr Bits für große Integer
Doc ID-Kompression
d-gap“ d-gap (speichere die Differenz): d1, d2 - d1, d3 - d2, . . .
wird durch den sequentiellen Zugriff ermöglicht
Text Retrieval und Text Mining
Erläutere die Idee der Carnfield Evaluation!
Labor gestützte Untersuchung von Systemkomponenten (entwickelt in den 1960erJahren)
Idee: Erstellen wiederverwendbarer Testreihen, definierter Maße
Sammlung von repräsentativen Musterdokumenten
Reihe von repräsentativen Queries/Topics
Bewertung der Relevanz
Quantifizierungsmaße zur Bewertung des Systemergebnisses verglichen mit den idealen Ranglisten
Wiederverwendbarkeit des Testdatensatzes für den Vergleich verschiedener Systeme
Text Retrieval und Text Mining
Warum sollte man ein TR-System evaluieren?
Bewertung des aktuellen Nutzens eines TR-Systems
Vergleich verschiedener Systeme und Methoden
Text Retrieval und Text Mining
Was bedeutet Browsing?
Nutzer navigiert durch relevante Informationen indem er Strukturen innerhalb der Dokumente folgt
Geeignet für Nutzer welche Informationen explorieren wollen und nicht Wissen
welche Schlüsselwörter geeignet sind oder anderweitig keine Query eingeben können.
Text Retrieval und Text Mining
Was bedeutet Querrying?
Nutzer gibt eine (Schlüsselwort) Query ein
System liefert relevante Dokumente zurück
Funktioniert gut, wenn der Nutzer weiß, welche Schlüsselwörter er verwenden muss
Text Retrieval und Text Mining
Welche Arten von Token gibt es?
Arten von Tokens
Zeichen (beim Suchen nicht besonders nützlich)
Wort/Begriff
Sequenz von Zeichen (n-gram)
Phrasen/Absätze
Diskursabschnitte
Text Retrieval und Text Mining
Wie funktioniert die Wortsegmentierung?
Wir trennen am Whitespace.
Vor- und Nachteile, Müller & Sohn Dienstleistungs GmbH, PRO 7- Moderator
Fenster-bank
Ansatz: separierte Wörter auf Gültigkeit gegen ein definiertes Alphabet prüfen.
Text Retrieval und Text Mining
Welche verschiedene Retrival Modelle gibt es?
Mengentheoretische Modelle
Algebraische Modelle
Probabilistische Modelle
Feature-basierte Modelle
Für deinen Studiengang Text Retrieval und Text Mining an der Hochschule Mittweida gibt es bereits viele Kurse auf StudySmarter, denen du beitreten kannst. Karteikarten, Zusammenfassungen und vieles mehr warten auf dich.
Zurück zur Hochschule Mittweida ÜbersichtsseiteSchau dir doch auch Text Retrieval und Text Mining an anderen Unis an
Zurück zur Hochschule Mittweida ÜbersichtsseiteStudySmarter ist eine intelligente Lernapp für Studenten. Mit StudySmarter kannst du dir effizient und spielerisch Karteikarten, Zusammenfassungen, Mind-Maps, Lernpläne und mehr erstellen. Erstelle deine eigenen Karteikarten z.B. für Text Retrieval und Text Mining an der Hochschule Mittweida oder greife auf tausende Lernmaterialien deiner Kommilitonen zu. Egal, ob an deiner Uni oder an anderen Universitäten. Hunderttausende Studierende bereiten sich mit StudySmarter effizient auf ihre Klausuren vor. Erhältlich auf Web, Android & iOS. Komplett kostenfrei. Keine Haken.
Bestes EdTech Startup in Deutschland
Du bist schon registriert? Hier geht‘s zum Login