Semantische Technologien und Informationsextraktion an der Hochschule Mittweida

Karteikarten und Zusammenfassungen für Semantische Technologien und Informationsextraktion an der Hochschule Mittweida

Arrow Arrow

Komplett kostenfrei

studysmarter schule studium
d

4.5 /5

studysmarter schule studium
d

4.8 /5

studysmarter schule studium
d

4.5 /5

studysmarter schule studium
d

4.8 /5

Lerne jetzt mit Karteikarten und Zusammenfassungen für den Kurs Semantische Technologien und Informationsextraktion an der Hochschule Mittweida.

Beispielhafte Karteikarten für Semantische Technologien und Informationsextraktion an der Hochschule Mittweida auf StudySmarter:

Was ist Topic Mining?

Beispielhafte Karteikarten für Semantische Technologien und Informationsextraktion an der Hochschule Mittweida auf StudySmarter:

Welche Anwendungsmöglichkeiten von Topic Mining gibt es?

Beispielhafte Karteikarten für Semantische Technologien und Informationsextraktion an der Hochschule Mittweida auf StudySmarter:

Welche Aufgaben hat das Topic Mining

Das war nur eine Vorschau der Karteikarten auf StudySmarter.
Flascard Icon Flascard Icon

Über 50 Mio Karteikarten von Schülern erstellt

Flascard Icon Flascard Icon

Erstelle eigene Karteikarten in Rekordzeit

Flascard Icon Flascard Icon

Kostenlose Karteikarten zu STARK Inhalten

Kostenlos anmelden

Beispielhafte Karteikarten für Semantische Technologien und Informationsextraktion an der Hochschule Mittweida auf StudySmarter:

Welche Nachteile hat die PLSA?

Beispielhafte Karteikarten für Semantische Technologien und Informationsextraktion an der Hochschule Mittweida auf StudySmarter:

Was ist Clusteranalyse?
Nenne einige Beispiele.

Beispielhafte Karteikarten für Semantische Technologien und Informationsextraktion an der Hochschule Mittweida auf StudySmarter:

Warum Clusteranalyse für Textdaten?

Beispielhafte Karteikarten für Semantische Technologien und Informationsextraktion an der Hochschule Mittweida auf StudySmarter:

Nenne Beispiele für Clustering von Textdaten.

Das war nur eine Vorschau der Karteikarten auf StudySmarter.
Flascard Icon Flascard Icon

Über 50 Mio Karteikarten von Schülern erstellt

Flascard Icon Flascard Icon

Erstelle eigene Karteikarten in Rekordzeit

Flascard Icon Flascard Icon

Kostenlose Karteikarten zu STARK Inhalten

Kostenlos anmelden

Beispielhafte Karteikarten für Semantische Technologien und Informationsextraktion an der Hochschule Mittweida auf StudySmarter:

Welche zwei Strategien um optimale Cluster zu erhalten gibt es?

Beispielhafte Karteikarten für Semantische Technologien und Informationsextraktion an der Hochschule Mittweida auf StudySmarter:

Beschreibe das Vorgehen der direkten Evaluation von Clustern

Beispielhafte Karteikarten für Semantische Technologien und Informationsextraktion an der Hochschule Mittweida auf StudySmarter:

Beschreibe das Vorgehen der indirekten Evaluation von Clustern

Beispielhafte Karteikarten für Semantische Technologien und Informationsextraktion an der Hochschule Mittweida auf StudySmarter:

Welches von den folgenden Verfahren ist Nicht empfindlich für Ausreißer

Das war nur eine Vorschau der Karteikarten auf StudySmarter.
Flascard Icon Flascard Icon

Über 50 Mio Karteikarten von Schülern erstellt

Flascard Icon Flascard Icon

Erstelle eigene Karteikarten in Rekordzeit

Flascard Icon Flascard Icon

Kostenlose Karteikarten zu STARK Inhalten

Kostenlos anmelden

Beispielhafte Karteikarten für Semantische Technologien und Informationsextraktion an der Hochschule Mittweida auf StudySmarter:

Welche der folgenden Aussagen über das Mix-Model beim Clustering ist richtig?

Kommilitonen im Kurs Semantische Technologien und Informationsextraktion an der Hochschule Mittweida. erstellen und teilen Zusammenfassungen, Karteikarten, Lernpläne und andere Lernmaterialien mit der intelligenten StudySmarter Lernapp. Jetzt mitmachen!

Jetzt mitmachen!

Flashcard Flashcard

Beispielhafte Karteikarten für Semantische Technologien und Informationsextraktion an der Hochschule Mittweida auf StudySmarter:

Semantische Technologien und Informationsextraktion

Was ist Topic Mining?

Topic ≈ Hauptgedanke der in Textdaten diskutiert wird

  • Thema/Gegenstand einer Diskussion oder Konversation
  • Verschiedene Granularitäten (z.B. Topic eines Satzes, Artikels etc.)
  • geben uns Aufschluss über die Beobachtung der realen Welt
  • wollen Themen aus Texten heraus extrahieren


Semantische Technologien und Informationsextraktion

Welche Anwendungsmöglichkeiten von Topic Mining gibt es?

mögliche Anwendungsmöglichkeiten von Topic Mining

  • Herausfinden von Interessen der Twitter-Nutzer - Stimmungsanalyse
  • Herausfinden von aktuellen Forschungstheme
  • Pro/Kontra für angebotene Produkte
  • Herausfinden von politischen Hauptthemen

Semantische Technologien und Informationsextraktion

Welche Aufgaben hat das Topic Mining

Aufgabe 1: Finde k Topics

Aufgabe 2: Finde heraus welches Dokument sich mit welchem Thema beschäftigt

Semantische Technologien und Informationsextraktion

Welche Nachteile hat die PLSA?

Kein generatives Modell

  • brauchen immer πs um ein Dok zu erzeugen, welche wiederum an Dok in Trainingsdaten gebunden
  • Kann die Wahrscheinlichkeit eines neuen Dokumentes nicht berechnen
  • Heuristischer Workaround ist möglich, aber …

 

Viele Parameter → hohe Komplexität des Modells

  • Viele lokale Maxima
  • Anfällig für “Overfitting” (Überanpassung)

 

Nicht unbedingt ein Problem für Text Mining (nur interessiert an Anpassung an “Trainingsdokumente” )

Semantische Technologien und Informationsextraktion

Was ist Clusteranalyse?
Nenne einige Beispiele.
  • Aufdecken „natürlicher Strukturen”
  • Gruppierung ähnlicher (Text)-Objekte, z.B. Dokumente, Begriffe, Passagen, Websites,…

Semantische Technologien und Informationsextraktion

Warum Clusteranalyse für Textdaten?

Allgemein sehr nützlich für Textmining und explorative Textanalyse:

  • Um ein Gefühl für den Inhalt einer Textsammlung zu bekommen (z.B.: Was sind typische/repräsentative Dokumente in der Sammlung?)
  • Verbinden (ähnlicher) Textobjekte (z.B.: Deduplizierung)
  • Erzeugen einer Struktur auf den Textdaten (z.B.: für das Surfen im Netz)
  • Eine Möglichkeit zusätzliche Feature (Cluster) zur Klassifikation von Textobjekten zu induzieren

Semantische Technologien und Informationsextraktion

Nenne Beispiele für Clustering von Textdaten.

Beispiele für Anwendungen

  • Clustering von Suchergebnissen
  • Verstehen der Hauptbeschwerden in Kunden-E-Mails

Semantische Technologien und Informationsextraktion

Welche zwei Strategien um optimale Cluster zu erhalten gibt es?

  • Progressives Konstruieren einer Hierarchie von Clustern (Hierarchische Clusteranalyse)
    • Bottom-up (agglomerativ): graduelles gruppieren ähnlicher Objekte in größere Cluster
    • Top-down (divisive): graduelles gruppieren ähnlicher Objekte in kleinere Cluster


  • Start mit einer “vorsichtigen” Clusteranalyse und iterativer Verbesserung (“flaches” Clustering, z.B.: k-Means)

Semantische Technologien und Informationsextraktion

Beschreibe das Vorgehen der direkten Evaluation von Clustern

Wie nahe sind systemgenerierte Cluster idealen Clustern, erzeugt durch Menschen?

  •  “Nähe” kann aus verschiedenen Perspektiven beurteilt werden
  • “Nähe” kann quantifiziert werden
  • “Clustering-Perspektive” wird durch menschliche Beurteiler diktiert


Evaluationsprozedur:

  1. Gegeben einer Testmenge müssen Menschen ein ideales Clustering erzeugen (eine ideale Partitionierung von Textobjekten oder “Gold-Standard”)
  2. Verwende ein System, um Cluster derselben Testmenge zu erzeugen
  3. Quantifiziere die Ähnlichkeit zwischen beiden Clustering
  • Ähnlichkeit kann aus verschiedenen Perspektiven gemessen werden (z.B. Purity, normalisierte Transinformation, 𝐹 −Maß, WSS, BSS, Durchmesser, Dunn’s Index)

Semantische Technologien und Informationsextraktion

Beschreibe das Vorgehen der indirekten Evaluation von Clustern

Wie nützlich sind die Cluster Ergebnisse für die beabsichtigte Anwendung?

  • “Nützlichkeit” ist zwangsläufig anwendungsspezifisch
  • “Clustering-Perspektive” wird durch die beabsichtigte Anwendung auferlegt.


Evaluationsprozedur:

  • Erzeuge eine Testmenge für die beabsichtigte Anwendung, um die Performanz jedes Systems für diese Anwendung zu quantifizieren
  • Wähle ein Baseline-System als Vergleichspartner
  • Füge einen Cluster-Algorithmus hinzu → “Clustering System”
  • Vergleiche die Performanz beider Systeme hinsichtlich eines Performanzmaßes für die Anwendung

Semantische Technologien und Informationsextraktion

Welches von den folgenden Verfahren ist Nicht empfindlich für Ausreißer

Single-link

Semantische Technologien und Informationsextraktion

Welche der folgenden Aussagen über das Mix-Model beim Clustering ist richtig?

Themen sind eine Mischung von Wörtern, bei denen das Gewicht nicht nur von den Themen abhängt, sondern auch von den Unterlagen.

Melde dich jetzt kostenfrei an um alle Karteikarten und Zusammenfassungen für Semantische Technologien und Informationsextraktion an der Hochschule Mittweida zu sehen

Singup Image Singup Image
Wave

Andere Kurse aus deinem Studiengang

Für deinen Studiengang Semantische Technologien und Informationsextraktion an der Hochschule Mittweida gibt es bereits viele Kurse auf StudySmarter, denen du beitreten kannst. Karteikarten, Zusammenfassungen und vieles mehr warten auf dich.

Zurück zur Hochschule Mittweida Übersichtsseite

Management von Informationstechnologien

Informationstechnologie

Tourism Information Technology

Informationstechnologie

Management von Informationstechnologien

Was ist StudySmarter?

Was ist StudySmarter?

StudySmarter ist eine intelligente Lernapp für Studenten. Mit StudySmarter kannst du dir effizient und spielerisch Karteikarten, Zusammenfassungen, Mind-Maps, Lernpläne und mehr erstellen. Erstelle deine eigenen Karteikarten z.B. für Semantische Technologien und Informationsextraktion an der Hochschule Mittweida oder greife auf tausende Lernmaterialien deiner Kommilitonen zu. Egal, ob an deiner Uni oder an anderen Universitäten. Hunderttausende Studierende bereiten sich mit StudySmarter effizient auf ihre Klausuren vor. Erhältlich auf Web, Android & iOS. Komplett kostenfrei. Keine Haken.

Awards

Bestes EdTech Startup in Deutschland

Awards
Awards

European Youth Award in Smart Learning

Awards
Awards

Bestes EdTech Startup in Europa

Awards
Awards

Bestes EdTech Startup in Deutschland

Awards
Awards

European Youth Award in Smart Learning

Awards
Awards

Bestes EdTech Startup in Europa

Awards
X

StudySmarter - Die Lernplattform für Studenten

StudySmarter

4.5 Stars 1100 Bewertungen
Jetzt entdecken
X

Gute Noten in der Uni? Kein Problem mit StudySmarter!

89% der StudySmarter Nutzer bekommen bessere Noten in der Uni.

50 Mio Karteikarten & Zusammenfassungen
Erstelle eigene Lerninhalte mit Smart Tools
Individueller Lernplan & Statistiken


Lerne mit über 1 Millionen Nutzern in der kostenlosen StudySmarter App.

Du bist schon registriert? Hier geht‘s zum Login