Semantische Technologien und Informationsextraktion at Hochschule Mittweida

Flashcards and summaries for Semantische Technologien und Informationsextraktion at the Hochschule Mittweida

Arrow Arrow

It’s completely free

studysmarter schule studium
d

4.5 /5

studysmarter schule studium
d

4.8 /5

studysmarter schule studium
d

4.5 /5

studysmarter schule studium
d

4.8 /5

Study with flashcards and summaries for the course Semantische Technologien und Informationsextraktion at the Hochschule Mittweida

Exemplary flashcards for Semantische Technologien und Informationsextraktion at the Hochschule Mittweida on StudySmarter:

Was ist Clusteranalyse?
Nenne einige Beispiele.

Exemplary flashcards for Semantische Technologien und Informationsextraktion at the Hochschule Mittweida on StudySmarter:

Benenne die Bestandteile der Opinion Repräsentation und erläutere diese.

Exemplary flashcards for Semantische Technologien und Informationsextraktion at the Hochschule Mittweida on StudySmarter:

Welche der folgenden Aussagen über das Mix-Model beim Clustering ist richtig?

This was only a preview of our StudySmarter flashcards.
Flascard Icon Flascard Icon

Millions of flashcards created by students

Flascard Icon Flascard Icon

Create your own flashcards as quick as possible

Flascard Icon Flascard Icon

Learning-Assistant with spaced repetition algorithm

Sign up for free!

Exemplary flashcards for Semantische Technologien und Informationsextraktion at the Hochschule Mittweida on StudySmarter:

Welches von den folgenden Verfahren ist Nicht empfindlich für Ausreißer

Exemplary flashcards for Semantische Technologien und Informationsextraktion at the Hochschule Mittweida on StudySmarter:

Warum Clusteranalyse für Textdaten?

Exemplary flashcards for Semantische Technologien und Informationsextraktion at the Hochschule Mittweida on StudySmarter:

Nenne Beispiele für Clustering von Textdaten.

Exemplary flashcards for Semantische Technologien und Informationsextraktion at the Hochschule Mittweida on StudySmarter:

Definiere eine Opinion(Meinung)?

This was only a preview of our StudySmarter flashcards.
Flascard Icon Flascard Icon

Millions of flashcards created by students

Flascard Icon Flascard Icon

Create your own flashcards as quick as possible

Flascard Icon Flascard Icon

Learning-Assistant with spaced repetition algorithm

Sign up for free!

Exemplary flashcards for Semantische Technologien und Informationsextraktion at the Hochschule Mittweida on StudySmarter:

Welche Aufgaben hat das Topic Mining

Exemplary flashcards for Semantische Technologien und Informationsextraktion at the Hochschule Mittweida on StudySmarter:

Beschreibe das Vorgehen der indirekten Evaluation von Clustern

Exemplary flashcards for Semantische Technologien und Informationsextraktion at the Hochschule Mittweida on StudySmarter:

Beschreibe das Vorgehen der direkten Evaluation von Clustern

Exemplary flashcards for Semantische Technologien und Informationsextraktion at the Hochschule Mittweida on StudySmarter:

Welche zwei Strategien um optimale Cluster zu erhalten gibt es?

This was only a preview of our StudySmarter flashcards.
Flascard Icon Flascard Icon

Millions of flashcards created by students

Flascard Icon Flascard Icon

Create your own flashcards as quick as possible

Flascard Icon Flascard Icon

Learning-Assistant with spaced repetition algorithm

Sign up for free!

Exemplary flashcards for Semantische Technologien und Informationsextraktion at the Hochschule Mittweida on StudySmarter:

Welche Nachteile hat die PLSA?

Your peers in the course Semantische Technologien und Informationsextraktion at the Hochschule Mittweida create and share summaries, flashcards, study plans and other learning materials with the intelligent StudySmarter learning app.

Get started now!

Flashcard Flashcard

Exemplary flashcards for Semantische Technologien und Informationsextraktion at the Hochschule Mittweida on StudySmarter:

Semantische Technologien und Informationsextraktion

Was ist Clusteranalyse?
Nenne einige Beispiele.
  • Aufdecken „natürlicher Strukturen”
  • Gruppierung ähnlicher (Text)-Objekte, z.B. Dokumente, Begriffe, Passagen, Websites,…

Semantische Technologien und Informationsextraktion

Benenne die Bestandteile der Opinion Repräsentation und erläutere diese.

  • Splittet sich auf in Grundlegende und Erweiterte Opinion-Repräsentation

Grundlegende Opinion-Repräsentation

  • Opinion Holder: Wessen Meinung?
  • Opinion Target: Worüber wurde eine Meinung geäußert?
  • Opinion Content: Was genau ist die Meinung?

 Erweiterte Opinion-Repräsentation

  •  Opinion Context: In welcher Situation (z.B. Zeit, Ort) wurde die Meinung zum Ausdruck gebracht?
  • Opinion Sentiment: Was sagt uns die Meinung über die Stimmung/Gefühle (z.B. positiv vs. negativ) des Opinion Holders?

Semantische Technologien und Informationsextraktion

Welche der folgenden Aussagen über das Mix-Model beim Clustering ist richtig?

Themen sind eine Mischung von Wörtern, bei denen das Gewicht nicht nur von den Themen abhängt, sondern auch von den Unterlagen.

Semantische Technologien und Informationsextraktion

Welches von den folgenden Verfahren ist Nicht empfindlich für Ausreißer

Single-link

Semantische Technologien und Informationsextraktion

Warum Clusteranalyse für Textdaten?

Allgemein sehr nützlich für Textmining und explorative Textanalyse:

  • Um ein Gefühl für den Inhalt einer Textsammlung zu bekommen (z.B.: Was sind typische/repräsentative Dokumente in der Sammlung?)
  • Verbinden (ähnlicher) Textobjekte (z.B.: Deduplizierung)
  • Erzeugen einer Struktur auf den Textdaten (z.B.: für das Surfen im Netz)
  • Eine Möglichkeit zusätzliche Feature (Cluster) zur Klassifikation von Textobjekten zu induzieren

Semantische Technologien und Informationsextraktion

Nenne Beispiele für Clustering von Textdaten.

Beispiele für Anwendungen

  • Clustering von Suchergebnissen
  • Verstehen der Hauptbeschwerden in Kunden-E-Mails

Semantische Technologien und Informationsextraktion

Definiere eine Opinion(Meinung)?

Objektive oder sachliche Aussagen können bewiesen werden auf der einen Seite.

Bsp.: Der Laptop hat eine Batterie.


Opinion ≈ eine subjektive Aussage, die beschreibt, was eine Person über etwas (Gegenstand, Ereignis, Person…) glaubt oder denkt.

Bsp.: Der Laptop hat die beste Batterie.

→ haben also subjektive vs. objektive Aussage

subjektiv: 

  • betrifft immer eine Person = Opinion Holder (gibt die Meinung von sich)
  • Person spricht über etwas = Opinion Target
  • glauben/denken hängt von kulturellem und sozialem Hintergrund sowie dem Kontext ab
  • Bestandteile zusammenbringen und repräsentieren

Semantische Technologien und Informationsextraktion

Welche Aufgaben hat das Topic Mining

Aufgabe 1: Finde k Topics

Aufgabe 2: Finde heraus welches Dokument sich mit welchem Thema beschäftigt

Semantische Technologien und Informationsextraktion

Beschreibe das Vorgehen der indirekten Evaluation von Clustern

Wie nützlich sind die Cluster Ergebnisse für die beabsichtigte Anwendung?

  • “Nützlichkeit” ist zwangsläufig anwendungsspezifisch
  • “Clustering-Perspektive” wird durch die beabsichtigte Anwendung auferlegt.


Evaluationsprozedur:

  • Erzeuge eine Testmenge für die beabsichtigte Anwendung, um die Performanz jedes Systems für diese Anwendung zu quantifizieren
  • Wähle ein Baseline-System als Vergleichspartner
  • Füge einen Cluster-Algorithmus hinzu → “Clustering System”
  • Vergleiche die Performanz beider Systeme hinsichtlich eines Performanzmaßes für die Anwendung

Semantische Technologien und Informationsextraktion

Beschreibe das Vorgehen der direkten Evaluation von Clustern

Wie nahe sind systemgenerierte Cluster idealen Clustern, erzeugt durch Menschen?

  •  “Nähe” kann aus verschiedenen Perspektiven beurteilt werden
  • “Nähe” kann quantifiziert werden
  • “Clustering-Perspektive” wird durch menschliche Beurteiler diktiert


Evaluationsprozedur:

  1. Gegeben einer Testmenge müssen Menschen ein ideales Clustering erzeugen (eine ideale Partitionierung von Textobjekten oder “Gold-Standard”)
  2. Verwende ein System, um Cluster derselben Testmenge zu erzeugen
  3. Quantifiziere die Ähnlichkeit zwischen beiden Clustering
  • Ähnlichkeit kann aus verschiedenen Perspektiven gemessen werden (z.B. Purity, normalisierte Transinformation, 𝐹 −Maß, WSS, BSS, Durchmesser, Dunn’s Index)

Semantische Technologien und Informationsextraktion

Welche zwei Strategien um optimale Cluster zu erhalten gibt es?

  • Progressives Konstruieren einer Hierarchie von Clustern (Hierarchische Clusteranalyse)
    • Bottom-up (agglomerativ): graduelles gruppieren ähnlicher Objekte in größere Cluster
    • Top-down (divisive): graduelles gruppieren ähnlicher Objekte in kleinere Cluster


  • Start mit einer “vorsichtigen” Clusteranalyse und iterativer Verbesserung (“flaches” Clustering, z.B.: k-Means)

Semantische Technologien und Informationsextraktion

Welche Nachteile hat die PLSA?

Kein generatives Modell

  • brauchen immer πs um ein Dok zu erzeugen, welche wiederum an Dok in Trainingsdaten gebunden
  • Kann die Wahrscheinlichkeit eines neuen Dokumentes nicht berechnen
  • Heuristischer Workaround ist möglich, aber …

 

Viele Parameter → hohe Komplexität des Modells

  • Viele lokale Maxima
  • Anfällig für “Overfitting” (Überanpassung)

 

Nicht unbedingt ein Problem für Text Mining (nur interessiert an Anpassung an “Trainingsdokumente” )

Sign up for free to see all flashcards and summaries for Semantische Technologien und Informationsextraktion at the Hochschule Mittweida

Singup Image Singup Image
Wave

Other courses from your degree program

For your degree program Semantische Technologien und Informationsextraktion at the Hochschule Mittweida there are already many courses on StudySmarter, waiting for you to join them. Get access to flashcards, summaries, and much more.

Back to Hochschule Mittweida overview page

Englisch

Allgemeine Forensik

Rechnernetze und Netztechnologien

Forensik III

Computerforensik 1

Forensik II

Text Retrieval und Text Mining

Allgemeine Forensik III

Allgemeine Forenisk

Allgemeine Forensik I

Informationstechnologie at

Hochschule Furtwangen

Management von Informationstechnologien at

FOM Hochschule für Oekonomie & Management

Mgmt. von Informationstechnologien at

FOM Hochschule für Oekonomie & Management

Management von Informationstechnologien at

FOM Hochschule für Oekonomie & Management

Karteikarten Informationstechnologie at

FOM Hochschule für Oekonomie & Management

Similar courses from other universities

Check out courses similar to Semantische Technologien und Informationsextraktion at other universities

Back to Hochschule Mittweida overview page

What is StudySmarter?

What is StudySmarter?

StudySmarter is an intelligent learning tool for students. With StudySmarter you can easily and efficiently create flashcards, summaries, mind maps, study plans and more. Create your own flashcards e.g. for Semantische Technologien und Informationsextraktion at the Hochschule Mittweida or access thousands of learning materials created by your fellow students. Whether at your own university or at other universities. Hundreds of thousands of students use StudySmarter to efficiently prepare for their exams. Available on the Web, Android & iOS. It’s completely free.

Awards

Best EdTech Startup in Europe

Awards
Awards

EUROPEAN YOUTH AWARD IN SMART LEARNING

Awards
Awards

BEST EDTECH STARTUP IN GERMANY

Awards
Awards

Best EdTech Startup in Europe

Awards
Awards

EUROPEAN YOUTH AWARD IN SMART LEARNING

Awards
Awards

BEST EDTECH STARTUP IN GERMANY

Awards
X

StudySmarter - The study app for students

StudySmarter

4.5 Stars 1100 Rating
Start now!
X

Good grades at university? No problem with StudySmarter!

89% of StudySmarter users achieve better grades at university.

50 Mio Flashcards & Summaries
Create your own content with Smart Tools
Individual Learning-Plan

Learn with over 1 million users on StudySmarter.

Already registered? Just go to Login