Probabilistic models for semantic visualization and its applications

Le, Van Minh Tuan

doi:10.25440/smu.12310163.v1

Probabilistic models for semantic visualization and its applications

thesis

posted on 2020-05-15, 08:47 authored by Van Minh Tuan LeVan Minh Tuan Le

Visualization of high-dimensional data, such as text documents, is useful to map out the similarities among various data points. In the high-dimensional space, documents are commonly represented as bags of words, with dimensionality equal to the vocabulary size. Classical document visualization directly reduces this into visualizable two or three dimensions. Recent approaches consider an intermediate representation in topic space, between word space and visualization space, which preserves the semantics by topic modeling. These approaches consider the problem of semantic visualization which attempts to jointly model visualization and topics. With semantic visualization, documents with similar topics will be displayed nearby. This dissertation focuses on building probabilistic models for semantic visualization by modeling other aspects of documents (i.e., document relationships and document representations) in addition to their texts. The objective is to improve the quality of similarity-based document visualization while maintaining topic quality. In addition, we find applications of semantic visualization to various problems. For document collection visualization, we develop a system for navigating a text corpus interactively and topically via browsing and searching. Another application is single document visualization for visual comparison of documents using word clouds.

History

Document type

PhD dissertation

Degree awarded

PhD in Information Systems

Year degree awarded

2017

Supervisor(s)

LAUW, Hady Wirawan

Committee members

JIANG Jing; David LO, LEE Wee Sun (NUS)

SMU School

School of Information Systems

No. of pages

162

Usage metrics

Keywords

semantic visualization topic model generative model dimensionality reduction Pattern Recognition and Data Mining

Licence

CC BY-NC-ND 4.0

Probabilistic models for semantic visualization and its applications

History

Document type

Degree awarded

Year degree awarded

Supervisor(s)

Committee members

SMU School

No. of pages

Usage metrics

Categories

Keywords

Licence

Exports