基本分析 > 文本分析器 > 主题分析
发布日期: 04/13/2021

Image shown here主题分析

“主题分析,旋转 SVD”选项对文档词条矩阵 (DTM) 的偏奇异值分解 (SVD) 执行最大方差法旋转。您必须指定一些旋转奇异向量,这些向量与您想要从 DTM 保留的主题数相对应。指定一些主题后就会显示“主题分析”报表。

主题分析等价于旋转的主成分分析 (PCA)。最大方差法旋转获取一组奇异向量并旋转它们以使它们更直接指向坐标方向(朝向词条)。当每个旋转向量朝向一组词条时,该旋转使向量有助于解释文本。负值表示排斥力。具有负值的词条与具有正值的词条相比,在主题中出现的次数更少。

Image shown here“主题分析”报表

“主题分析”报表显示旋转后的每个主题中具有最大载荷的词条。还有其他显示旋转奇异值分解的成分的报表。

“按主题划分的前几位载荷”报表显示每个主题的词条表。每个表中的词条是对每个主题而言具有最大绝对值载荷的词条。按载荷绝对值的降序对每个表排序。可以使用这些表来确定对应于每个主题的概念性主题。

“主题分析”报表还包含以下报表:

主题载荷

包含跨各词条的主题的载荷矩阵。该矩阵等价于旋转 PCA 中的因子载荷矩阵。

按主题划分的词云

包含词云矩阵,每个主题一个词云。

主题得分

包含每个主题的文档得分的矩阵。主题中具有更高得分的文档更可能与该主题关联。

主题得分图

包含一个“显示文本”按钮和每个文档的主题得分图。点击“显示文本”按钮将打开一个窗口,其中包含选定文档的文本。

“主题得分图”报表是“主题得分”报表中的矩阵的直观表示。图中的每个面板对应于某一主题或“文档得分”矩阵的某一列。在每个面板内,每个点对应于语料库中的某一文档或“主题得分”矩阵的某一行。

每个主题解释的方差

包含由每个主题解释的方差表。该表还包含每个主题解释的变异的百分比和累积百分比列。

旋转矩阵

包含最大方差法旋转的旋转矩阵。

Image shown here“主题分析”报表选项

“主题分析”红色小三角菜单包含以下选项:

主题散点图矩阵

显示或隐藏旋转奇异值分解向量的散点图矩阵。点击“显示文本”按钮将打开一个窗口,其中包含选定文档的文本。

显示选项

包含用于显示或隐藏“主题分析”报表中显示的内容的选项。请参见“主题分析”报表

重命名主题

允许您为一个或多个主题添加说明性名称。

保存文档主题向量

将旋转奇异值分解中的用户指定的奇异向量数作为列保存到数据表。

保存主题向量公式

将建模类型为“向量”的公式列(其中包含旋转奇异值分解)保存到数据表中。生成的列使用 Text Score() JSL 函数。有关该函数的详细信息,请参见“帮助”>“脚本索引”。

保存词条主题向量

将主题向量作为列保存到使用“保存词条表”选项创建的数据表。

删除

从 SVD 报表中删除“主题分析”报表。

需要更多信息?有问题?从 JMP 用户社区得到解答 (community.jmp.com).