显示或隐藏“基本单词”标记化方法使用的分隔符。要修改使用的一组分隔符,必须在 JSL 中使用 Add Delimiters()Set Delimiters() 消息。仅当选定的标记化方法为“基本单词”时,该选项才可用。
请参见启动“文本分析器”平台中有关词干处理选项的说明。
请参见启动“文本分析器”平台中关于标记化选项的说明。
“词条选项”管理窗口是四个类似的窗口,您可以使用它们来管理停止词、重新编码、短语和词干例外情况的集合。“管理停止词”窗口显示“管理停止词”窗口。“管理短语”和“管理词干例外情况”窗口与“管理停止词”窗口相同。“管理重新编码”窗口略有不同。请参见管理重新编码
“管理停止词”窗口
用户逻辑库文件位于 TextExplorer 目录中。该目录的位置基于计算机的操作系统:
Windows:"C:/Users/<用户名>/AppData/Roaming/SAS/JMP/TextExplorer/<语言>/"
Macintosh:"/Users/<用户名>/Library/Application Support/JMP/TextExplorer/<语言>/"
主用户逻辑库文件位于 TextExplorer 目录本身中。这些文件不是语言特定的。
您点击确定后,对“用户”和“列”列表的更改将分别保存到用户逻辑库和列属性中。仅当保存“文本分析器”报表的脚本时,才保存在“本地”和“本地例外情况”列表中指定的所有内容。
若将停止词保存到用户逻辑库,则该文件名为 stopwords.txt。若保存到列属性,则该属性称为“停止词”。
若将重新编码保存到用户逻辑库,则该文件名为 recodes.txt。若保存到列属性,则该属性称为“重新编码”。
若将短语保存到用户逻辑库,则该文件名为 phrases.txt。若保存到列属性,则该属性称为“短语”。
若将词干例外情况保存到用户逻辑库,则该文件名为 stemExceptions.txt。若保存到列属性,则该属性称为“词干例外情况”。