このバージョンのヘルプはこれ以降更新されません。最新のヘルプは https://www.jmp.com/support/help/ja/15.2   からご覧いただけます。


積み重ねた文書単語行列の保存
文書単語行列を、積み重ねた形式でJMPデータテーブルに保存します。この積み重ねた形式のデータテーブルは、「アソシエーション分析」プラットフォームで分析を行いたい場合に適しています。詳細については、『予測モデルおよび発展的なモデル』の「アソシエーション分析」章を参照してください。「テキストエクスプローラ」の起動ウィンドウでID変数を指定した場合は、このIDによって、単語が元のテキストデータテーブルのどの行からきたのかを識別できます。積み重ねたテーブルには、アソシエーション分析を起動するスクリプトも含まれています。
log10( 1 + x )を割り当てます(xは各文書内の単語の出現頻度)。
TF * log10( nDoc / nDocTerm )を割り当てます。“TF IDF”は、単語度数(term frequency)と文書度数の逆数(inverse document frequency)の略です。これがデフォルトの重みです。計算式の各項の定義は以下のとおりです。
TF = 文書内における単語の出現頻度
nDoc = コーパスに含まれる文書の数
nDocTerm = その単語を含む文書の数