anobiidae's blog

個人的に自然言語処理とかに関して、調べ物したもののメモとかを残す場所。

ECGSまとめ。

Standard-CGS

・全ドキュメント、全単語の「出現回数」分処理をするので重たい。

ECGS-Shortcut

・全ドキュメントの単語は同じtopicに属するものと、ざっくり決める。

・100回出現していても1回で決めれる。

ECGS-Dynamic

・全ドキュメントの単語は異なるtopicに属する(Standardと同じ)

・Sampling数は処理しながら徐々に減るように(=探索空間を狭めるように)、一様乱数で決める。