2. Notation and terminology(1/2)
それではまずLDAの御本尊たる、 http://www.cs.princeton.edu/~blei/papers/BleiNgJordan2003.pdf を読みましょうと。
Exciteの翻訳がほとんと使えるレベルだなあ……
2. 注釈と単語
我々はこの論文においてここでは「words」「documents」と「corpora」のような実体を参照してテキスト集合の言語を扱う。これは、特に私たちがトピックのような抽象的観念を捕らえることを目標とする潜在的変数を導入する場合、それが直観をガイドするのを支援するのに役立ちます。しかし重要なのは、LDAモデルがテキストに必ずしも結び付けられず、コラボラティブ・フィルタリング、コンテンツベースのイメージ検索およびバイオインフォマティクスのような領域からのデータを含むデータの収集に関する他の問題への適用を持っていることに注目することは重要です。確かに、セクション7.3のうち、私たちは、コラボラティブ・フィルタリング領域の実験結果を示します。
不明単語とか
- corpora = コーパスの複数形(ど、どんな変形してるんだ)
- collaborative filtering
- content-based image retrieval
Section 7.3で詳細述べるとあるし、まいっか……
まあこれを見ると大体recomendationの話っぽいなー。
で、これを見ると「イメージをクエリーにしたイメージ検索」と。
そういえばgoogleの画像検索でもできたよなーと。