2006-01

考えたこと

Web検索なんかでも単語の重みは重要

Webページに含まれる単語の重みを計算し重要度を算出することは一般的 例えばTF-IDF法なんかが有名。単語を抽出するために形態素解析を使ったり、N-gramを使ったりする 他にも、形態素解析+構文解析+係り受け解析で文章中の重要語を抜き出...
考えたこと

ここまで読んだ機能 on Webブラウザ

2chブラウザなんかにある「ここまで読んだ機能」がWebブラウザにもあればよいと思う 動作としては、表示されているWebページ上の一部を範囲指定後、 コンテクストメニューあたりから「ここまで読んだ」を設定。 次回アクセス時に指定したところを...
考えたこと

Web検索エンジンと日時

今のところ、Web検索をする際に日時について検索することは難しい Webを検索する際に、そのコンテンツがいつ(作成|更新|削除)されたかは重要ではない これはこれで面白いけど・・・ 例)2006年1月1日に作成されたWebページを見たい そ...
考えたこと

デスクトップ検索について

不満なところ PC上の全てのファイルを対象とする必要があるのか たぶん必要ない PC上で、自分が作った or 自分が集めたファイル(要は探したいファイル)は割合少ないと思う 検索できるファイル以外見つけられない 検索できるファイル以外は探せ...