2006-01

考えたこと

Web検索なんかでも単語の重みは重要

Webページに含まれる単語の重みを計算し重要度を算出することは一般的 例えばTF-IDF法なんかが有名。単語を抽出するために形態素解析を使ったり、N-gramを使ったりする他にも、形態素解析+構文解析+係り受け解析で文章中の重要語を抜き出し...
考えたこと

ここまで読んだ機能 on Webブラウザ

2chブラウザなんかにある「ここまで読んだ機能」がWebブラウザにもあればよいと思う動作としては、表示されているWebページ上の一部を範囲指定後、コンテクストメニューあたりから「ここまで読んだ」を設定。次回アクセス時に指定したところを基準に...
考えたこと

Web検索エンジンと日時

今のところ、Web検索をする際に日時について検索することは難しい Webを検索する際に、そのコンテンツがいつ(作成|更新|削除)されたかは重要ではないこれはこれで面白いけど・・・例)2006年1月1日に作成されたWebページを見たいそのコン...
考えたこと

デスクトップ検索について

不満なところ PC上の全てのファイルを対象とする必要があるのか たぶん必要ないPC上で、自分が作った or 自分が集めたファイル(要は探したいファイル)は割合少ないと思う検索できるファイル以外見つけられない 検索できるファイル以外は探せない...