考えたこと

半自動的な索引の付け方

索引は重要だということ 最近のBlogやWikiの流行のせいで、Webサイト全体では無く個々のWebページに焦点が集まる機会が増えたような気がする。Blogは1エントリーごとに独立している(はずだ)し、Wikiもとりあえずページ単位で修正す...
考えたこと

ライセンスの行方

BBS等で、利用者が投稿する記事に対するライセンスを指定するものが多いと思う 例えば、こんな感じ(by 2ch) 投稿確認 ・投稿者は、投稿に関して発生する責任が全て投稿者に帰すことを承諾します。 ・投稿者は、話題と無関係な広告の投稿に関し...
考えたこと

Web2.0雑感 from mixi

**Web2.0って一言で言うと 「コンピュータも使えないような馬鹿でも、いいもん(情報)持ってんじゃん。さっさと出せよ」 っていうある種カツアゲ的なもんだと思うんですよ まぁ、世の中の人は大抵大人なのでもっとオブラートに包んだり歩み寄った...
考えたこと

匿名のSNSに関する一考察

**匿名性ってよく話題になると言うお話 Webでは匿名と記名の二つの話が盛り上がることが多い 特に掲示板やなんかの利用者参加型のコンテンツの利用に対して 以下では、単に「議論」と言った場合には、各々「スレッド」や「トピック」などの馴染み深い...
考えたこと

Ajaxについての雑感 from mixi

で、ぼやぼやしていたのですが話はAjaxです 要は、Javascriptなんかを使ってWebサーバと非同期通信するよってな話で、これが出来ると今まで見たいに「接続してます」で待たされなくなるってな話です。今流行りの技術ですぜ。このあたりを指...
考えたこと

CSVなどの表形式を検索・共有するWebサービス

背景 大前提 ・既存のWebを検索する方法は文字情報に基づいて検索を行う ・Web上には様々なデータが公開されている ・文章や画像、表など どんなの? #### -文章については既存のWeb検索エンジンの対象 -画像なども文章情報などをヒン...
考えたこと

Folksonomyについて漠然と考えていたお話 from mixi

Folksonomy雑感 Folksonomyってのは要するに、それぞれが自分の好きなようにキーワードをつければ、分類なんかを予め考える必要はないんじゃね? ってこと キーワードってのはタグって言ったほうが通りが良いかも 他にも、一つのリソ...
考えたこと

Web検索なんかでも単語の重みは重要

Webページに含まれる単語の重みを計算し重要度を算出することは一般的 例えばTF-IDF法なんかが有名。単語を抽出するために形態素解析を使ったり、N-gramを使ったりする 他にも、形態素解析+構文解析+係り受け解析で文章中の重要語を抜き出...
考えたこと

ここまで読んだ機能 on Webブラウザ

2chブラウザなんかにある「ここまで読んだ機能」がWebブラウザにもあればよいと思う 動作としては、表示されているWebページ上の一部を範囲指定後、 コンテクストメニューあたりから「ここまで読んだ」を設定。 次回アクセス時に指定したところを...
考えたこと

Web検索エンジンと日時

今のところ、Web検索をする際に日時について検索することは難しい Webを検索する際に、そのコンテンツがいつ(作成|更新|削除)されたかは重要ではない これはこれで面白いけど・・・ 例)2006年1月1日に作成されたWebページを見たい そ...