はじめに、なぜ今そういう事を考えているかという話。昨今の生成系AI。いまはありものの生成系AIをサービスとして利用することが一般的なんだけど、少しずつ自分の持っている情報を覚え込ませてより制度の高い回答を期待するRAGってことが行われている。これはまだ企業レベルやニッチな人がやっているくらいだけど、もうしばらくするとそれが一般レベルまで降りてくるだろう。
それに加えて、RAGで利用できる情報量も増えていく事が考えられる。もちろん、こんなものを一般人が日常レベルで意識して使う未来というのは現実的ではなく、例えばGoogleDriveなんかに登録されているファイルを自動的に使えたりといった形になる気がする。今もGeminiとかだとやってるのがもう少し使いやすくなるイメージ。
で、そのときに重要なのは手持ちの情報をどう保持しておくかということ。例えば、様々なところで買ったり配布されている書籍や文字資料、過去に自炊してきた本や漫画、どっかでもらったりダウンロードしたパンフレット、自分で書いたメモ。もしかすると近い将来は音楽や動画、今までのスケジュール情報など、扱えるだろう情報は色々ある。もう少し先に生まれてくる世代は、そういった情報ははじめから保存されるようになっているだろうから良いとして、Before AIな世代がその恩恵を得ようとするなら、自分の持っている情報を利活用できる形にしておかないと行けない。
本当は、Evernoteがその役目を果たしてくれれば良いんだけど、Evernote一本に賭けるよりはもう少し選択肢がある形にしておいたほうが良いと思う。
で、手始めに手元にある文字情報をどうにかしようとして考えたのが今回の話。必要な条件はいくつかある。まぁ、どれも当たり前のことなので、個別の説明はしない。
- 現状でも利用しやすい形式であること
- 将来において利用されていそうな形式であること
- 将来別の形式に容易に変換可能なこと
で、続けて手元にある文字情報を種別に分ける必要がある。最後の画像は、例えば漫画やなんかやね。
- PDFなどの固定レイアウト
- ePubやmobiなどのフローレイアウト
- 画像
普通に考えると、何でもかんでもePubにしてしまえという話があるんだけど、そうは問屋が卸さない。そもそもWindows環境でのePubの扱いは割と貧相な感じでいい感じのツールがなかなかない。特に漫画のような見開きがあるものを読もうとするとうまく見開いてくれなかったり、縦書き横書きがうまくできていなかったりと読書体験が損なわれる。
という感じで、色々試行錯誤してきたのだけど、その試行錯誤は取っ払って今こうなったというところだけ書いておく。
電子書籍の形式について。やってみてわかったけど、非常にクセが強くて1本化が難しい。一つ一つ手間暇をかければ何とかなるんだろうけど、後述するCalibreでの扱いもあるし、はっきり言ってそんな手間をかけたくはない。で、こんな感じに。あと、さっき上に書いた電子書籍の種別も、実際にやってみるとそうではないなという感じになった。
- PDF(非アウトライン)。これは文字が選択できるタイプのPDF。この形式は変換しようとして難儀する。ので、PDFそのままとした。
- PDF(アウトライン化済み)。これは文字が選択できないタイプのPDF。この形式は画像として扱うのが楽。ので、cbz形式とする。PDF → ePub → cbz
- 画像。これは上と同じ cbz形式とする。昔自炊した本なんかも同じ扱い。
- それ以外。それ以外の形式は、基本的にePub形式とする
一番悩んだのは、1。なんとかePubに統一できないかと思ったけど、リーダーがうまいことついてこなかった。ので、最終形としては、ePub形式、PDF形式、cbz形式の3つ。ただし、cbz形式の場合は中間生成物でePub形式を保存しているので、あとからはどうにかなりそう。思った以上にアウトライン化していないPDFの厄介さが際立つ。
まず、電子書籍の管理はCalibreとした。老舗の管理ツールで、書籍の管理、書籍の編集、書籍の表示まで一通りできるのが強み。ちょっと操作とか分かりづらいけど、そこら辺は乗り切った。ただ、書籍の表示については日本語含めて扱いが微妙感がすごかったので別のソフトウェアを使っている。
電子書籍の閲覧はTubame Viewer。シンプルな作りながら、見開きなんかも対応していていい感じ。ePubもcbzも問題なく見れる。ただ、PDFは見れない。まぁ良いか。見開きもフォントも簡単に指定できるし、余計な管理機能がないのもグッド。難点は、ePub形式のとき埋め込まれている画像がウインドウの幅いっぱいになること。ただ、これはePubの中で画像の幅が指定されていないか、幅が100%で指定されているんだと思うので、Tsubame Viewerのせいじゃないとは思う。
あれ?おかしいなもっと色々書くんだと思ったけど、終わってみればシンプルな感じに。やってる最中は、むしろCalibreの変換のところがうまくいかず悩んだり、電子書籍の分類の整合性に気がついてなかったりしてたのが大変だったかな。
ひとまず手元にある電子書籍の整理は終わったので、今後どうしていくかについて。今までEvernoteに放り込んでいた論文的なものや、色んな人たちの発表資料、各種パンフレット、リーフレットなんかもこの仕組みに取り込んでいくのが良いんじゃないかと思ってたりはする。ちょっと手間しいけど。将来的には、Evernoteに放り込んでおくのと、どっちが良いんだろうなぁ。
あと、Calibreで一つおもしろいのが、電子書籍を登録すると、1つの電子書籍で複数のファイル形式をまとめて扱うことができる機能。普通は、ある電子書籍のPDF版、ePub版、mobi版といった感じでまとめて管理できるのが嬉しいんだけど、これ登録するだけなら電子書籍に限らないんだよね。例えば、mp4とか画像とかも登録できちゃう。そうなると講演会の動画と資料をまとめて管理できたり、とかね?ただ、同じ形式のファイルは複数登録できないので、一つの講演会の資料を一つの仮想的な電子書籍にして一元管理するとかは難しい。ざんねん。