複数のページからなる連載記事などを比較的簡単にePubに変換する方法

技術関係

Web連載されていてるなどして複数ページにまたがっている内容をブラウザ経由で見るのは正直しんどい
ついでにこの間Kindle4を買ったけど、いい加減青空文庫は飽きてきたもっと活用したいということで使う方法を考えてみる

で、それなりに使える作業手順がまとまってきたので一応書いておく

今回解決したかった問題

・すべてのWebページがePubに対応してるわけではない
・通常のページにはゴミになる情報が多すぎる
 ・一方で最低限必要な情報は残しておきたい
・画像をどうするかが面倒、手動で保存してなどはしんどすぎる
・Kindleで読みたい

必要なもの

Google Chrome
Evernote
Chrome拡張機能 Evernote Cleary
sigil
calibre

手順

文字だけにすると長くて面倒だけど、大体がワンステップ・ワンアクションなのでやってみるとそれなりに単純作業

ページ取り込み編

  • ePubにまとめたい複数ページをCleary経由でEvernoteに取り込む
  • Evernoteに一時的なノートブックを作成し、ページのノートを突っ込む
  • この時点でページを一旦ざっくり確認して、ゴミを外しておく(よくコメントや関連リンクなどが残りがち)
  • ノートブックをまるごとHTML形式でエクスポート
  • エクスポート先にディレクトリができ、中にHTMLや画像がひとまとめにされているはず
  • Sigilを立ち上げて新規ePubを作成する
  • 左ペインのTextを右クリックし「Add Existing Items…」を選択
  • 先にエクスポートしたディレクトリにあるHTMLを一個ずつ追加していく

ePub作成編

  • ファイル名を半角英数字に変換する(例:page01.htmlなど。日本語などを使うとCalibreの変換時にコケることがある)
  • 取り込んだページをざっと確認し、見出しにHeaderを割り当てていく
  • 右ペインよりTOCを生成する(ここでおかしければページを見直す)
  • 必要であればメタ要素も追加しておく
  • 上記が完了して保存するとePubができる
  • 生成されたePubファイルをCalibreに登録する
  • あとは勝手にCalibre上で形式をmobi形式などに変換する
  • Kindleなどに保存して完了

まとめ

とりあえず自力で特に難しいものや準備が必要なくWebのコンテンツからePubを作れるようになった
もう少し自動化したい気がするけど、単純作業のくせに自動化は難しそう

Web上にある程度まとまったコンテンツを公開している人ならば、
こんな感じのちょっと一手間でePubを作成してAmazonやらなんやらで販売とか夢が広がるかもしれない

逆にEvernoteに登録しているデータがある人は同じような手順でEvernoteのデータを持ち運べるかもしれない。
どうやって定期更新するのかは別だけど

タイトルとURLをコピーしました