「やじうまの杜」では、ニュース・レビューにこだわらない幅広い話題をお伝えします。
デジタルスキャンした書籍がなんか読みにくいなぁ……と感じたことはありませんか? それを解決してくれそうなソフトが「GitHub」で公開されています。ライセンスは「AGPL-3.0」。作者は「SoftEther VPN」などで知られる登大遊氏です。
本ソフト「DN_SuperBook_PDF_Converter」は、紙媒体をスキャンしてPDF化(いわゆる「自炊」)したドキュメントをAI、OCR(光学文字認識)、ヒューリスティック処理などを駆使して“徹底的に”読みやすくするもの。とくに古い書籍をスキャンしたときにありがちな、7つの主要課題が解決されているらしいです。
画質の低さ。汚れ・裏写り・モアレ・にじみページの傾きページごとの位置ズレ。ガタつき余白トリミングによるページ間の不揃いPDFページ番号と書籍ページ番号のズレ見開き時の左右ページの誤判定縦書き書籍の右→左ページ順の扱い
高画質化は「Real-ESRGAN」と呼ばれるAIエンジン(と、C#で自作したかなり行き当たりばったりのアルゴリズム)で実現されているとのことで、その効果はかなりのようです。
「DN_SuperBook_PDF_Converter」の動作はローカルPCで完結するため、データがクラウドサービスへ送出されることはありません。ただし、必要な依存ツールを用意して、自分でビルドしなければならないのはちょっとハードルが高いかも。
また、メモリを大量に消費する点、そこそこのGPUが必要になりそうな点(NVIDIAの「CUDA」に対応した「GeForce」シリーズを推奨)、x64版のWindows 10/11以外では動作が確認されていない点なども、場合によってはネックになるかもしれません。
それでも頑張るぜ! というガッツのある自炊erは、ぜひ試してみてください!


