論文というものはすぐにたまる.読みもしないのにどんどんたまる.21世紀に入った頃は論文のプリントアウトの山ができて定期的に捨てたりしていたのだが,それも今は昔,現在はpdfの時代であり,かなり前からpdfで読んで,注釈など書き込んだりするようになった.しかし,どんどんたまるのは昔以上である.何しろ取るスペースはディスクの容量だけで,物理空間を占拠するわけではないから,いくらでも気兼ねなくため込める.ため込んだ論文数が数千を越えるあたりで,ふと思うわけである.「これを全て読むのは不可能としても,全文検索ができたら便利だろうなぁ...」
という訳で,今回は,hyperestraierを使ってため込んだpdfの全文検索をできるようにしようという話である.