スポンサーサイト
-- / -- / -- ( -- ) |
|
|
はてなダイアリ
2008 / 07 / 30 ( Wed ) はてはてはてはて、はーてなー。ということで、
はてなダイアリーはじめました。 http://d.hatena.ne.jp/beiz23/ 今までブックマークしか使っていなかったのですが。 というのは、はてなダイアリは機能拡張が有料だったりして敬遠していたのです。 しかし、好みの書き手さんが使ってたりとか、始めうっとうしく感じた単語リンクを含め、情報のつながりが良い感じかなーと思うようになりました。 人のはてなダイアリに☆つけるときに、twitterと同じアカウントで☆つけたりできるのもいいしね。 試し書きしたところ、サーバのレスポンスも悪くないし、画像はったり記事編集するのがココより楽なので、しばらく続けて使ってみて、よさげだったらココを放棄して移るかもしれません。 二年スパンぐらいでblog移ってますが、すみません。 データはエクスポート&インポートするので、もしかしたら誰かに役立ってるかもしれないノウハウは失われないと思います。 |
隅田川花火大会
2008 / 07 / 29 ( Tue ) この前、土曜日に隅田川の花火大会に行ってきました。
いく前に柏の葉ららぽーとで、ナンカレーを食べたらおいしかった。 ![]() 金色のうんこというか雲が浮かぶ、台東区役所の裏道に設置された仮設トイレ。 ![]() 花火ー。 ![]() 花火の下半分が隠れてしまう位置でしたが、それでも、七色の宝石をちらばしたように、きらきらと光って広がり、消えてゆくさまが素敵でした。 1時間半があっというまに思えた。 |
電子ジャーナルのpdfファイルの管理
2008 / 07 / 25 ( Fri ) 私は、ダウンロードした電子ジャーナルは、ハードディスクに保存しておいて、再び読む必要ができたときに読めるようにしてあります。
しかし、たくさんたまってくると、ファイル名の付け方によっては、どれがどのジャーナルだったかがわからなくなります。 お勧めするファイル名としては、 first auther,year,title or keywords で、例えば、 JPetro2008stronglyCorrelation.pdf という感じです。 しかしながら、ファイル名を付けるときに思いついたkeywordsと、探すときに思いついたkeywordsが違ったり、そもそも保存するたびにファイル名をつけるのがめんどくさかったり。 別の方法としては、pdfからテキスト抽出して、データベース化することです。 xpdfパッケージに入っている、pdftotextを使用すると、テキスト抽出できます。 $ pdftotext inputfile.pdf outputfile.txt みたいに使います。 保存先のファイル名を省略すると自動で同名の.txtファイルが作成されるようです。 そこから、自分の好きなスクリプト言語でも使って、著者タイトルを抽出して、mysqlとかに登録してもよいでしょう。 また、txt化したファイルをひとつのディレクトリにまとめていれておいて、そこから、 cat *|grep "queryword" などとするのも楽かもしれません。 さらに別の方法としては、これが私のお薦めなのですが、全文検索エンジンnamazuをつかうことです。 最近のバージョンはpdftotextがインストールされていれば、pdfのindex化にもしてくれるようですので、pdfのディレクトリにindexディレクトリでも作って、 mkdir index mknmz -O index ./ とindexファイルを作成しておくと、探したいときには、 namazu "queryword" ./index というふうに検索できます。 これで、突然magnetic form factorの係数が必要になったときでも、楽々ピックアップできます。 pdftotextではtxt化できるのに(プロテクトがかかってないのに)、mknmzのときには英語pdfにも関わらず、 Unable to convert pdf file (maybe copying protection) といわれたり、ファイルサイズがでかいのでパスと言われるときには、 Setting up Linux http://www8.plala.or.jp/warmheart/linux/namazutips.html ここのサイトを参考に、/usr/share/namazu/filter/pdf.plの @pdfconvoptsの値を変えてみたり。(UTF-8っていうのは私が適当にいれたらうまく通ったので、そのままにしてあるだけで、他に副作用があるかもしれませんから、Shift-JISの方がいいかもしれません。)
/usr/share/namazu/pl/conf.plの$FILE_SIZE_MAXを $FILE_SIZE_MAX = 5000000; と50MB程度にしておくと、いいかもしれません。 |



