スポンサーサイト
-- / -- / -- ( -- )
上記の広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書く事で広告が消せます。
-- : -- : -- | スポンサー広告 | page top↑
2008 / 11 / 29 ( Sat )
00 : 46 : 39 | 未分類 | トラックバック(0) | コメント(0) | page top↑
はてなダイアリ
2008 / 07 / 30 ( Wed )
はてはてはてはて、はーてなー。ということで、
はてなダイアリーはじめました。

http://d.hatena.ne.jp/beiz23/

今までブックマークしか使っていなかったのですが。
というのは、はてなダイアリは機能拡張が有料だったりして敬遠していたのです。
しかし、好みの書き手さんが使ってたりとか、始めうっとうしく感じた単語リンクを含め、情報のつながりが良い感じかなーと思うようになりました。
人のはてなダイアリに☆つけるときに、twitterと同じアカウントで☆つけたりできるのもいいしね。

試し書きしたところ、サーバのレスポンスも悪くないし、画像はったり記事編集するのがココより楽なので、しばらく続けて使ってみて、よさげだったらココを放棄して移るかもしれません。
二年スパンぐらいでblog移ってますが、すみません。

データはエクスポート&インポートするので、もしかしたら誰かに役立ってるかもしれないノウハウは失われないと思います。
16 : 29 : 36 | 未分類 | トラックバック(0) | コメント(0) | page top↑
2008 / 07 / 29 ( Tue )
昨日は大阪から友達が遊びに来ていて、東京観光に繰り出すことになった。

はじめは秋葉原で喫茶店めぐり。
@homeを入り口からのぞいて、cureとmia cafeに行ってきた。それと、とらのあな1号店の方におじゃましてきた。並んでる本をみて、「そういえばパタリロのバンコランが。」とか、思い出すあたり、ただものじゃない友達だと思った。
ariaも知っていたし、そういうキャラなんでしたっけ。忘れた。

駅に戻る途中、icomの広告をみた。なつかしす、icom。


その後、無謀にも表参道の読/者モ/デルが働いてるという喫茶店へ行きたいというので、西側へ移動。オサレな西側は人種までも違いすぎる。
その喫茶店から放たれるオサレオーラに圧倒されて、入り口で入るのを躊躇する私ら。
その場はいったん離れて、五分ほどかけて周囲を無駄に歩き、決意を固めてから、入店。
イケメン店員とオサレなお客さんに、すみません、すみません、と内心謝りながら、甘いものを食べてきました。
なんかうまかったような気がしたが、緊張したという気分のが強い。

喫茶店といっても対極的なお店を回った一日でした。

p.s.神/宮橋にはコスプレした人いなかったよ!
14 : 48 : 11 | 未分類 | トラックバック(0) | コメント(0) | page top↑
隅田川花火大会
2008 / 07 / 29 ( Tue )
この前、土曜日に隅田川の花火大会に行ってきました。

いく前に柏の葉ららぽーとで、ナンカレーを食べたらおいしかった。


金色のうんこというか雲が浮かぶ、台東区役所の裏道に設置された仮設トイレ。


花火ー。


花火の下半分が隠れてしまう位置でしたが、それでも、七色の宝石をちらばしたように、きらきらと光って広がり、消えてゆくさまが素敵でした。
1時間半があっというまに思えた。
14 : 33 : 04 | 未分類 | トラックバック(0) | コメント(0) | page top↑
電子ジャーナルのpdfファイルの管理
2008 / 07 / 25 ( Fri )
私は、ダウンロードした電子ジャーナルは、ハードディスクに保存しておいて、再び読む必要ができたときに読めるようにしてあります。
しかし、たくさんたまってくると、ファイル名の付け方によっては、どれがどのジャーナルだったかがわからなくなります。
お勧めするファイル名としては、
first auther,year,title or keywords
で、例えば、
JPetro2008stronglyCorrelation.pdf
という感じです。

しかしながら、ファイル名を付けるときに思いついたkeywordsと、探すときに思いついたkeywordsが違ったり、そもそも保存するたびにファイル名をつけるのがめんどくさかったり。

別の方法としては、pdfからテキスト抽出して、データベース化することです。
xpdfパッケージに入っている、pdftotextを使用すると、テキスト抽出できます。
$ pdftotext inputfile.pdf outputfile.txt
みたいに使います。
保存先のファイル名を省略すると自動で同名の.txtファイルが作成されるようです。
そこから、自分の好きなスクリプト言語でも使って、著者タイトルを抽出して、mysqlとかに登録してもよいでしょう。
また、txt化したファイルをひとつのディレクトリにまとめていれておいて、そこから、
cat *|grep "queryword"
などとするのも楽かもしれません。

さらに別の方法としては、これが私のお薦めなのですが、全文検索エンジンnamazuをつかうことです。
最近のバージョンはpdftotextがインストールされていれば、pdfのindex化にもしてくれるようですので、pdfのディレクトリにindexディレクトリでも作って、
mkdir index
mknmz -O index ./
とindexファイルを作成しておくと、探したいときには、
namazu "queryword" ./index
というふうに検索できます。

これで、突然magnetic form factorの係数が必要になったときでも、楽々ピックアップできます。

pdftotextではtxt化できるのに(プロテクトがかかってないのに)、mknmzのときには英語pdfにも関わらず、
Unable to convert pdf file (maybe copying protection)
といわれたり、ファイルサイズがでかいのでパスと言われるときには、

Setting up Linux
http://www8.plala.or.jp/warmheart/linux/namazutips.html

ここのサイトを参考に、/usr/share/namazu/filter/pdf.plの
@pdfconvoptsの値を変えてみたり。(UTF-8っていうのは私が適当にいれたらうまく通ったので、そのままにしてあるだけで、他に副作用があるかもしれませんから、Shift-JISの方がいいかもしれません。)

if ($result =~ m/^pdftotext\s+version\s+([0-9]+\.[0-9]+)/m) {
$pdfconvver = $1;
}
if (util::islang("ja")) {
if ($pdfconvver >= 1.00) {

# @pdfconvopts = ('-q', '-raw', '-enc', 'EUC-JP');
@pdfconvopts = ('-q', '-raw', '-enc', 'UTF-8');

} else {
@pdfconvopts = ('-q', '-raw', '-eucjp');


/usr/share/namazu/pl/conf.plの$FILE_SIZE_MAXを
$FILE_SIZE_MAX = 5000000;
と50MB程度にしておくと、いいかもしれません。
20 : 26 : 55 | 未分類 | トラックバック(0) | コメント(0) | page top↑
| ホーム | 次ページ