空談録

http://artfulplace.net/blogs/ からひっこしつつ

TumblrのLikeから画像を保存するあれ ver1.20

更新の手順をすっかり忘れてました
分散しすぎなんや…

というわけで1.20です
なんかいろいろ変えました。容量も減りました、やったね!
ただし設定ファイルの容量が増えます、よくないね!

ダウンロードは http://artfulplace.net/files/TumblrLikeSaving-1-20.zip からどうぞ
Chromeさんだとなんか言ってきますが信頼できるものかどうかは私がどうこうできませんのではい
でかいところに置けばいいとかあるならそうしますがうーん

変更点は次の通りです
・ファイル保存時にエラーが起こった場合、保存済みフラグが立ってしまうのでリトライするようにした
・使用率が低いライブラリを削除した
スクレイピングを行う際にUserAgentを上書きできるようにした
・リトライに関するデータを削除できるようにした
・URLをSHA1、またはMD5ハッシュ値を取って保持できるようにした
・ID重複をtrailでチェック可能にした
・SourceUrlについてもURL保存の対象にした

ファイル保存時うんぬんは主に設定を別のところから持ってきたけどディレクトリがない場合に起こります
そういう時に保存済みにされてしまって取り直すのが面倒なのでリトライするようにしました

ライブラリうんぬんは同梱していたdllがいい加減古いしそもそも一回しか使ってなかったので新しいものにしました
その結果として容量が減りました。まああんまり関係ないですが

スクレイピング時にUserAgentうんぬんはReadMeに書いといたので使う場合はそっちを(あんまり書いてませんけど)
なんとかcomplexが見たいときにでも使ってください

リトライデータが何らかの形で実行できずにループし続ける場合は取得についての設定のところから消せるようにしました
リトライが毎回起こるようだったら利用してください

URLをハッシュ値で保存については取得したURLを保持する場合に有効です
内部でも有効ですがほぼ変わらないです
設定ファイルのサイズを減らしつつURLをもとに重複判定ができるようになります。前に使ってましたが設定ファイルがおかしくなった(v1.14)ので使わなくなってしまった…
(このために1.15でファイルの仕様を変更するはめに)

ID重複をtrailでなんとかは単純に言えば大本のPostのIDで判定できます
Post AをリブログしたPost B、BをリブログしたC、CをリブログしたD…  についてはすべてこのtrailのIDは一緒です
なので同じPostを一括で重複回避できるようになります

というかtrailとURLについてはどっちも同じ目的です(同一のPostをリブログしたa,bが一致するかの判定)
そのためどっちかがあればいい気もします
URLのほうが判定としては強力ですが(画像の元のURLが一致する場合でも弾けるので別のPostでも問題ない)まあお好みで

あとは細かいバグっぽいものとか直しました。あんまり変わりません

ちなみに上の変更については、修正系以外は基本的にユーザーが設定しない限り有効にしません
アップデートしたら使いにくくなったって言われてもあれなので


正直今回機能増やしすぎててちゃんと実装できたかどうかもわかりません
一応動いてましたがなんとも不安

ちなみに今回の変更が多い理由はReblogを保存対象にしようと考えたからですね
さすがにおかしくなりそうだったので次回つけます

この辺で