2011/11/15(火)PDF内の画像フォーマット

2011/11/15 15:26 PC(全般)
前記事の付随記事。
画像で構成されたPDF内の画像フォーマットを調べたい。

なんとAcrobat X Proでは表示する方法がない(!?)。

現状これができるツールがみつけられなかったが、とりあえず調べ方はわかった。
テキストエディタでPDFの中をのぞく。
<< /Type /XObject /Subtype /Image /Name /Obj4 /Width 1811 /Height 2365 
/BitsPerComponent 8 /ColorSpace /DeviceRGB
/Filter /DCTDecode /Length 634114 >> 
stream
こういったエントリがあるので/Filterのところをチェック。こいつはDCTDecodeなので結局JPEG。うーん、FlateDecode(可逆圧縮)を期待していたのだが……

他のフォーマットは、ここでも参照してほしい。

さて、この場合Acrobat X Proで名前をつけて保存->画像->JPEGとやると、品質設定如何に関わらずオリジナルのJPEG(上記の場合1811x2365 634114bytes)のファイルを抽出できる。

かなりブロック・モスキートノイズが飛んでいる。このJPEG、品質はどれくらいで作られたのか調べたい。量子化テーブルの話なので、逆算は必ずしも正確ではないだろうが大まかの当たりをつけたい。

info_JPEGというソフトで調べられるという話なのでこれを使用。品質は60だった。

このソフトを信じるならこの数字。自分の見た目としての実感も60~70くらいかなという感じなので、大きく外してはいないだろう。

なお、GhostScriptを経由したIrfanView等では、この画像サイズがとれないのか出力指定解像度でしか抽出できなかった。安定してやるならAcrobatでやるのが良い。
OK キャンセル 確認 その他