よくある質問
倍率はどれを選べばよいですか?
用途に合わせてください。**1×(96 DPI)** は別のデジタルドキュメントに埋め込み、ビューアがズームインしない前提のとき。**2×(192 DPI)** は Retina スクリーン表示(スマートフォンやノート PC の典型的なピクセル密度に一致)とカジュアルな共有全般に。**3×(288 DPI)** はカラー出版物の印刷品質におおむね相当します。**4×(384 DPI)** は高 DPI 印刷(雑誌・光沢パンフレット)に向きます。出力が大きいほどファイルサイズは指数関数的に増えるため、必要以上に上げないでください。100 ページの PDF を 4× でレンダリングすると、500 MB を簡単に超えます。
PNG と JPEG — どちらを使うべきですか?
**PNG** はテキスト・線画・チャート・ソリッドカラーを含むコンテンツに向きます — 無損失で、文字や鋭い線のエッジに圧縮ノイズが出ません。**JPEG** は写真コンテンツや、ファイルサイズの方が重要な場合に向きます — 連続階調画像では同じ視覚品質ではるかに小さくなりますが、鋭いエッジ(特にテキスト)周辺に「リンギング」アーティファクトが入ります。テキストと写真が混在する雑誌ページのようなコンテンツでは、PNG が安全な既定です。WebP や AVIF は両者よりさらに圧縮率が高いですが、対応する下流ツールが少ないため、本コンバータは PNG / JPEG に限定しています。
出力に選択可能なテキストは含まれますか?
いいえ。PDF から画像への変換は *ラスタライズ* で、テキストのグリフがピクセルとして描画され、文字エンコーディングは出力に残りません。すでに選択可能なテキストを含む PDF からそれを保ちたい場合はラスタライズせず、本サイトの PDF Split ツールで分割してページを PDF のまま残してください。ソースが画像のスキャン済み PDF では、そもそもテキストは「選択可能」ではなく、OCR(`Tesseract`・Google Cloud Vision・AWS Textract など)でテキストを抽出する必要があり、ラスタライズ済み画像が OCR ステップの入力となることもあります。
ページの回転や変わったページサイズはどうなりますか?
PDF.js はページの `Rotate` 属性と明示的な `MediaBox`(ページ境界)に従うため、ソースで縦表示に回転されたランドスケープページは画像でも縦になります。A3・US Legal・カスタムの建築サイズなど特殊なサイズは同じ物理プロポーションでレンダリングされ、結果のピクセル寸法だけが異なります。PDF ビューアで見える向きと回転が一致しない場合、多くはビューアが自動補正しているということで、PDF.js は生の回転形を出力します。
出力がとても大きくなるのはなぜですか?
原因は 3 つです。**倍率が高すぎる** — A4 を 4× で出すと 1 ページあたり約 800 万ピクセル、100 ページなら 8 億ピクセル分のラスターデータです。実際に必要な倍率まで下げてください。**JPEG で足りるところに PNG を使っている** — PNG は無損失ですが大きく、写真コンテンツには JPEG 品質 0.85 に切り替えるべきです。**ページがリッチなベクターコンテンツを含む** — ベクターチャートを 4× で完全ラスタライズすると、元の PDF ページよりはるかに大きいファイルになります。出力サイズが忠実度より重要なら、ソース PDF を保持して JPEG 経路を使ってください。JPEG 品質 0.7 まで許容できれば、0.85 よりさらに 40% ファイルサイズが減ります。
フォームや注釈付きの PDF も扱えますか?
はい、ただし注意点があります。PDF.js はフォームフィールドを現在の値でレンダリングするので、「Alice」と入力されたフォームは出力画像にも「Alice」と表示されます。**注釈**(ハイライト、付箋、コメント)は既定でその場にレンダリングされます。注釈なしのクリーンなコピーが必要なら、変換前に Adobe Acrobat や `pdf-lib` スクリプトで先にフラット化してください。インタラクティブな要素(クリック可能なボタン、ラジオ選択肢など)は静止画像になると当然動きません。フォーム処理パイプラインでは、フォームを保存する前にレンダリングしてください — レンダリング画像はその瞬間のフォーム状態の永続的な記録になります。
関連する概念
PDF のレンダリングと PDF のオーサリングは別の問題です。**オーサリング**(Adobe Acrobat、Apple Pages からの書き出し、LaTeX → PDF など)は PDF オブジェクト(ページ・フォント・ベクターコマンド・埋め込み画像)を書き出します。**レンダリング**(Adobe Reader、Apple Preview、PDF.js、mutool など)はそのオブジェクトを取り、表示や印刷のためのピクセルを生成します。本ツールはレンダラで、ピクセル出力をキャプチャして PNG / JPEG として保存します — PDF ビューアのスクリーンショットを取ることに似ていますが、スクリプト化可能、倍率可変、ドキュメント全体に対する処理が可能です。
本ツールが使う **PDF.js** は、PDF 仕様の Mozilla 製オープンソース実装です。2011 年に Firefox の既定 PDF ビューアとして始まり、現在は Firefox、Android 版 Chrome、多くのウェブ PDF ビューア(Slack のファイルプレビュー、Notion の添付、JIRA の PDF 表示など)に同梱されています。すべて JavaScript と WebAssembly でブラウザ内動作し、ISO 32000-1 の大半(ベクターコンテンツ・埋め込みラスター画像・OpenType フォント・暗号化・基本フォーム・基本注釈)に対応します。ネイティブレンダラ(mutool・Ghostscript・Adobe)に対するトレードオフは速度とエッジケース忠実度で、非常に複雑な PDF(CAD 図面、希少フォントサブセットを使う科学論文など)は若干異なるか、はるかに遅くレンダリングされます。
全体像を完成させる隣接概念が 3 つあります。**OCR(光学文字認識)** は逆の操作 — ラスタライズされた画像を検索可能なテキストに戻します。`Tesseract`(Google のオープンソース OCR)、`paddle-ocr`、AWS Textract、Google Cloud Vision などが一般的な実装です。ワークフローは PDF → 画像 → OCR → テキストと連鎖することが多いです。**PDF/A**(ISO 19005)はアーカイブ向け PDF サブセットで、PDF/A ドキュメントをラスタライズして PDF/A として再保存すると「画像のみ」の PDF/A-1 となり、PDF/A-1b 以降が保とうとする検索性が失われます。**印刷用ラスタライズ**(Ghostscript・PostScript インタープリタ)は物理プリンタが印刷時に行うもので — 別コードパスで、はるかに高い DPI 既定(1200〜2400)を使い、出力先は画像ファイルではなくプリンタピクセルです。プリプレスワークフローではプリンタのネイティブインタープリタを優先し、デジタル出版では本ツールで十分です。