Scansnapのスキャン画質
Scansnapのスキャン時の画質には「ノーマル」「ファイン」「スーパーファイン」「エクセレント」の4つがあります。
ちなみにスキャンする際の画質のdpiはそれぞれでこのようになっています。
カラー | グレー | |
ノーマル | 150dpi | 300dpi相当 |
ファイン | 200dpi | 400dpi相当 |
スーパーファイン | 300dpi | 600dpi相当 |
エクセレント | 600dpi | 1,200dpi相当 |
この画質の違いによりどのような違いが出るのか、4つのポイントで比較をしてみました。
1.スキャンしてから保存までの速度
2.ファイルサイズの差
3.スキャンデータの綺麗さ
4.テキスト化の正確性
スキャンしてから保存までの速度
それぞれの画質でスキャン速度にどれくらいの違いがでるのか調べてみました。
テストで利用したのは「原価計算基準」というちょっと硬めの内容の文章。
全部で16ページあり、1ページあたり600~2,000文字でトータル文字数としては約24,000字。
保存するファイル形式の設定は以下で統一しています。
・ファイル形式:PDF
・テキスト認識の選択:検索可能なPDFにする
・対象ページ:全ページ
画質 | ボタンを押してから保存までの時間 | ノーマルとの差 |
ノーマル | 24.26秒 | ーー |
ファイン | 26.38秒 | 2.12秒 |
スーパーファイン | 32.23秒 | 7.97秒 |
エクセレント | 87.47秒 | 63.21秒 |
ファイルサイズの差
画質の差でファイルサイズは変わります。
画質 | ファイルサイズ | ノーマルとの差 |
ノーマル | 1,222KB | ーー |
ファイン | 1,624KB | 約1.33倍 |
スーパーファイン | 2,386KB | 約1.95倍 |
エクセレント | 4,590KB | 約3.76倍 |
スキャンデータの綺麗さ
スキャンしたデータをどのように利用するかによって、どれくらいの画質が必要となるかは違うでしょう。
私的にはそんな綺麗さは必要ないだろうと思いますが、どれくらいの違いが出るのか調べてみました。
元PDFキャプチャ
ノーマル(300dpi相当)
ファイン(400dpi相当)
スーパーファイン(600dpi相当)
エクセレント(1,200dpi相当)
テキスト化の正確性
Scansnapではスキャンしたデータを検索可能なPDFにすることが可能です。
画像から文字を抽出する技術「OCR(Optical Character Recognition:光学文字認識)」が使われています。
これによりPDF内で全文検索が可能なPDFファイルに変換されるわけです。
ではどの画質でも問題なくOCRが働くかというとそういうわけではありません。
基本的に画質が良い方がOCRが効果的に働きます。
どのような違いが出るか見てみましょう。
元PDF文書
しかしながら,近時,経営管理のため,とくに業務計画および原価管理に役立つための原価計算への要請は,
著しく強まってきており,今日,原価計算に対して与えられる目的は,単一ではない。すなわち,企業の原価計算制度は,真実の原価を確定して財務諸表の作成に役立つとともに,原価を分析し,これを経営管理者に提供し,もって業務計画および原価管理に役立つことが必要とされている。したがって,原価計算制度は,各企業がそれに対して期待する役立ちの程度において重点の相違はあるが,いずれの計算目的にもともに役立つように形成され,一定の計算秩序として常時継続的に行なわれるものであることを要する。ここに原価計算に対して提起される諸目的を調整し,原価計算を制度化するため,実践規範としての原価計算基準が,設定される必要がある。
画質ノーマルでスキャンした場合のテキスト化
しかしながら,近時,経営管理のため, とくに業務計画および原価管理に役立つための原価計算への要綱は,著しく強まってきており,今日,原価計算に対して与えられる目的は,恥一ではない。すなわち,企業の原価計算制度は,真実の原価を確定して財務諸表の作成に役立つとともに,原価を分析し,これを経営管理者に提供し,もって業務計画および原価管理に役立つことが必要とされている。したがって,原価計算制度は,各企業がそれに対して期待する役立ちの程座において重点の相違はあるが,いずれの31・算目的にもともに役立つように形成され,一定の計算秩序として常時継親的に行なわれるものであることを要する。ここに原価計算に対して提起される諸目的を調整し,原価計算を制度化するため,実践規範としての原価計算基準が,設定される必要がある。
ほぼ正確ですが、いくつか間違って認識している部分があります。
この場合PDF検索をかけても引っかかりません。
ですので、ある程度の画質でスキャンした方がいいでしょう。
ちなみに今回は「ファイン」「スーパーファイン」「エクセレント」でスキャンしたものは、100%正確にテキスト化されました。
まとめ
私の場合、基本的に画質は「ファイン」でスキャンしています。
「ファイルサイズ」「スキャンスピード」「綺麗さ」「テキスト化」の点で一番バランスがいいからです。
ちなみに電子帳簿保存法に対応する場合には、「ファイン」以上でスキャンする必要があります。
そして速度的に「Scansnap ix500」がおすすめです。