Scansnap

Scansnapで検索可能なPDFにして全文検索でファイリングの手間をなくす

更新日:

経理の業務上多くの「情報」を扱います。
「情報」と書いたのは、扱う情報が「紙」だけでなく、「Excel」や「PDF」、「メール」もそうですね。

その中で今回は「PDF」の管理方法について紹介します。

捨ててても捨てなくても「PDF化」

経理で扱う書類の多くは法律で保存期間が決められています。
紙で受領した書類については、紙で保存しなければなりません。

昨今の法律改正でスキャンしたPDFデータで保存する方法も認められるようになりました。
スマホでも撮影した領収書でもOKといった具合にかなり時代は進んで来ています。

しかし、認められるにはきちんと要件を満たさなければならず、けっこう手間です。
またシステムの導入コストやタイムスタンプなどのランニングコストも馬鹿になりません。

現状私の会社の場合、紙で保管した方がコスト的にかからない試算になったので電子保存への移行はしていません。
ただ業務上はPDFなどの電子データになっている方が便利ですので、外部支払いの請求書は基本PDFにしています。

そこで保存はあくまで紙で行うけども、社内利用はPDFで閲覧するという方法を取っています。

そのために目的のPDFが探しやすい必要があります。
しかし、フォルダを階層できちっと管理するのは手間です。
そこで大まかな管理はフォルダで行い、あとは全文検索機能で見つけられるようにしています。

検索するPDFについて

PDF全文検索でどのような検索結果になるのか検証してみました。
検証する書類は、外注費請求書の計上処理での書類一式を使うことに。

書類一式は以下の3つ。
1種類目:会計伝票(会計ソフトに登録した伝票をプリントアウトしたもの)
2種類目:支払依頼合計表(外注費請求書をリスト化した一覧表)
3種類目:外注費請求書(外注業者から受け取った請求書)

私の会社では外注費の請求書は発注した部門で確認をしてから経理へ回ってきます。
支払依頼合計表を頭紙に、外注費請求書を支払依頼合計表の順番に並べられています。
経理は書類を受け取り、会計ソフトに登録して、会計伝票を一枚目に添付して、経理長に確認をしてもらいます。

1種類目は会計ソフトから出力した書類。
2種類目はワークフローシステムで登録したWEBフォームをPDF化した書類。
3種類目は各社仕様の書類。

書類のフォントの見た目も大きさも違います。

これらを今回は「ScanSnap ix500」を使ってスキャンすると同時に全文検索可能なPDFにしました。

同じ書類を「ノーマル」「ファイン」「スーパーファイン」の3種類の画質でPDF化しました。

Acrobat Adobe DCで全文検索を行う方法

一番スタンダードなPDFリーダーは「Acrobat Adobe DC」でしょう。
「Acrobat Adobe DC」には検索方法が2つあります。
1つは「簡易検索」、もう1つは「高度な検索」です。

「簡易検索」は閲覧中のPDF内を検索します。
つまり、1つのPDF内を検索します。

それに対して「高度な検索」は指定したフォルダ内にあるPDFを全文検索することができます。
つまり複数のPDFを横断的に検索できるため、目的のPDFを探しやすいというわけです。

※全文検索機能を行うためには、OCR機能でPDFをテキスト化する必要があります。
ScanSnapでスキャンしたPDFを全文検索可能なPDFに変換する方法はこちら→

メニューから「編集」→「高度な検索」を選択する

検索対象となるフォルダを選択する

フォルダを選択する状態になるので、PDFを置いてあるフォルダを選択します。

通常の状態は「現在の文書」が選択されていると思います。
これは「簡易検索」の状態です。

検索したワードを入力する

今回は「ジャパン」で検索しました。

検索結果が表示される

C:\Users\oguri\Documents\Scan...\検索テスト
というフォルダ群から

『ジャパン』というキーワードで「3個の文書で17件見つかった」
ということです。

今回は同じ書類を3パータンの画質でPDF化したので、3個の文書となるのはまぁ当然かなと思いました。
しかし、17件だと3で割り切れません。
1つの文書から検索できた「ジャパン」というワードが異なるということです。

検索された箇所を確認する

左の「∨」をクリックすると検索された箇所がリスト表示されます。

見てわかるように「スーパーファイン」と「ノーマル」で検索された件数が異なります。

今回は「ノーマル」の方が検索された件数が6件と「スーパーファイン」より多かったです。
正直これは予想外でした。
「スーパーファイン」の方が、きれいにPDFをするため、テキスト化の精度も高いはずですから。

補足:「ジヤパン」でも検索してみた結果

3個の文章で6件見つかったという結果になりました。

内訳
ノーマル:1件
ファイン:2件
スーパーファイン:3件

きれいにスキャンされた結果が逆に働いたんですかね。

まとめ

正直そこまで検索することが多くありません。
ただいざとなったらすぐに見つけられる方法を知っているので、書類をがんがんPDF化して、保存義務がないけど、一応残しておいた方がいい書類については、すぐに廃棄しています。

そしてPDFを横断的に検索できるので、ざっくりとした管理でも見つけることが楽にできます。

03投稿記事下_関連コンテンツ

-Scansnap
-, ,

Copyright© 経理と総務の効率化 , 2023 All Rights Reserved.