「PDFを編集をする」とひとくちにいっても、用途によって必要な編集機能は全く異なります。
他人が作ったPDFの画像の位置を変更したり、コメント欄を作って複数人で書き込みをしたり。
私が必要な機能は「テキストデータ化」のみ。
FAXで資料が届いてそれから広告を作る、という仕事をよく受けます。クライアントがエクセルやワードで資料を作って、わざわざ印刷して、それをFAXで送られてくるのです…。
「あの、メールでお願いします」と言っても絶対にFAX。
過去最高にキツかったのは、1日で600名分のお名前を入力した時。変換ミス多発するし目は痛いし。
OCRソフトを購入しましょう!と社内で声を上げたんですけど、アプリを信用していなかったり、そんなの手で入力すればいいじゃない、という人がほとんど。浸透してないなぁ。私の誤変換だらけのテキストより、アプリのほうが絶対優秀ですって。
OCR:オーシーアール
(Optical Character Recognition/Reader、光学的文字認識)とは、手書きや印刷された文字を、スキャナで読みとり、デジタルの文字に変換する技術
PDF閲覧ソフトといえば
アドビ アクロバット リーダーですが、アクロバットは閲覧だけじゃなく、OCR機能(文字編集)できないのかな?
アドビ アクロバット リーダー DC(無料)で出来ること
PDFの表示、印刷、署名および注釈の追加
初期画面でいろいろなボタンが並んでいて「機能がたくさんあるぞ」と思いきや、下図のグレーになっているボタンは有料版でのみ使えます。ボタンを押すとアドビの購入ページに飛ばされます。無料版では、編集に関することはほとんどできません。
アドビ アクロバット プロ DC
PDFデータを見て、印刷するだけなら無料版で十分ですが、編集は有料版でしかできない〜!
Adobe Acrobat Pro DCをお試しダウンロードしてみました。無料版と似たような画面ですが、アイコンの並びがちょっと違うかも。ツールをクリックして、PDFを書き出しを選択します。
ファイルを選択して、書き出し形式(最終的に開きたいソフト)を決めます。
- 文章が多いレイアウトならWord文書
- 表っぽいレイアウトならスプレッドシート
- パワーポイント
- 画像
- HTML WEBページ
- その他の形式
FAXを何度も送られて発生する文字のゆがみとか、紙面にコピー機のゴミが点々とついてたりすると、正しくテキスト化されないこともあります。
比較的きれいな紙に印刷された、横書きのビジネス文書(Word)は、ほぼバッチリテキスト化されます。
ただし、縦書きには弱い。下図は、私が持っていた画像でも比較的きれいな物。
文字がズレました。謎のレイアウト崩れが発生しましたが、このままWord形式で保存。
そして、全部コピペして、イラストレーターに貼り付けました。ワードの時点でおかしいレイアウトは、イラストレーターに貼り付けても同じでした。
- 紙に点々が多い
- 文字が明朝体
- 字間がつまっている
- 一文字ごとに空白を入れている文
- 縦書き
- パワーポイントで作られた装飾多め文書
- 字の大きさが極端に強弱がつけられている
(文字がイラスト画像として認識される)
スポンサードサーチ
たとえレイアウトが崩れてもOCRは便利
他人が作った物はすぐ違和感に気付くのに、一人で入力して、一人でチェックしていると、何度見ても間違っているところに気づかないことってないですか?
テキスト化で誤認識する「アプリ」と
入力を間違いがちな「人」。
二人合わせて一人前!?
最終的には目視のチェックは必要ですが、ずっと一人でやるよりはミスが見つけやすかったです。(最終的には納品直前に、他の人にチェックをしてもらいます)
アプリ無しで人間が時間かけて入力しても、アプリの手を借りても、仕上がりは同じ。専用に一人雇うよりはずっと安いので、導入しても損にはならない気がします。
人員が少ない部署こそ、OCRは必要だと感じました。
文字チェックつらい!と思った方、検討してみてください…。
コメント