PDFのテキストを編集する方法。さようなら手入力!

デザイン

「PDFを編集をする」とひとくちにいっても、用途によって必要な編集機能は全く異なります。
他人が作ったPDFの画像の位置を変更したり、コメント欄を作って複数人で書き込みをしたり。

私が必要な機能は「テキストデータ化」のみ。
FAXで資料が届いてそれから広告を作る、という仕事をよく受けます。クライアントがエクセルやワードで資料を作って、わざわざ印刷して、それをFAXで送られてくるのです…。

「あの、メールでお願いします」と言っても絶対にFAX。
過去最高にキツかったのは、1日で600名分のお名前を入力した時。変換ミス多発するし目は痛いし。

パソコン疲れた

OCRソフトを購入しましょう!と社内で声を上げたんですけど、アプリを信用していなかったり、そんなの手で入力すればいいじゃない、という人がほとんど。浸透してないなぁ。私の誤変換だらけのテキストより、アプリのほうが絶対優秀ですって。

OCR:オーシーアール
(Optical Character Recognition/Reader、光学的文字認識)とは、手書きや印刷された文字を、スキャナで読みとり、デジタルの文字に変換する技術

PDF閲覧ソフトといえば
アドビ アクロバット リーダーですが、アクロバットは閲覧だけじゃなく、OCR機能(文字編集)できないのかな?

アクロバットアイコン

スポンサードサーチ

アドビ アクロバット リーダー DC(無料)で出来ること

PDFの表示、印刷、署名および注釈の追加

アクロバットリーダー無料版

初期画面でいろいろなボタンが並んでいて「機能がたくさんあるぞ」と思いきや、下図のグレーになっているボタンは有料版でのみ使えます。ボタンを押すとアドビの購入ページに飛ばされます。無料版では、編集に関することはほとんどできません。

アクロバットリーダー

アドビ アクロバット プロ DC

PDFデータを見て、印刷するだけなら無料版で十分ですが、編集は有料版でしかできない〜!
Adobe Acrobat Pro DCをお試しダウンロードしてみました。無料版と似たような画面ですが、アイコンの並びがちょっと違うかも。ツールをクリックして、PDFを書き出しを選択します。

アクロバットリーダー有料版
PDFを書き出し

ファイルを選択して、書き出し形式(最終的に開きたいソフト)を決めます。

  • 文章が多いレイアウトならWord文書
  • 表っぽいレイアウトならスプレッドシート
  • パワーポイント
  • 画像
  • HTML WEBページ
  • その他の形式
PDFを任意の形に書き出し

FAXを何度も送られて発生する文字のゆがみとか、紙面にコピー機のゴミが点々とついてたりすると、正しくテキスト化されないこともあります。

比較的きれいな紙に印刷された、横書きのビジネス文書(Word)は、ほぼバッチリテキスト化されます。
ただし、縦書きには弱い。下図は、私が持っていた画像でも比較的きれいな物。

縦書きの文書

文字がズレました。謎のレイアウト崩れが発生しましたが、このままWord形式で保存。

縦書きのword

そして、全部コピペして、イラストレーターに貼り付けました。ワードの時点でおかしいレイアウトは、イラストレーターに貼り付けても同じでした。

イラストレーターに貼り付け
  • 紙に点々が多い
  • 文字が明朝体
  • 字間がつまっている
  • 一文字ごとに空白を入れている文
  • 縦書き
  • パワーポイントで作られた装飾多め文書
  • 字の大きさが極端に強弱がつけられている
    (文字がイラスト画像として認識される)

スポンサードサーチ

たとえレイアウトが崩れてもOCRは便利

他人が作った物はすぐ違和感に気付くのに、一人で入力して、一人でチェックしていると、何度見ても間違っているところに気づかないことってないですか?

カブ子
カブ子

テキスト化で誤認識する「アプリ」と
入力を間違いがちな「人」。
二人合わせて一人前!?

最終的には目視のチェックは必要ですが、ずっと一人でやるよりはミスが見つけやすかったです。(最終的には納品直前に、他の人にチェックをしてもらいます)

アプリ無しで人間が時間かけて入力しても、アプリの手を借りても、仕上がりは同じ。専用に一人雇うよりはずっと安いので、導入しても損にはならない気がします。

人員が少ない部署こそ、OCRは必要だと感じました。
文字チェックつらい!と思った方、検討してみてください…。

コメント

タイトルとURLをコピーしました