PDFファイルからテキストデータを抽出
・画像データとして埋め込まれている文字列を認識することはできません(OCRツールではありません)。
・印刷された紙を複合機等のスキャナーでスキャンし、それをPDFファイルとして保存したものは読み取りできません(全て画像データとなるため)。
・まれに文字化けの発生する可能性があります(発生条件は不明)。読み取り結果画面にて元ファイルと見比べて校正作業を行ってください。
・ファイルサイズによっては処理に時間のかかる場合があります。
無料で利用できる『お試しユーザ』では、読み取り可能なPDFファイルのファイルサイズが(一つのファイル当たり)1MBまでとなります(有料会員は10MBまでのPDFファイルを読み取り可)。
【初期画面】
【読み取り結果画面】
※このPDFファイルはAdobe社の提供しているサンプルです。