Sponsored Link

PDF内の文字テキストを抜き出して出力するフリーソフト「pdfTrans」

「pdfTrans」はPDF内の文字テキストを抽出(抜き出す)出力するソフトです。
透明テキストとしてファイル化されているPDFから文字だけを出力します。

▼「pdfTrans」スクリーンショット
ws00000171.jpg

使い方は基本的に、PDFファイルを、「ドロップエリア」と
書かれた場所にドラッグアンドドロップして「実行」ボタンを
押すだけです。


抽出されてテキストファイルは、デフォルトでは
PDFファイルの有る同じフォルダ内に
同じファイル名で拡張子がtxtとして生成されます。


▼ドラッグアンドドロップ以外では
「ファイル選択」ボタンを使って
ファイルを選ぶことも可能です。

また、複数のPDFファイルをフォルダ単位で
一括して文字テキストを抽出する場合は
「フォルダ選択」ボタンを使います。
(サブフォルダまで抽出実行することも可能です)
ws00000172.jpg


▼PDFファイルの内部文書構造によっては
出力結果が改行だらけとなる場合もあります。
その場合はツール−オプションで「改行を出力する」の
チェックを外してから実行してみて下さい。
ws00000173.jpg

出力される抽出文字の順番は、PDFファイルに
格納された文字の順番によるため、必ずしも
PDFの見た目通りの順番で出力される訳ではないようです。


▼PDFファイルが複数ページで構成されている場合
ページ毎にヘッダーやフッターを追加しながら
出力する設定もできます。
ws00000177.jpg

▼pdfTransがダウンロードできる作者のサイト
http://ohju.cside4.jp/software/

PDFを編集する無料フリーソフトと使い方「PDF-Viewer」

PDF-Viewerというフリーウェアを使えば
PDFファイルに直接文字や図形を追加して編集・保存できます。
編集後はそのままPDFファイルとして保存可能です。

編集と言っても行を削除・追加するなどワープロ的なことではなく
すでにPDF化しているファイルに後から
空いた場所に文字やコメントを追加したり、落書き的に使えます。

▼PDF-Viewer画面スクリーンショット
00.jpg

▼文字テキストを追加したい場合は、
タイプライターツールを使うと便利でしょう。
ws00000150.jpg
タイプライターツールをクリックして、
追加したい場所でクリックすると文字枠が出来て入力ができます。

文字枠の移動や、文字色・書体
フォントサイズなどの変更も可能です。
また、文字枠を確定した後でも
文字枠をダブルクリックすると編集が可能です。
ws00000152.jpg


▼編集後にPDFファイルとして保存して
そのままAdobe Reader などのPDFビューワーで見ることができます。
ws00000155.jpg


▼文字テキストの他に、コメントも追加可能です。
ws00000153.jpg

コメント追加中↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓

ws00000156.jpg


▼図形は直線・四角形・多角形・丸などが用意されており
図形それぞれに、外枠だけや塗りつぶしができます。
ws00000157.jpg

ws00000158.jpg


図形をうまく使えば文字を隠すこともできます。(図形の塗りを白、枠なしにした場合)
ws00000160.jpg

↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓

ws00000159.jpg


吹き出しツールは狭い場所などに便利です。
ws00000161.jpg
ws00000162.jpg

▼PDF-Viewerの難点
検証したところ10キロバイトのPDFファイルに
文字を追加しただけでも
PDFのファイルサイズが3メガバイト以上の
容量になってしまのが難点ですが
文字を書き足せることのこのソフトの
メリットは大きいと思います。

PDFファイルの分割・結合ソフトの使い方「ConcatPDF(コンカットPDF)」

ConcatPDFは複数あるPDFファイルを結合して一つにしたり
ページ単位でPDFファイルを分割・抽出できる無料フリーソフトです。

その他の機能でにPDFファイルの暗号化や、複数あるページの中で
一部ページを抽出したPDFファイルを作成することもできます。

英語版ですが、PDFファイルの結合や分割ができるソフトで
フリーウェアでは数少ない内の一つです。

ConcatPDFのインストール前に、必須である次のソフトが
インストールされている必要があります。

Microsoft .NET Framework Version 1.1 再頒布可能パッケージ
Microsoft Visual J# .NET Version 1.1 再頒布可能パッケージ

それぞれの名前をそのままWebで検索すれば見つかると思います。

▼ConcatPDFのスクリーンショット
英語版ですがドラッグアンドドロップに対応しているなど
操作は難しくはないです。

ws00000145.jpg

▼PDFファイルを結合するには、複数ファイルを
ConcatPDFのウィンドウにドラッグアンドドロップし、
Fileメニューから、Save As...を選び、好きな名前で保存します。

ws00000146.jpg


▼PDFファイルを抽出または分割するには、結合の時と同じように
複数ページあるPDFファイルをドラッグアンドドロップし
表示されたPDFを選択してから、Editメニューから、Splitを選びます。
少し時間がかかりますが、分割されたリストが表示されます。

ここから分割と抽出に分かれます。


○分割はリストが表示された時点で、分割されたPDFファイルが
TEMPという一時作業場所に保存されています。
下の画像でいうなら、それぞれのリストのパスの中にTemp\という
文字が見えると思います。
その次にのd26ec243・・・・という名前が保存されているフォルダです。
ws00000149.jpg

Tempフォルダの場所はWindowsXPなら、マイ コンピュータのCドライブの中の
Documents and Settings → コンピュータ名 → Local Settings → Temp
です。
簡単にTempフォルダの中身を表示させたいなら
スタートボタンを押して「ファイル名を指定して実行」を選び
%temp% 又は %TMP% と入力してOKボタンを押せば表示されます。
(多分XP以外のOSでも同じように表示されると思います)

ws00000150.jpg


○抽出ですが、不要なページをリストから選択して
Editメニューから、Removeを選びます。
リストから不要なページが削除されていきます。
必要なページだけ残ったら、Fileメニューから、Save As...を選び
好きな名前で保存します。

Sponsored Link