- 追加された行はこの色です。
- 削除された行はこの色です。
*Java:apacheTikaを使ってみる [#u0b4ecaf]
Java、と書きつつ、まずはコマンドラインから実行してみる。
***ダウンロード [#a087190e]
Tikaのjarを以下のURLからダウンロード
-http://tika.apache.org/download.html
***使ってみる [#he3de2b0]
ここに、Tikaのコマンドラインが載っている。
-http://tika.apache.org/1.2/gettingstarted.html
前提としては、javaのパスが通っていること。
まず、テキスト情報だけ出力してみる。オプションは「-t」
java -jar tika-app-1.2.jar -t test.doc
これでやるとテキストがダーッと流れますw ので、適当にリダイレクトするなり。
メタ情報はこんな感じ。オプションは「-j」若しくは「-x」
java -jar tika-app-1.2.jar -j test.doc
なんか、いろいろ出力されますw
触った感じだと、結構ちゃんと出力されている気がしますw
これは便利かもw