トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS

Java:apacheTikaを使ってみる のバックアップソース(No.1)

*Java:apacheTikaを使ってみる [#u0b4ecaf]

Java、と書きつつ、まずはコマンドラインから実行してみる。

***ダウンロード [#a087190e]

Tikaのjarを以下のURLからダウンロード

-http://tika.apache.org/download.html

***使ってみる [#he3de2b0]

ここに、Tikaのコマンドラインが載っている。

-http://tika.apache.org/1.2/gettingstarted.html

前提としては、javaのパスが通っていること。

まず、テキスト情報だけ出力してみる。オプションは「-t」

 java -jar tika-app-1.2.jar -t test.doc

これでやるとテキストがダーッと流れますw ので、適当にリダイレクトするなり。

メタ情報はこんな感じ。オプションは「-j」若しくは「-x」

 java -jar tika-app-1.2.jar -j test.doc

なんか、いろいろ出力されますw

触った感じだと、結構ちゃんと出力されている気がしますw
これは便利かもw