トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS

Java:apacheTikaを使ってみる のバックアップ差分(No.1)


  • 追加された行はこの色です。
  • 削除された行はこの色です。
*Java:apacheTikaを使ってみる [#u0b4ecaf]

Java、と書きつつ、まずはコマンドラインから実行してみる。

***ダウンロード [#a087190e]

Tikaのjarを以下のURLからダウンロード

-http://tika.apache.org/download.html

***使ってみる [#he3de2b0]

ここに、Tikaのコマンドラインが載っている。

-http://tika.apache.org/1.2/gettingstarted.html

前提としては、javaのパスが通っていること。

まず、テキスト情報だけ出力してみる。オプションは「-t」

 java -jar tika-app-1.2.jar -t test.doc

これでやるとテキストがダーッと流れますw ので、適当にリダイレクトするなり。

メタ情報はこんな感じ。オプションは「-j」若しくは「-x」

 java -jar tika-app-1.2.jar -j test.doc

なんか、いろいろ出力されますw

触った感じだと、結構ちゃんと出力されている気がしますw
これは便利かもw