Fess〜OSSで全文検索〜

0

    こんにちは。OSS研究室です!

     

    今回はオープンソースソフトウェアの全文検索システムであるFessについてご紹介します。

     

     

    FessはJavaで開発されたオープンソースソフトウェアの全文検索システムです。

     

    WEBサイトなどで、以下赤枠のような「サイト内検索」を見たことがあるでしょうか?

    サイト内検索では、入力された文字をサイト内すべての情報から1回で検索することができる機能です。

    このような、サイト内検索をFessで実装することができます。

     

     

    サイト内検索では、一回の検索で対象をすべて満遍なく検索するため、検索時間がかかるという欠点があります。

    しかしFessを利用すると、 サイト内の大量のデータから検索を高速に行うことができます。

     

    Fessが瞬時に検索できる理由はElasticsearchと連携しているためです。

    Elasticsearchとは、ビックデータの解析に使われるOSSの全文検索エンジンです。

     

    Elasticsearchには以下のような特徴があります。

    ・対象データを検索し易い形式で保存

    ・関連するデータも抽出

    ・検索処理やデータ配置を分散できる

    ・システム停止せず拡張可能

     

    このように、FessElasticsearchと連携することによって全文検索の結果を瞬時に表示することを実現しています。

    Elasticsearchについてはこちらもぜひご覧ください。

     

    Fessはこの他にも以下のような特徴があります。

     

    ◇日本語に対応

    ◇設定/管理がWEBからできる

    Fessでは、検索対象、クローラの実行時間の設定、全文検索の条件など、全文検索システムの設定をWEBインタフェースから行うことができます。また、日本語に対応しているため理解しやすくなっています。

     

     

    ◇自動クロールで定期的に情報収集

    Fessでは、あらかじめクローリング開始時間を設定しておくことで、自動的にクロールし情報を収集します。

     

    ◇多種多様なファイル形式に対応

    ◇様々な検索方法が設定可能

    Fessは、PDFやHTML、テキストなど多くのファイル形式に対応しています。

    また、AND検索やOR検索など様々な検索方法が用意されています。

    そのため、サイト内で目的としているページやファイルへの到達率を高めることができます。

     

     

    ◇アクセス解析も可能

    Fessでは、ユーザのアクセス解析を行うことができます。

    さらに、OSSの可視化ソフトウェアである「Kibana」と連携させることで、アクセス情報をグラフ化することもできます。

     

     

    このようにFessを利用すれば、サイト内検索を高速に処理でき、サイトの改善に重要なユーザの動向やニーズも解析することができます。

     

    また、インストール方法と使用方法を調査した「Fess調査報告書」をデージーネットのウェブサイトで公開しています 。

     

    ぜひダウンロードして、お読みください。


    コメント
    コメントする








       

    calendar

    S M T W T F S
     123456
    78910111213
    14151617181920
    21222324252627
    282930    
    << June 2020 >>

    selected entries

    categories

    archives

    recent comment

    links

    profile

    search this site.

    others

    mobile

    qrcode

    powered

    無料ブログ作成サービス JUGEM