[fess-user 751] Re: クロール/インデクス/その他について

Back to archive index

ジョンビョンモ bmjun****@gmail*****
2013年 7月 9日 (火) 13:30:39 JST


菅谷様。
ジョンです。

>> ・webページの本文のみ(サイドバナー/Header/Footer以外の)のクロールはできますか。
>
>s2robot_transformer.diconのcontentXpathなどで
>XPathで取り込み箇所を指定することで除外して
>インデックスを生成することができます。

上記についてですが
------
<property name="contentXpath">"/HTML/BODY"</property>
------
を以下に修正して、クーロルしました。
------
<property name="contentXpath">"/HTML/BODY/ARTICLE"</property>
------
インデクスはされていますが、キーワードを入力し検索すると1件もヒットしないです。
どうすればできますでしょうか?

以上です、よろしくお願いします。

2013年7月5日 9:08 Shinsuke Sugaya <shins****@yahoo*****>:

> 菅谷です。
>
> > ・webページの本文のみ(サイドバナー/Header/Footer以外の)のクロールはできますか。
>
> s2robot_transformer.diconのcontentXpathなどで
> XPathで取り込み箇所を指定することで除外して
> インデックスを生成することができます。
>
> > ・インデクスされたwebページの重複(サイドバナー/Header/Footer以外の)する部分を外した検索はできますか。
>
> インデックスする前に除外する必要があります。
>
> > それからフリーと商用の違いについて教えて欲しいです。
>
> Fess単体で見ると、OSS版と同等ですが、
> 商用サービスでは要件に応じて、Fessの様々な
> 拡張ポイントに対して、変更を入れてチューニングして
> 最適化した状態で提供しています。また、
> 100万ドキュメントを超える大規模なファイルシステム
> クロールなどでは別プロダクトと組み合わせて
> インデックスを作成するなど、Fess以外のものを
> 含めて提供したりもしています。そのような感じで
> 要件固有のもの以外はFessにフィードバックされて
> 今までFess自体が成長してきていると思います。
> そういう意味ではOSS版と商用版の違いは
> 要件に合わせた個別の最適化の対応が異なるかと
> 思います。
>
> よろしくお願いいたします。
>
> shinsuke
>
>
> 2013年7月3日 19:56 ジョンビョンモ <bmjun****@gmail*****>:
> > お世話になります、ジョンです。
> >
> > 早速ですが、
> > フリー/商用関わらず、以下の機能はできますでしょうか?
> >
> > ・webページの本文のみ(サイドバナー/Header/Footer以外の)のクロールはできますか。
> > ・インデクスされたwebページの重複(サイドバナー/Header/Footer以外の)する部分を外した検索はできますか。
> >
> > それからフリーと商用の違いについて教えて欲しいです。
> >
> > 現在フリーバージョンでサービスを行っていますが、
> > 思った全てのことができなかったので、商用バージョンを検討していますので、
> > 商用のみの機能について詳しく知りたいです。
> >
> > 以上です、よろしくお願い致します。
> > --
> > Jung ByungMo
> > bmjun****@gmail*****
> >
> > _______________________________________________
> > Fess-user mailing list
> > Fess-****@lists*****
> > http://lists.sourceforge.jp/mailman/listinfo/fess-user
> >
>
> _______________________________________________
> Fess-user mailing list
> Fess-****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/fess-user
>
-------------- next part --------------
HTMLの添付ファイルを保管しました...
下載 



Fess-user メーリングリストの案内
Back to archive index