[fess-user 754] Re: クロール/インデクス/その他について

Back to archive index

Shinsuke Sugaya shins****@yahoo*****
2013年 7月 12日 (金) 19:07:42 JST


菅谷です。

XPathを駆使していただくしかないのですが、
そのような状況でしたら、

<property name="contentXpath">"//*[@id='main']"</property>

という感じでいかがでしょうか?

よろしくお願いいたします。

shinsuke


2013年7月10日 14:45 ジョンビョンモ <bmjun****@gmail*****>:
> 菅谷様。
> お世話になっております、ジョンです。
>
> 教えて頂いた方法で解決できました。
> ありがとうございます。
>
> もう一つ質問ですが、
> html5仕様とそうではないサイトが混在しているので、
> クロール対象エリアを複数してはできないでしょうか?
>
> 希望エリアは以下の2つです。
> idがmainの共通点があります。
> --------
> <property name="contentXpath">"//ARTICLE[@id='main']"</property>
> <property name="contentXpath">"//DIV[@id='main']"</property>
> --------
>
> 以上です、よろしくお願い致します。
>
> 2013年7月9日 21:42 Shinsuke Sugaya <shins****@yahoo*****>:
>
>> 菅谷です。
>>
>> ログなど見て調べないとわかりませんが
>> <property name="contentXpath">"//ARTICLE"</property>
>> などとして、試してみると良いかもしれません。
>> よろしくお願いいたします。
>>
>> shinsuke
>>
>>
>> 2013年7月9日 13:30 ジョンビョンモ <bmjun****@gmail*****>:
>> > 菅谷様。
>> > ジョンです。
>> >
>> >>> ・webページの本文のみ(サイドバナー/Header/Footer以外の)のクロールはできますか。
>> >>
>> >>s2robot_transformer.diconのcontentXpathなどで
>> >>XPathで取り込み箇所を指定することで除外して
>> >>インデックスを生成することができます。
>> >
>> > 上記についてですが
>> > ------
>> > <property name="contentXpath">"/HTML/BODY"</property>
>> > ------
>> > を以下に修正して、クーロルしました。
>> > ------
>> > <property name="contentXpath">"/HTML/BODY/ARTICLE"</property>
>> > ------
>> > インデクスはされていますが、キーワードを入力し検索すると1件もヒットしないです。
>> > どうすればできますでしょうか?
>> >
>> > 以上です、よろしくお願いします。
>> >
>> > 2013年7月5日 9:08 Shinsuke Sugaya <shins****@yahoo*****>:
>> >
>> >> 菅谷です。
>> >>
>> >> > ・webページの本文のみ(サイドバナー/Header/Footer以外の)のクロールはできますか。
>> >>
>> >> s2robot_transformer.diconのcontentXpathなどで
>> >> XPathで取り込み箇所を指定することで除外して
>> >> インデックスを生成することができます。
>> >>
>> >> > ・インデクスされたwebページの重複(サイドバナー/Header/Footer以外の)する部分を外した検索はできますか。
>> >>
>> >> インデックスする前に除外する必要があります。
>> >>
>> >> > それからフリーと商用の違いについて教えて欲しいです。
>> >>
>> >> Fess単体で見ると、OSS版と同等ですが、
>> >> 商用サービスでは要件に応じて、Fessの様々な
>> >> 拡張ポイントに対して、変更を入れてチューニングして
>> >> 最適化した状態で提供しています。また、
>> >> 100万ドキュメントを超える大規模なファイルシステム
>> >> クロールなどでは別プロダクトと組み合わせて
>> >> インデックスを作成するなど、Fess以外のものを
>> >> 含めて提供したりもしています。そのような感じで
>> >> 要件固有のもの以外はFessにフィードバックされて
>> >> 今までFess自体が成長してきていると思います。
>> >> そういう意味ではOSS版と商用版の違いは
>> >> 要件に合わせた個別の最適化の対応が異なるかと
>> >> 思います。
>> >>
>> >> よろしくお願いいたします。
>> >>
>> >> shinsuke
>> >>
>> >>
>> >> 2013年7月3日 19:56 ジョンビョンモ <bmjun****@gmail*****>:
>> >> > お世話になります、ジョンです。
>> >> >
>> >> > 早速ですが、
>> >> > フリー/商用関わらず、以下の機能はできますでしょうか?
>> >> >
>> >> > ・webページの本文のみ(サイドバナー/Header/Footer以外の)のクロールはできますか。
>> >> > ・インデクスされたwebページの重複(サイドバナー/Header/Footer以外の)する部分を外した検索はできますか。
>> >> >
>> >> > それからフリーと商用の違いについて教えて欲しいです。
>> >> >
>> >> > 現在フリーバージョンでサービスを行っていますが、
>> >> > 思った全てのことができなかったので、商用バージョンを検討していますので、
>> >> > 商用のみの機能について詳しく知りたいです。
>> >> >
>> >> > 以上です、よろしくお願い致します。
>> >> > --
>> >> > Jung ByungMo
>> >> > bmjun****@gmail*****
>> >> >
>> >> > _______________________________________________
>> >> > Fess-user mailing list
>> >> > Fess-****@lists*****
>> >> > http://lists.sourceforge.jp/mailman/listinfo/fess-user
>> >> >
>> >>
>> >> _______________________________________________
>> >> Fess-user mailing list
>> >> Fess-****@lists*****
>> >> http://lists.sourceforge.jp/mailman/listinfo/fess-user
>> >
>> >
>> >
>> > _______________________________________________
>> > Fess-user mailing list
>> > Fess-****@lists*****
>> > http://lists.sourceforge.jp/mailman/listinfo/fess-user
>> >
>>
>> _______________________________________________
>> Fess-user mailing list
>> Fess-****@lists*****
>> http://lists.sourceforge.jp/mailman/listinfo/fess-user
>
>
>
> _______________________________________________
> Fess-user mailing list
> Fess-****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/fess-user
>




Fess-user メーリングリストの案内
Back to archive index