Shinsuke Sugaya
shins****@yahoo*****
2013年 7月 12日 (金) 19:07:42 JST
菅谷です。 XPathを駆使していただくしかないのですが、 そのような状況でしたら、 <property name="contentXpath">"//*[@id='main']"</property> という感じでいかがでしょうか? よろしくお願いいたします。 shinsuke 2013年7月10日 14:45 ジョンビョンモ <bmjun****@gmail*****>: > 菅谷様。 > お世話になっております、ジョンです。 > > 教えて頂いた方法で解決できました。 > ありがとうございます。 > > もう一つ質問ですが、 > html5仕様とそうではないサイトが混在しているので、 > クロール対象エリアを複数してはできないでしょうか? > > 希望エリアは以下の2つです。 > idがmainの共通点があります。 > -------- > <property name="contentXpath">"//ARTICLE[@id='main']"</property> > <property name="contentXpath">"//DIV[@id='main']"</property> > -------- > > 以上です、よろしくお願い致します。 > > 2013年7月9日 21:42 Shinsuke Sugaya <shins****@yahoo*****>: > >> 菅谷です。 >> >> ログなど見て調べないとわかりませんが >> <property name="contentXpath">"//ARTICLE"</property> >> などとして、試してみると良いかもしれません。 >> よろしくお願いいたします。 >> >> shinsuke >> >> >> 2013年7月9日 13:30 ジョンビョンモ <bmjun****@gmail*****>: >> > 菅谷様。 >> > ジョンです。 >> > >> >>> ・webページの本文のみ(サイドバナー/Header/Footer以外の)のクロールはできますか。 >> >> >> >>s2robot_transformer.diconのcontentXpathなどで >> >>XPathで取り込み箇所を指定することで除外して >> >>インデックスを生成することができます。 >> > >> > 上記についてですが >> > ------ >> > <property name="contentXpath">"/HTML/BODY"</property> >> > ------ >> > を以下に修正して、クーロルしました。 >> > ------ >> > <property name="contentXpath">"/HTML/BODY/ARTICLE"</property> >> > ------ >> > インデクスはされていますが、キーワードを入力し検索すると1件もヒットしないです。 >> > どうすればできますでしょうか? >> > >> > 以上です、よろしくお願いします。 >> > >> > 2013年7月5日 9:08 Shinsuke Sugaya <shins****@yahoo*****>: >> > >> >> 菅谷です。 >> >> >> >> > ・webページの本文のみ(サイドバナー/Header/Footer以外の)のクロールはできますか。 >> >> >> >> s2robot_transformer.diconのcontentXpathなどで >> >> XPathで取り込み箇所を指定することで除外して >> >> インデックスを生成することができます。 >> >> >> >> > ・インデクスされたwebページの重複(サイドバナー/Header/Footer以外の)する部分を外した検索はできますか。 >> >> >> >> インデックスする前に除外する必要があります。 >> >> >> >> > それからフリーと商用の違いについて教えて欲しいです。 >> >> >> >> Fess単体で見ると、OSS版と同等ですが、 >> >> 商用サービスでは要件に応じて、Fessの様々な >> >> 拡張ポイントに対して、変更を入れてチューニングして >> >> 最適化した状態で提供しています。また、 >> >> 100万ドキュメントを超える大規模なファイルシステム >> >> クロールなどでは別プロダクトと組み合わせて >> >> インデックスを作成するなど、Fess以外のものを >> >> 含めて提供したりもしています。そのような感じで >> >> 要件固有のもの以外はFessにフィードバックされて >> >> 今までFess自体が成長してきていると思います。 >> >> そういう意味ではOSS版と商用版の違いは >> >> 要件に合わせた個別の最適化の対応が異なるかと >> >> 思います。 >> >> >> >> よろしくお願いいたします。 >> >> >> >> shinsuke >> >> >> >> >> >> 2013年7月3日 19:56 ジョンビョンモ <bmjun****@gmail*****>: >> >> > お世話になります、ジョンです。 >> >> > >> >> > 早速ですが、 >> >> > フリー/商用関わらず、以下の機能はできますでしょうか? >> >> > >> >> > ・webページの本文のみ(サイドバナー/Header/Footer以外の)のクロールはできますか。 >> >> > ・インデクスされたwebページの重複(サイドバナー/Header/Footer以外の)する部分を外した検索はできますか。 >> >> > >> >> > それからフリーと商用の違いについて教えて欲しいです。 >> >> > >> >> > 現在フリーバージョンでサービスを行っていますが、 >> >> > 思った全てのことができなかったので、商用バージョンを検討していますので、 >> >> > 商用のみの機能について詳しく知りたいです。 >> >> > >> >> > 以上です、よろしくお願い致します。 >> >> > -- >> >> > Jung ByungMo >> >> > bmjun****@gmail***** >> >> > >> >> > _______________________________________________ >> >> > Fess-user mailing list >> >> > Fess-****@lists***** >> >> > http://lists.sourceforge.jp/mailman/listinfo/fess-user >> >> > >> >> >> >> _______________________________________________ >> >> Fess-user mailing list >> >> Fess-****@lists***** >> >> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > >> > >> > >> > _______________________________________________ >> > Fess-user mailing list >> > Fess-****@lists***** >> > http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > >> >> _______________________________________________ >> Fess-user mailing list >> Fess-****@lists***** >> http://lists.sourceforge.jp/mailman/listinfo/fess-user > > > > _______________________________________________ > Fess-user mailing list > Fess-****@lists***** > http://lists.sourceforge.jp/mailman/listinfo/fess-user >