From shinsuke.sugaya @ gmail.com Thu Jun 1 09:43:06 2017 From: shinsuke.sugaya @ gmail.com (Shinsuke Sugaya) Date: Thu, 1 Jun 2017 09:43:06 +0900 Subject: [fess-user 1014] Re: =?utf-8?b?MeWPsOOBruOCteODvOODkOOBq2Zlc3Pjga7opIfmlbDotbc=?= =?utf-8?b?5YuV44Gv5Y+v6IO977yf?= In-Reply-To: References: Message-ID: > このとき、1台のPCで複数のfessを起動させることはそもそも可能でしょうか? 起動させることはできると思いますが、 単純にポートを変えただけの運用は推奨しません。 (開発時でのテスト用の利用とかであれば良いかもしれませんが…) そのような運用をしたい場合には、組み込みのElasticsearchでなく 別に起動して、それぞれのFessのインスタンスがその1つの Elasticsearchを向けるような感じにする必要があると思います。 shinsuke 2017年5月17日 16:27 上田秀樹 OSK 技財品技 : > うえだと申します。お世話になります。 > > 検索対象としたいサイトが複数あったとして、 > これらを別々に設定したfessを使って検索したいのですが、 > このとき、1台のPCで複数のfessを起動させることはそもそも可能でしょうか? > 以下のようにしてみましたが、うまく動かないようです。 > > PCのフォルダ > -fess_for_site_a > (fessの展開) > -fess_for_site_b > (fessの展開, fess.in.batのポートを8080から別の空きポートに変更) > > fess: 11.0.3 > PC: Windows 7 pro (64bit) > > 以上です。 > > > > > -- > // 上田 秀樹 > > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.osdn.me > http://lists.osdn.me/mailman/listinfo/fess-user > From shinsuke @ yahoo.co.jp Thu Jun 1 09:50:23 2017 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Thu, 1 Jun 2017 09:50:23 +0900 Subject: [fess-user 1015] Re: =?utf-8?b?44Kv44Ot44O844Or44GM57WC44KP44KJ44Gq44GE77yf?= In-Reply-To: <000501d2a439$9d11db50$d73591f0$@sqa.co.jp> References: <000501d2a439$9d11db50$d73591f0$@sqa.co.jp> Message-ID: > この程度はかかるものでしょうか。 システムやネットワークの性能、クロールの設定内容や クロール対象の量に依存するため、どの程度かかかるかは 一概に言えません。 > また、ダッシュボード画面のdocsの数字は、375,000 程度になっています。 Elasticsearchに格納されているドキュメントの量になります。 設定、ログ、サジェストなど様々なものを含みます。 検索対象のドキュメント数はfess.YYYYMMDDインデックスの docsになります。 shinsuke 2017年3月24日 9:57 SQA SEKIDO Ryoichi : > 関戸@SQAです。 > お世話になります。 > > 社内のWindowsサーバをクロールしているのですが、24時間以上たっても続いていま > す。 > この程度はかかるものでしょうか。 > fess の環境は次のとおりです。 > OS: CentOS 7 > JAVA: jdk1.8.0 > Fess: 10.3.1 > > また、ダッシュボード画面のdocsの数字は、375,000 程度になっています。 > この意味は、クロールしているサーバに存在するドキュメントの数でしょうか。 > もしくはクロールした延べの数でしょうか。 > > よろしくお願いします。 > > > --- Structural Quality Assurance -------------------------------------> > 関戸 良一 sekido.ryoichi @ sqa.co.jp > SEKIDO Ryoichi Phone/Fax 03-5214-3436 / 3432 > PGP fingerprint = 46D9 01CF 1D90 9372 8B7B 59A9 B9B4 83E7 9D36 C8BD > <------------------------------------------ 構造品質保証研究所(株) --- > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.osdn.me > http://lists.osdn.me/mailman/listinfo/fess-user From shinsuke.sugaya @ gmail.com Thu Jun 1 10:04:43 2017 From: shinsuke.sugaya @ gmail.com (Shinsuke Sugaya) Date: Thu, 1 Jun 2017 10:04:43 +0900 Subject: [fess-user 1016] Re: =?utf-8?b?44K144Kk44OI44Oe44OD44OXIHNpdGVtYXAueG1s44KS44Kv?= =?utf-8?b?44Ot44O844Or5a++6LGh44Go44GZ44KL6Kit5a6a?= In-Reply-To: <58FD582C.3000905@idaj.co.jp> References: <58F45037.20109@idaj.co.jp> <58FD582C.3000905@idaj.co.jp> Message-ID: sitemap.xmlが開始URLとして指定されているので、 > 2017-04-24 00:00:35,767 [Crawler-20170424000000-1-2] INFO Crawling URL: http://testwww2.ドメイン名/sitemap.xml を参照して、クロール対象のURLを取得して > 2017-04-24 00:00:38,286 [Crawler-20170424000000-1-1] INFO Crawling URL: http://testwww2.ドメイン名/calendar/ をクロールしていると思います。 > 自動的に「クロール対象とするURL: http://ドメイン/.*」で指定した はクロール時のフィルタ的な設定になります。 > また、の順に記載している事が問題なのでしょうか。 特に問題ないと思います。 shinsuke 2017年4月24日 10:43 松宮 あすか : > shinsuke様 > > 返信をありがとうございます。 > fess-crawler.logを見ると以下の記載がありました。 > クロールするターゲットのURLがない(sitemap.xmlがない)ので、 > 自動的に「クロール対象とするURL: http://ドメイン/.*」で指定した > HTMLファイルからリンクを辿って検索結果を出しているという認識でよろしいで > しょうか。 > > sitemap.xmlの書き方についてですがを記載していません。 > また、の順に記載している事が問題なのでしょうか。 > > -------------- > 2017-04-24 00:00:34,824 [DataStoreCrawler] INFO No crawling target urls. > 2017-04-24 00:00:35,017 [WebFsCrawler] INFO [Tattletale] modules [], > plugins [], sites [] > 2017-04-24 00:00:35,218 [WebFsCrawler] INFO Connected to localhost:0001 > 2017-04-24 00:00:35,516 [WebFsCrawler] INFO Target URL: > http://testwww2.ドメイン名/sitemap.xml > 2017-04-24 00:00:35,767 [Crawler-20170424000000-1-2] INFO Crawling URL: > http://testwww2.ドメイン名/sitemap.xml > 2017-04-24 00:00:36,042 [Crawler-20170424000000-1-2] INFO Checking URL: > http://testwww2.ドメイン名/robots.txt > 2017-04-24 00:00:38,286 [Crawler-20170424000000-1-1] INFO Crawling URL: > http://testwww2.ドメイン名/calendar/ > ・ > ・ > ・ > 2017-04-24 00:53:54,282 [IndexUpdater] INFO Processing no docs > (Doc:{access 3ms, cleanup 194ms}, Mem:{used 24MB, heap 46MB, max 505MB}) > 2017-04-24 00:53:54,282 [IndexUpdater] INFO [EXEC TIME] index update > time: 49847ms > 2017-04-24 00:53:54,416 [main] INFO Finished Crawler > 2017-04-24 00:53:54,625 [main] INFO [CRAWL INFO] > DataCrawlEndTime=2017-04-24T00:00:34.842+0900,CrawlerEndTime=2017-04-24T00:53:54.417+0900,WebFsCrawlExecTime=3189904,CrawlerStatus=true,CrawlerStartTime=2017-04-24T00:00:34.612+0900,WebFsCrawlEndTime=2017-04-24T00:53:54.416+0900,WebFsIndexExecTime=49847,WebFsIndexSize=26,CrawlerExecTime=3199805,DataCrawlStartTime=2017-04-24T00:00:34.741+0900,WebFsCrawlStartTime=2017-04-24T00:00:34.733+0900 > 2017-04-24 00:53:54,879 [main] INFO Disconnected to > elasticsearch:localhost:0001 > 2017-04-24 00:54:02,961 [main] INFO Destroyed LaContainer. > -------------- > > よろしくお願いいたします。 > > > > ------------------- Replied Message ------------------- > Date: 2017/04/23 20:58:30 > From: Shinsuke Sugaya > To: fess-user > Cc: > Subject: [fess-user 1009] Re:サイトマップ sitemap.xmlをクロール対象とす > る設定 > > https://www.sitemaps.org/ の形式を > サポートしています。クロールしている内容は > fess-crawler.logで確認することができます。 > 問題の再現方法をいただければ確認してみます。 > > shinsuke > > > 2017年4月17日 14:18 松宮 あすか : >> はじめましてkoronaです。 >> >> ウェブクロールの設定で最初はWebサイトの階層を指定して検索結果に出してい >> たのですが、 >> sitemap.xmlの方がページの除外や検索順序に都合良いと思い、sitemap.xmlを指 >> 定したのですが >> 検索結果に望むページが表示されません。 >> >> 「ウェブを対象としたクロールに関する設定」の箇所で、以下のように入力すれば >> sitemap.xmlで指定したリンクを検索対象になるという認識なのですが間違って >> いるでしょうか。 >> >> URL欄: http://ドメイン/sitemap.xml >> クロール対象とするURL: http://ドメイン/.* >> >> よろしくお願いします。 >> >> _______________________________________________ >> Fess-user mailing list >> Fess-user @ lists.osdn.me >> http://lists.osdn.me/mailman/listinfo/fess-user > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.osdn.me > http://lists.osdn.me/mailman/listinfo/fess-user > > > > > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.osdn.me > http://lists.osdn.me/mailman/listinfo/fess-user > From shinsuke @ yahoo.co.jp Thu Jun 1 10:07:02 2017 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Thu, 1 Jun 2017 10:07:02 +0900 Subject: [fess-user 1017] Re: =?utf-8?b?44K344K544OG44Og44Ko44Op44O855m655Sf5pmC44Gu5a++?= =?utf-8?b?5Yem5pa55rOV?= In-Reply-To: References: Message-ID: 発生状況や再現方法がわからないため、何とも言えませんが、 システムエラーと出る場合、fess.logにERROR的なものが でそうな気がします。 shinsuke 2017年5月31日 17:05 上田秀樹 OSK 技財品技 : > 上田と申します。お世話になります。 > > この件で、さらに動作を確認したところ、 > 特定の単語で常におこるわけではありませんでした。 > > 検索結果を表示する際に、ヒットした結果の一覧が表示されますが、 > ヒットしたある特定の結果に何らかの問題があって、システムエラーになっているようです。 > > この、「ある特定の結果に何らかの問題」をさらに特定していきたいのです。 > おそらく検索対象の該当ファイルまでは到達できると思いますが、 > その該当ファイルの何が問題なのかを特定する方法はありますでしょうか? > > ご存知の方がいらっしゃれば、ご教授いただければ幸いです。 > > > 2017年5月30日 18:00 上田秀樹 OSK 技財品技 : > >> 上田と申します お世話になります。 >> >> 特定の単語を検索すると、「システムエラー サイト管理者にお問い合わせください。」のメッセージ画面に常になる現象が発生しています。 >> >> 「システム情報」-「ログファイル」から >> 「fess.log」を見てみたのですが、よくわからない状態です。 >> -- >> 2017-05-30 17:52:52,489 [elasticsearch[Node 1][scheduler][T#1]] WARN >> [gc][1666] overhead, spent [877ms] collecting in the last [1.5s] >> 2017-05-30 17:53:50,592 [elasticsearch[Node 1][scheduler][T#1]] WARN >> [gc][1723] overhead, spent [981ms] collecting in the last [1.6s] >> 2017-05-30 17:54:17,255 [elasticsearch[Node 1][scheduler][T#1]] WARN >> [gc][1749] overhead, spent [844ms] collecting in the last [1.5s] >> 2017-05-30 17:57:07,299 [elasticsearch[Node 1][scheduler][T#1]] WARN >> [gc][1918] overhead, spent [819ms] collecting in the last [1.3s] >> -- >> >> 何か解決するためのヒント、手がかりがありましたらご教授お願いいたします。 >> >> バージョン:fess-11.1.0 >> OS Windows7 Pro >> >> -- >> // 上田 秀樹 >> // オムロンソフトウェア株式会社 >> // 品質・技術・人材センタ >> // 品質技術部 開発技術G >> // TOL 7-211-4071 >> // TEL 077-352-7238 > > > > > -- > // 上田 秀樹 > // オムロンソフトウェア株式会社 > // 品質・技術・人材センタ > // 品質技術部 開発技術G > // TOL 7-211-4071 > // TEL 077-352-7238 > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.osdn.me > http://lists.osdn.me/mailman/listinfo/fess-user > From =?ISO-2022-JP?B?IhskQjVIMiwbKEIgOyAbJEIlNSVzJUYlORsoQg==?= Thu Jun 1 10:09:16 2017 From: =?ISO-2022-JP?B?IhskQjVIMiwbKEIgOyAbJEIlNSVzJUYlORsoQg==?= (=?ISO-2022-JP?B?IhskQjVIMiwbKEIgOyAbJEIlNSVzJUYlORsoQg==?=) Date: Thu, 01 Jun 2017 10:09:16 +0900 Subject: [fess-user 1018] Re: =?iso-2022-jp?b?GyRCJS8lbSE8JWskLD0qJG8kaSRKJCQhKRsoQg==?= In-Reply-To: References: <000501d2a439$9d11db50$d73591f0$@sqa.co.jp> Message-ID: <20170601100915.BF70.AB271CAB@santest.co.jp> 関戸様 初めは検索対象のフォルダ、フォルダ深さ、最大アクセス数を 最小限に絞って、大体どんな感じか試したほうがいいですよ。 -- サンテスト株式会社 技術部 吉岡 拓人 〒554-8691 大阪市此花区島屋4丁目2番51号 Tel: (06)6465-5561 Fax: (06)6465-5921 On Thu, 1 Jun 2017 09:50:23 +0900 Shinsuke Sugaya wrote: > > この程度はかかるものでしょうか。 > > システムやネットワークの性能、クロールの設定内容や > クロール対象の量に依存するため、どの程度かかかるかは > 一概に言えません。 > > > また、ダッシュボード画面のdocsの数字は、375,000 程度になっています。 > > Elasticsearchに格納されているドキュメントの量になります。 > 設定、ログ、サジェストなど様々なものを含みます。 > 検索対象のドキュメント数はfess.YYYYMMDDインデックスの > docsになります。 > > shinsuke > > > > > 2017年3月24日 9:57 SQA SEKIDO Ryoichi : > > 関戸@SQAです。 > > お世話になります。 > > > > 社内のWindowsサーバをクロールしているのですが、24時間以上たっても続いていま > > す。 > > この程度はかかるものでしょうか。 > > fess の環境は次のとおりです。 > > OS: CentOS 7 > > JAVA: jdk1.8.0 > > Fess: 10.3.1 > > > > また、ダッシュボード画面のdocsの数字は、375,000 程度になっています。 > > この意味は、クロールしているサーバに存在するドキュメントの数でしょうか。 > > もしくはクロールした延べの数でしょうか。 > > > > よろしくお願いします。 > > > > > > --- Structural Quality Assurance -------------------------------------> > > 関戸 良一 sekido.ryoichi @ sqa.co.jp > > SEKIDO Ryoichi Phone/Fax 03-5214-3436 / 3432 > > PGP fingerprint = 46D9 01CF 1D90 9372 8B7B 59A9 B9B4 83E7 9D36 C8BD > > <------------------------------------------ 構造品質保証研究所(株) --- > > > > _______________________________________________ > > Fess-user mailing list > > Fess-user @ lists.osdn.me > > http://lists.osdn.me/mailman/listinfo/fess-user > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.osdn.me > http://lists.osdn.me/mailman/listinfo/fess-user From hideki_ueda @ oss-g.omron.co.jp Thu Jun 1 12:56:45 2017 From: hideki_ueda @ oss-g.omron.co.jp (=?UTF-8?B?5LiK55Sw56eA5qi5IO+8r++8s++8qyDmioDosqHlk4HmioA=?=) Date: Thu, 1 Jun 2017 12:56:45 +0900 Subject: [fess-user 1019] Re: =?utf-8?b?44K344K544OG44Og44Ko44Op44O855m655Sf5pmC44Gu5a++?= =?utf-8?b?5Yem5pa55rOV?= In-Reply-To: References: Message-ID: 上田です。お世話になります。 システムエラーとなる件ですが、 検索でヒットした時の、ファイル名、もしくはフォルダ名に、 半角の「%」が含まれている場合に、発生することがわかりました。 「fess-crawler.log」では該当のファイルは、他と同じように取得できているので、 表示するときの問題と思われます。 以上です。 2017年6月1日 10:07 Shinsuke Sugaya : > 発生状況や再現方法がわからないため、何とも言えませんが、 > システムエラーと出る場合、fess.logにERROR的なものが > でそうな気がします。 > > shinsuke > > > > 2017年5月31日 17:05 上田秀樹 OSK 技財品技 : > > 上田と申します。お世話になります。 > > > > この件で、さらに動作を確認したところ、 > > 特定の単語で常におこるわけではありませんでした。 > > > > 検索結果を表示する際に、ヒットした結果の一覧が表示されますが、 > > ヒットしたある特定の結果に何らかの問題があって、システムエラーになっているようです。 > > > > この、「ある特定の結果に何らかの問題」をさらに特定していきたいのです。 > > おそらく検索対象の該当ファイルまでは到達できると思いますが、 > > その該当ファイルの何が問題なのかを特定する方法はありますでしょうか? > > > > ご存知の方がいらっしゃれば、ご教授いただければ幸いです。 > > > > > > 2017年5月30日 18:00 上田秀樹 OSK 技財品技 : > > > >> 上田と申します お世話になります。 > >> > >> 特定の単語を検索すると、「システムエラー サイト管理者にお問い合わせください。」のメッセージ画面に常になる現象が発生しています。 > >> > >> 「システム情報」-「ログファイル」から > >> 「fess.log」を見てみたのですが、よくわからない状態です。 > >> -- > >> 2017-05-30 17:52:52,489 [elasticsearch[Node 1][scheduler][T#1]] WARN > >> [gc][1666] overhead, spent [877ms] collecting in the last [1.5s] > >> 2017-05-30 17:53:50,592 [elasticsearch[Node 1][scheduler][T#1]] WARN > >> [gc][1723] overhead, spent [981ms] collecting in the last [1.6s] > >> 2017-05-30 17:54:17,255 [elasticsearch[Node 1][scheduler][T#1]] WARN > >> [gc][1749] overhead, spent [844ms] collecting in the last [1.5s] > >> 2017-05-30 17:57:07,299 [elasticsearch[Node 1][scheduler][T#1]] WARN > >> [gc][1918] overhead, spent [819ms] collecting in the last [1.3s] > >> -- > >> > >> 何か解決するためのヒント、手がかりがありましたらご教授お願いいたします。 > >> > >> バージョン:fess-11.1.0 > >> OS Windows7 Pro > >> > >> -- > >> // 上田 秀樹 > >> // オムロンソフトウェア株式会社 > >> // 品質・技術・人材センタ > >> // 品質技術部 開発技術G > >> // TOL 7-211-4071 > >> // TEL 077-352-7238 > > > > > > > > > > -- > > // 上田 秀樹 > > // オムロンソフトウェア株式会社 > > // 品質・技術・人材センタ > > // 品質技術部 開発技術G > > // TOL 7-211-4071 > > // TEL 077-352-7238 > > > > _______________________________________________ > > Fess-user mailing list > > Fess-user @ lists.osdn.me > > http://lists.osdn.me/mailman/listinfo/fess-user > > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.osdn.me > http://lists.osdn.me/mailman/listinfo/fess-user > -- // 上田 秀樹 // オムロンソフトウェア株式会社 // 品質・技術・人材センタ // 品質技術部 開発技術G // TOL 7-211-4071 // TEL 077-352-7238 -------------- next part -------------- HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B... URL: http://lists.osdn.me/mailman/archives/fess-user/attachments/20170601/c22ae1e0/attachment.htm From matsumiya.asuka @ idaj.co.jp Fri Jun 2 15:47:09 2017 From: matsumiya.asuka @ idaj.co.jp (=?UTF-8?B?5p2+5a6uIOOBguOBmeOBiw==?=) Date: Fri, 2 Jun 2017 15:47:09 +0900 Subject: [fess-user 1020] Re: =?utf-8?b?44K144Kk44OI44Oe44OD44OXIHNpdGVtYXAueG1s44KS44Kv?= =?utf-8?b?44Ot44O844Or5a++6LGh44Go44GZ44KL6Kit5a6a?= In-Reply-To: References: <58F45037.20109@idaj.co.jp> <58FD582C.3000905@idaj.co.jp> Message-ID: <593109ED.6000005@idaj.co.jp> Sugaya様 返信をありがとうございます。 sitemap.xmlはの順に 正しく書けば、きちんとクロールされました。 ただ、最終的に望んでおりました結果は、sitemap.xmlをクロールさせて sitemapの掲載順に結果を表示させる=検索結果表示順のコントロールでした。 sitemap.xmlを読み込んでも、厳密にsitemap順に検索結果に出す事はできません でした。 ------------------- Replied Message ------------------- Date: 2017/06/01 10:04:43 From: Shinsuke Sugaya To: fess-user Cc: Subject: [fess-user 1016] Re:サイトマップ sitemap.xmlをクロール対象とす る設定 sitemap.xmlが開始URLとして指定されているので、 > 2017-04-24 00:00:35,767 [Crawler-20170424000000-1-2] INFO Crawling URL: http://testwww2.ドメイン名/sitemap.xml を参照して、クロール対象のURLを取得して > 2017-04-24 00:00:38,286 [Crawler-20170424000000-1-1] INFO Crawling URL: http://testwww2.ドメイン名/calendar/ をクロールしていると思います。 > 自動的に「クロール対象とするURL: http://ドメイン/.*」で指定した はクロール時のフィルタ的な設定になります。 > また、の順に記載している事が問題なのでしょうか。 特に問題ないと思います。 shinsuke 2017年4月24日 10:43 松宮 あすか : > shinsuke様 > > 返信をありがとうございます。 > fess-crawler.logを見ると以下の記載がありました。 > クロールするターゲットのURLがない(sitemap.xmlがない)ので、 > 自動的に「クロール対象とするURL: http://ドメイン/.*」で指定した > HTMLファイルからリンクを辿って検索結果を出しているという認識でよろしいで > しょうか。 > > sitemap.xmlの書き方についてですがを記載していません。 > また、の順に記載している事が問題なのでしょうか。 > > -------------- > 2017-04-24 00:00:34,824 [DataStoreCrawler] INFO No crawling target urls. > 2017-04-24 00:00:35,017 [WebFsCrawler] INFO [Tattletale] modules [], > plugins [], sites [] > 2017-04-24 00:00:35,218 [WebFsCrawler] INFO Connected to localhost:0001 > 2017-04-24 00:00:35,516 [WebFsCrawler] INFO Target URL: > http://testwww2.ドメイン名/sitemap.xml > 2017-04-24 00:00:35,767 [Crawler-20170424000000-1-2] INFO Crawling URL: > http://testwww2.ドメイン名/sitemap.xml > 2017-04-24 00:00:36,042 [Crawler-20170424000000-1-2] INFO Checking URL: > http://testwww2.ドメイン名/robots.txt > 2017-04-24 00:00:38,286 [Crawler-20170424000000-1-1] INFO Crawling URL: > http://testwww2.ドメイン名/calendar/ > ・ > ・ > ・ > 2017-04-24 00:53:54,282 [IndexUpdater] INFO Processing no docs > (Doc:{access 3ms, cleanup 194ms}, Mem:{used 24MB, heap 46MB, max 505MB}) > 2017-04-24 00:53:54,282 [IndexUpdater] INFO [EXEC TIME] index update > time: 49847ms > 2017-04-24 00:53:54,416 [main] INFO Finished Crawler > 2017-04-24 00:53:54,625 [main] INFO [CRAWL INFO] > DataCrawlEndTime=2017-04-24T00:00:34.842+0900,CrawlerEndTime=2017-04-24T00:53:54.417+0900,WebFsCrawlExecTime=3189904,CrawlerStatus=true,CrawlerStartTime=2017-04-24T00:00:34.612+0900,WebFsCrawlEndTime=2017-04-24T00:53:54.416+0900,WebFsIndexExecTime=49847,WebFsIndexSize=26,CrawlerExecTime=3199805,DataCrawlStartTime=2017-04-24T00:00:34.741+0900,WebFsCrawlStartTime=2017-04-24T00:00:34.733+0900 > 2017-04-24 00:53:54,879 [main] INFO Disconnected to > elasticsearch:localhost:0001 > 2017-04-24 00:54:02,961 [main] INFO Destroyed LaContainer. > -------------- > > よろしくお願いいたします。 > >> > > ------------------- Replied Message ------------------- > Date: 2017/04/23 20:58:30 > From: Shinsuke Sugaya > To: fess-user > Cc: > Subject: [fess-user 1009] Re:サイトマップ sitemap.xmlをクロール対象とす > る設定 > > https://www.sitemaps.org/ の形式を > サポートしています。クロールしている内容は > fess-crawler.logで確認することができます。 > 問題の再現方法をいただければ確認してみます。 > > shinsuke > >> > 2017年4月17日 14:18 松宮 あすか : >> はじめましてkoronaです。 >> >> ウェブクロールの設定で最初はWebサイトの階層を指定して検索結果に出してい >> たのですが、 >> sitemap.xmlの方がページの除外や検索順序に都合良いと思い、sitemap.xmlを指 >> 定したのですが >> 検索結果に望むページが表示されません。 >> >> 「ウェブを対象としたクロールに関する設定」の箇所で、以下のように入力すれば >> sitemap.xmlで指定したリンクを検索対象になるという認識なのですが間違って >> いるでしょうか。 >> >> URL欄: http://ドメイン/sitemap.xml >> クロール対象とするURL: http://ドメイン/.* >> >> よろしくお願いします。 >> >> _______________________________________________ >> Fess-user mailing list >> Fess-user @ lists.osdn.me >> http://lists.osdn.me/mailman/listinfo/fess-user > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.osdn.me > http://lists.osdn.me/mailman/listinfo/fess-user > >> > >> > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.osdn.me > http://lists.osdn.me/mailman/listinfo/fess-user > _______________________________________________ Fess-user mailing list Fess-user @ lists.osdn.me http://lists.osdn.me/mailman/listinfo/fess-user