KOMINE Masako
Komin****@mss*****
2012年 4月 16日 (月) 17:09:14 JST
はじめまして。小峯と申します。 サイトマップを使用して、サイトをクロールさせようとしているのですが、 クロールはされるものの、webページとしてではなく、 何かのファイルとして処理されてしまいます。 そのページに含まれるリンク先にクロールに行かず、 検索結果で表示されるコンテンツタイトルに URLの最後の部分が表示されるため、そう判断しました。 また、このサイトには静的なページと動的に作成されるページとがあって 静的なページをサイトマップを使用せずにクロールさせると、 こちらはhtmlとして処理されます。 どちらの場合も「ウェブクロールの設定」で「深さ」は5に設定していました。 クロール対象のページのURLは"http:"で始まり、 wgetコマンドでアクセスすると、 "Content-Type: text/html;charset=UTF-8" で応答があるため、s2robot_rule.diconのデフォルトの設定で htmlとして処理されそうな気がします。 fess_crawler.outを見てもエラーらしき出力は見つけられません。 どのような原因が考えられるか、お心当たりがありましたら お教え願えるでしょうか。 よろしくお願いいたします。