[fess-user 255] Re: ファイルシステムクロールでの正規表現

Back to archive index

Takahiro Kikumoto takak****@gmail*****
2010年 7月 1日 (木) 10:31:35 JST


きくもとです。

ご確認いただきありがとうございます。
よろしくお願いします。

2010年7月1日8:43 Shinsuke Sugaya <shins****@yahoo*****>:
> 菅谷です。
>
> ご指摘いただきありがとうございます。
> ちらっと確認した感じですと、おっしゃる通りかと
> 思いますので、今週中に修正したいと思います。
>
> shinsuke
>
> 2010年6月30日10:26 Takahiro Kikumoto <takak****@gmail*****>:
>> はじめまして、きくもとと申します。
>>
>> fess 3.1.1 を利用しています。
>> ファイルシステムクロールの設定で、「クロール対象から除外するパス」で
>> 拡張子 txt を除外するために
>>
>> .*\.txt$
>>
>> を指定したのですが、除外されませんでした。
>> 一方で
>>
>> .*txt$
>>
>> を指定すると除外してくれます。
>> FileSystemIndexHelper.java 見ると、「クロール対象とするパス」「クロール対象から除外するパス」は
>> SystemHelper#encodeUrlFilter でエンコードされているかと思います(#20713対応)。
>> そうすると、org.seasar.robot.util.CharUtil#isUrlChar でバックスラッシュは false を返すため、
>> バックスラッシュはエンコードされてしまうのではないかと思います。
>> そうすると、正規表現 '\.' が S2Robot に渡されるときには意図したものとはことなった表現となり、
>> 期待通りに動作しなかったのではないかと考えました。
>>
>> ご確認いただき、対応をご検討いただければ幸です。
>> よろしくお願いいたします。
>>
>> _______________________________________________
>> Fess-user mailing list
>> Fess-****@lists*****
>> http://lists.sourceforge.jp/mailman/listinfo/fess-user
>>
>
> _______________________________________________
> Fess-user mailing list
> Fess-****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/fess-user
>




Fess-user メーリングリストの案内
Back to archive index