[LE-talk-ja 167] Re: 重複符号化文字

Back to archive index

NARUSE, Yui narus****@airem*****
2006年 5月 19日 (金) 10:10:48 JST


成瀬です。

Nozomi Ytow wrote:
>> * 仮に区別しようとおもって、別のUnicodeコードポイントが無い
>>  典拠であるMicrosoftでも正規化しているため、
>>  Unicodeに一つしかコードポイントがありません。
>>  外字領域にマッピングするくらいしか方法はないでしょう
> 
> Unicode 3.2 からは valiation selector が使えるので、
> 内部的に表現できない訳ではありません。
> 規定されている組合せ以外は外に出してはダメです

うーん、U+FFFFを越えてしまう時点でnkf的には及び腰です。

また、Ideographic Variation Databaseを考えると、
あまりに危険な手法に感じます。
http://www.unicode.org/reports/tr37/

-- 
NARUSE, Yui  <narus****@airem*****>
DBDB A476 FDBD 9450 02CD 0EFC BCE3 C388 472E C1EA



Legacy-Encoding-talk-ja メーリングリストの案内
Back to archive index