2009-09-05 〓 技術 http://d.hatena.ne.jp/mandel59/20090904/1252071738の答え 同じ名前のファイルが存在しているように見える。 これはそれぞれ 「ほげほげ.txt」(NFD、「げ」は U+3051 U+3099 というシーケンス*1) 「ほげほげ.txt」(ZERO WIDTH SPACEが含まれている*2) 「ほげほげ.txt」(NFC、「げ」は単一のコードポイント U+3052) となっている。 Mac OS X標準のファイルシステム HFS+ ではファイル名がNFDで正規化されるが*3、Linuxのファイルシステムでは正規化は行わない。 *1:結合文字シーケンスにフォントが対応していなければ「け゛」みたく表示されるかもしれない。ここでは、IPAフォントを結合文字シーケンスも表示出来るように改造したものを使っているので、「フォントを弄った」というのも当たっている。オリジナルのIPAフォントは、「か゚」のような鼻濁音だけ結合文字シーケンスに対応している。 *2:この空白は、はてな記法における、括弧の直前直後にある注の表記にも役立つ。まあ自動リンク停止記法を使ってもいいけど。 *3:実際には、NFDとは少し違う独自の正規化