ちょっとしたメモ - 国際化識別子IRIがRFC3987に

URIを包含するデジタル情報の国際的な識別子として仕様がRFC化されたようです。日本語表記もできるようで、無理に英文化したりしなくて良くなり、従来のURIでの表記よりも使いやすくなります。

長い間検討されてきた、多国語を使えるリソース識別子であるIRI (Internationalized Resource Identifier) が、ようやくRFC3987となりました。合わせて、URIの一般構文を定義するRFC2396の改訂版もRFC3986として公開されています。
IRIは、Unicode(ISO 10646)の文字レパートリを使えるようにしたリソース識別子。URIはASCIIのサブセットしか使えないために、検索のクエリやWiki nameに日本語を与えると '%E7%A5%9E%E5%B4%8E' のようにエスケープ(URLエンコード)されてしまうわけですが、IRIならこれを '神崎' とできることになります。さらに、IRIでは右から左に向かって文字を書く言語のことも考慮したBidiに関する規定も用意しています。
IRIが使える場面としては、たとえばXMLスキーマのanyURIデータ型を持つところや、RDFRDF URI参照を用いるところなどが挙げられます。逆にHTTPのRequest URIはIRIを想定していないので、アプリケーションはIRIをURIに変換してから用いなければなりません(IRIは、URIの拡張としてではなく、新たなプロトコル要素として定義され、URIとの相互変換方法が定められています)。