[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[115] Re: 負記号「−」



 浅海です。

清秀紀/SEI Hideki <seih@dig-it-all.net> writes:

> HTML4・HTML3の出力時に、負記号の「−」が「?」となってしまい
> ます。LaTeX2e出力時には「−」のまま出力されます。

 これは、文字コードの相互変換の問題です。Unicodeと日本語コード系の相
性が悪く、どうしてもこうなっています。
 以前XML World(Java World)にも書いたのですが、本質的な解決策は
UTF-[8|16]を使うしかありません。

 志茂@CTCTさんが[sdocusersj 112]で指摘されている「〜」も同じ原因です。

 ただし、エンコーディングにEUC-JPを使うと、扱える文字の種類は増えるよ
うです。('−'と'〜'はOK)
# つい最近WINDOWS31Jというコード系がIANAに登録されたので、これがJava実
# 装系でサポートされるとシフトJIS系でも扱える文字の種類が増えます。

 XML(+Java)における文字コードの問題点は以下の資料が参考になります。

- XML日本語プロファイル
http://www.fxis.co.jp/DMS/sgml/xml/library/tr_xml_jpf/toc.html

- 「CAFE BABE Javaプログラミング・ノート 国際化と日本語処理」
風間一洋 4-7561-3481-5

-- 
あさみ@よこはま (http://www.netpassport.or.jp/~wtasami/)