コード体系という大問題
 インターネット上のことって難しいですね。特に漢字コードの問題です。フォームからメールを送るとかなかなか厄介ですね。まったくどんな具合に変換されているのやら?まったく勉強の種はつきません。いっそのこと日本語を廃止して英語一本にしてしまうとか、そういった改革か、日本語がまともに通るシステムが全世界的になると簡単なんですがね。結局こういったものが、普及の足かせになっているのでしょう。
 まあ、欧米人にとっては、この日本語のページも不可解な記号の羅列になってしまいます。試して見たい方はインターネットエクスプローラーなら、表示の中のエンコードで西ヨーロッパ言語を選択すればその雰囲気がわかります。日本語だって、シフトJISとEUCでは違った文字が出てきますしね。なかなか厄介です。まあ、自動選択が安定してきましたからさほど問題はなくなってきましたが、初めの方に1バイト文字を並べると厄介なようです。
 こんなことを気にし始めたのは、メールデータの自動収集を考えていたからなんです。メールのデータを名前を付けて保存したものを、テキストエディターで開くと・・・コード体系が違うとこうなるんだ!という典型ですからね。
 ヘッダー部分は欧文ですから問題ありませんが、こういったものからまともな日本語にするには文字コードを変換できる、近頃のMSワードとかちゃんと変換してくれますからね。でも、一番厄介なのはメールに添付ファイルとして付属する.txtの拡張子を持つやつですね。これは途中でコード変換がなされるらしく、文字が化け化けになってしまいます。.docとかの拡張子だと化けないようですから、こういったものって非常に厄介です。
 まあ、以前送られてきた、一太郎のファイルなんかよりはまだたちが良いですからね。単になれているというだけかもしれませんがね。
 日本語のテキストっていろいろな面で制約があるということなんですね。このあたりが何とかならないと、インターネットでのビジネスを展開するにはなかなか大変ということになるのでしょう。結局、こういったあたりが、自動化を妨げてくれますからね。結局、自前でサーバーを設置したり、さらに物販をやろうと思えば、セキュリティーを確立しなければなりませんから、到底素人の太刀打ちできる範囲ではなくなってしまいますね。まったく、奥が深いものです。そして、この奥というやつが、年々深くなっていきますから、この溝を埋めるべく学習することが困難になってきます。
 まあ、私のかよわい脳みそが、学習する能力を徐々に失っていることを意味するのでしょうかね。また必死にお勉強ですかね。まあ、概略を知るだけでもいいですが、それでも、全力が必要かもしれませんね。でも、知っていることが重荷となって、開発作業が滞ったり、開発費に二の足を踏んだり、厄介ですね。