文字化けの原因 〜文字コードとは〜

date_range 2023/10/24
日々の活動日記エンジニアインターン
サムネ

こんにちは!

マーケティング部受託プロダクトチームのインターン生、村高歩夢です!


最近Zoom、文字化けが激しいですよね。

みなさん文字化けって結構久しぶりに見たんじゃないですか?

僕が小学生の頃はwebサイト開くと結構文字化けしてるサイトが結構ありました。

当時は悪戯だと思い、ネットって悪い人が多いんだなと印象を持っていましたね。

今は全然文字化けしているサイト見かけないですからね〜

技術の進歩を感じますね〜


ところで文字化けってなんで起こるか知っていますか?

文字化けの原因は主にwebサイトなどに使用されている文字コードとブラウザが解釈した文字コードが一致しないときに起こるものです。

文字コード?

え?

ってなりましたよね

UTF-8、ASCII、JISコードなどは聞いたことがあるんじゃないですか?あれが文字コードです。

従って、UTF-8を使用しているWEBサイトをブラウザがJISコードだと思って表示してしまうと文字化けしてしまう訳です。


では、そもそもなんで文字コードが存在するのでしょうか?

簡単に言うと容量の節約のためです。


文字って無数にあるじゃないですか?

そんな文字をいちいち全部保存していたら、たとえば、英語しか使わないWEBサイトにとっては非効率極まりないですよね?

よって、効率を良くするために複数の文字コードを作って、用途に分けているんです。


でもみなさん思ったはずです。

文字コードの存在理由は分かった。

文字化けの理由は何?と


ここが面白いところ。

パソコンって文字のこと暗号だと思ってるんですよ。

だって、パソコンにとっての文字は数字ですもん。


文字コードというのは文字を数字に当てはめた対応表のことなんです。


たとえばASCIIコードでは「k」は107と表します。

(参照:https://www.k-cube.co.jp/wakaba/server/ascii_code.html)


そして文字コードによって対応する数字が異なります。

つまり、他の文字コードでは107が別の文字に対応しているので文字化けしてしまうんです。

これが、文字化けの理由


ちなみに「Excelにおいてセルに数値と文字を一緒に入れてはいけない」

とよく聞くと思います。

これはExcelをプログラミングで処理するときに文字コードによって文字が数字になってしまうのでセル内の値がとんでもない数字になってしまうからです。

まぁ厳密にいうと違うんですけれど、大体あってます。


さて、文字コード理解しましたか?

仕組みが分かると結構面白いですよね

これからも面白くて役に立つ知識を書いていきたいと思います!



■ガーディアン主力ソリューション→OWLet

■新サービスリリースのお知らせ

WEB業界を変える!育てて成果を上げるサブスク型HPサービス

SCSC (スクスク)

ガーディアンのインターン制度→こちら

村高歩夢の紹介ページこちら

*COMMENT*

    *コメント*

    *ログイン*

    メールアドレス
    パスワード