「単語集をMP3に変換アプリ」更新しました。

会員限定公開中のアプリ「単語集をMP3に変換アプリ」ですが、地味ながら役に立つアプリと自負しております。通称「読み上げ君」とも呼んでおります。要するに単語集を読み上げてくれるアプリなのです。一部の会員のユーザさんに同通の準備練習などに使っていただいております。

今日、使っていただいているユーザさんから連絡があり、単語集をちゃんと読んでくれない!エラーが出る!ということで、さっそく調査致しました。やっぱりいろんな使われ方をしてテストしないとまだまだバグが残っているようです。。テストをもっとしないとなあ、、と、反省しつつ、デバック(修正作業)を行います。

調べてみたら、ユーザさんが今回読ませようとした単語集の「文字コード」が標準と違うタイプだったので、アプリが読み込みに失敗していました。「文字コード」ってよくバグを起こす分野なんですよね。。特に日本語は文字コードが複雑なので、起こるエラーもいろいろです。よくあるのが「文字化け」です。これも文字コードがいろいろあって食い違うために起こる現象です。乱暴に言うと日本語特有の現象です。アルファベットだったら話は簡単なんですが、日本語(というかヨーロッパ系以外の言語、2バイト文字と呼ぶタイプの言語)は文字数が多い(漢字が何千もあるとかそういうことで)ので、扱いが大変です。そして、結構な確率で問題が起こります。

とは言っても昔(1980年代)ほど状況は大変ではなくなりました。今ではUnicodeと呼ばれる国際標準ができて、UTF-8(とかUTF-16) とかいう世界のほぼ全言語に対応できる文字コードが制定されたので、今では何語でも、UTF-8(これがネットでは標準です)を使っていれば大丈夫(文字化けなし)という状況になってます。しかし、日本語特有の文字コードというのがあり、それがまだまだ使われてたりして、これが問題を起こすわけです、よくある日本語特有のコードが、Shift-JISと呼ばれる文字コードです。昔マイクロソフトが作ったらしいです。これがいまだに使われてたりして、問題を起こします。

さて、今回の問題もまさにこのShift-JIS問題でした。つまり、ユーザが読ませようとした単語集はShift-JISで書かれていたのです。一方で、私のアプリはUTF-8を読む仕様になっていたので、単語集を読むときにエラーになってしまっていたのです。ということなので、単語集をUTF-8で書いてください!が解決策なのですが、それでは、普通の方にはなんのこっちゃ?ですよね。やはりここはアプリを改良するべき。ということで、Shift-JISで書かれた単語集も読めるようにアプリを修正(というか改良)して、めでたく、単語集が正常に読み込めて、読み上げ音声ファイルを作成することができました。

以上ちょっとテクニカルな話になってしまいましたが、とにかく日本語ってPCの世界でもいろいろ面倒なことが多いんだという一例でした。。。

ご興味あるかたは真面目な解説(ウィキペディア)をご覧ください。

Shift_JIS - Wikipedia

UTF-8 - Wikipedia

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です