Pythonで文字コード指定して日本語を出力させる方法

Pythonの仕様としてASCIIを使って文字を認識しようとします。そのため日本語などのマルチバイト文字がプログラム中に含まれている場合、ASCIIで無理やり認識しようとして結果、エラーとなります。今回はそれを回避するための方法をシェアします。

文字コードを指定する

日本語などのマルチバイト文字をプログラム内で使用する場合には、プログラムの文字コードの指定する必要があります。Pythonのプログラムで指定できる文字コードには幾つかする医がありますので、詳細はリファレンス等をご確認ください。

日本語を利用するなら、UTF-8 を推奨

Pythonで日本語を利用する場合、指定する文字コードは「UTF-8」を指定しておけば良いです。日本語に対応している文字コードであれば何でも良いので「Shift_JIS)」や「EUC-JP」でもOKです。

MEMO
大文字小文字は区別されませんので「utf-8」などと記述することも出来ます。

文字コード指定の記述方法

プログラムの1行目、又は2行目に下記の記述をすることで文字コードを指定できます。

Pythonでコメント表記する記述パターン

Pythonは「#」をコメントとして認識するので、1行目、又は2行目に上記コードを記述したとしても、文字コードの指定としては認識されずコメント文として認識されてしまいますのでご留意ください。文字コードの指定は1行目か2行目で行う。これがPythonのルールです。

Unicodeを使う場合

日本語などのマルチバイト文字を利用する際には、Unicode文字列として記述する必要があります。Unicode文字列を利用する際には文字列の前に「u」を付与して記述します。

保存時の文字コード指定も忘れずに

プログラム内に文字コードの指定を記述しただけでは、NGなのでご留意ください。

作成したプログラムを保存する際、プログラム内で指定した文字コードと同じもので保存する必要があります。

Windows標準のテキストエディタであれば、「名前を付けて保存」を選択すると右下に文字コードを選択するプルダウンが表示されます。ファイル保存の際は、ここも忘れずに変更して保存してください。

Pythonを学ぶならスクールよりUdemyがおすすめ

書籍で勉強するのは辛い。説明を聞きながら、実際に動く画面でイメージを膨らませてから手を動かして理解したいという方にはUdemyがオススメ。プログラミングスクールのように高額費用負担がなく、1,340円でPythonの講義が受講できます。おすすめの講座を紹介します。

現役シリコンバレーエンジニアが教えるPython3入門 + 応用 + アメリカのシリコンバレー流コードスタイル

基礎的な入門編だけでなく応用編やコードスタイルまで学習範囲に入っている良講義。入門編で基本的なPythonのプログラミングをマスターしたら応用編で、データ解析、データーベース、ネットワーク、暗号化、並列化、テスト、インフラ自動化、キューイングシステム、非同期処理といった実業務に役立つコンテンツが盛り沢山の内容になっています。

延べ90,000人以上が受講して5点満点で4.5点という高評価を獲得していることからも万人に向いている講義です。講義時間は28.5時間のボリューム。1,340円で28.5時間の講義を受講できるコストパフォーマンスが凄く高い講座です

現役シリコンバレーエンジニアが教えるPython3入門 + 応用 + アメリカのシリコンバレー流コードスタイル

コメントを残す

メールアドレスが公開されることはありません。

CAPTCHA