CSVファイル をSJISからUTF-8に変換する簡単な方法

こんにちは、阿久梨絵です!
CSVファイル を扱う際、エンコーディングの違いによる文字化けはよくある問題です。特に、Shift-JIS(SJIS)で作成されたCSVをUTF-8に変換したい場合、適切な手順を知ることで効率的に作業が進みます。本記事では、初心者でもできる簡単な方法を解説します!

1. テキストエディタを使った方法

最も手軽な方法は、テキストエディタを使うことです。例えば、Windows標準の「メモ帳」や「Notepad++」を使用できます。

手順

1. SJISで作成されたCSVファイルテキストエディタで開きます。
2. 「名前を付けて保存」を選択します。
3. 「文字コード」でUTF-8を選び、ファイルを保存します。

これだけでエンコーディングの変換が完了します!ただし、大規模なデータでは時間がかかる場合があります。

2. EXCELを使った方法

EXCELを使用することで、エンコーディングを簡単に変更できます。

手順

1. EXCELでSJISのCSVファイルを開きます(文字化けがある場合は、インポート設定を確認)。
2. 「ファイル」 ― 「エクスポート」 ― 「CSVファイルとして保存」を選択。
3. 保存時にUTF-8を選択して保存します。

EXCELを利用する方法は、データの編集も同時に行えるため便利です。

3. Pythonで自動変換する方法

プログラミングを活用すると、大量のファイルを効率的に変換できます。Pythonを例に挙げます。

#コード例
import pandas as pd
Pandasライブラリをインポートすることで、データ操作の機能を利用可能にします。このコードの中心となる部分です。

# SJISのCSVファイルを読み込み
df = pd.read_csv(‘input.csv’, encoding=’shift_jis’)
Shift-JISエンコードのCSVファイルをPandasデータフレームとして読み込むステップです。このエンコーディング指定がない場合、ファイルが文字化けする可能性があります。

# UTF-8で保存
df.to_csv(‘output.csv’, encoding=’utf-8-sig’, index=False)
読み込んだデータフレームをUTF-8エンコードで保存します。を指定することで、Excelなどのアプリケーションで文字化けを防ぎます。また、は、データフレームのインデックスをCSVに含めないようにするオプションです。

この方法は、データをカスタマイズしたり複数ファイルを一括処理したい場合に最適です。

4. コマンドラインツールを活用する方法

LinuxやWindowsのコマンドラインを使う方法もあります。`iconv`コマンドを使用することで簡単に変換が可能です。

手順

1. コマンドプロンプトまたはターミナルを開きます。
2. 以下のコマンドを実行します。

iconv -f SHIFT-JIS -t UTF-8 input.csv > output.csv

3. これで変換が完了します。

コマンドラインツールは高速で、プログラムのインストール不要なのが利点です。

まとめ

CSVファイルのエンコーディング変換は、ツールや方法に応じて選択可能です。以下が状況に応じたおすすめ
少量のデータ: テキストエディタまたはEXCEL。
大量のデータや自動化が必要: Pythonまたはコマンドラインツール。

これを参考に、効率的な変換を実現してください!
阿久梨絵でした!

Verified by MonsterInsights