PythonでpandasのDataFrameやSeriesをpickleで保存・読み込みする方法 | to_pickleとread_pickleの使い方

PythonのpandasライブラリでDataFrameやSeriesをpickle形式で保存・読み込みする方法を解説します。to_pickleとread_pickleの使い方についても詳しく解説します。

PythonのpandasでDataFrameやSeriesを保存・読み込みする方法が知りたいです。

PandasのDataFrameやSeriesは、pickle形式で簡単に保存・読み込みすることができます。pickle形式で保存すると、データの圧縮効果があるため、通常のテキスト形式よりも小さなファイルサイズで保存できます。

保存するには、DataFrameやSeriesのto_pickle()メソッドを使用し、読み込むにはread_pickle()メソッドを使用します。

目次

pickle形式でのデータ保存と読み込みの概要

PandasのDataFrameやSeriesは、pickle形式で簡単に保存・読み込みすることができます。pickle形式はPythonの標準ライブラリに含まれるため、インストール不要で使えます。pickle形式で保存されたデータは、バイナリ形式で保存されるため、データの圧縮効果があり、通常のテキスト形式よりも小さなファイルサイズで保存できます。

pickle形式で保存すると、ファイル名の拡張子に.pklが使用されます。また、pickle形式で保存されたデータは、別のプログラムでも読み込むことができますが、Pythonのバージョンが異なる場合は読み込めないことがあるので注意が必要です。

CHECK
  • pickle形式はバイナリ形式で保存されるため、通常のテキスト形式よりも小さなファイルサイズで保存できます。
  • pickle形式で保存したデータは、別のプログラムでも読み込むことができますが、Pythonのバージョンが異なる場合は読み込めないことがあります。
  • pickle形式で保存する際には、ファイル名の拡張子に.pklを使うことが一般的です。

DataFrameをpickle形式で保存する方法

DataFrameをpickle形式で保存するには、to_pickle()メソッドを使用します。

以下のサンプルコードは、DataFrameをpickle形式で保存する例です。

import pandas as pd

# DataFrameを作成する
df = pd.DataFrame({
    '名前': ['A', 'B', 'C'],
    '年齢': [20, 30, 40],
    '性別': ['男性', '女性', '男性']
})

# DataFrameをpickle形式で保存する
df.to_pickle('example.pkl')

まず、pandasをimportします。次に、pd.DataFrame()を使用して、DataFrameを作成します。上記の例では、3人の人物に関する情報(名前、年齢、性別)を含むDataFrameを作成しています。

次に、to_pickle()メソッドを使用して、DataFrameをpickle形式で保存します。df.to_pickle('example.pkl')のように、保存先のファイル名を指定します。この例では、’example.pkl’というファイル名で保存しています。

DataFrameをpickle形式で読み込む方法

DataFrameをpickle形式で読み込むには、read_pickle()メソッドを使用します。

以下のサンプルコードは、pickle形式で保存されたDataFrameを読み込む例です。

import pandas as pd

# pickle形式で保存されたDataFrameを読み込む
df = pd.read_pickle('example.pkl')

# DataFrameを表示する
print(df)

まず、pandasをimportします。次に、read_pickle()メソッドを使用して、pickle形式で保存されたDataFrameを読み込みます。pd.read_pickle('example.pkl')のように、読み込むファイル名を指定します。この例では、’example.pkl’という「DataFrameをpickle形式で保存する方法」で保存したファイル名のDataFrameを読み込んでいます。

最後に、print()関数を使用して、読み込んだDataFrameを表示します。上記の例では、3人の人物に関する情報(名前、年齢、性別)を含むDataFrameが表示されます。

Seriesをpickle形式で保存する方法

Seriesをpickle形式で保存するには、to_pickle()メソッドを使用します。

以下のサンプルコードは、Seriesをpickle形式で保存する例です。

import pandas as pd

# Seriesを作成する
s = pd.Series([10, 20, 30, 40], name='数値')

# Seriesをpickle形式で保存する
s.to_pickle('example.pkl')

まず、pandasをimportします。次に、pd.Series()を使用して、Seriesを作成します。上記の例では、[10, 20, 30, 40]という4つの数値を含むSeriesを作成しています。

次に、to_pickle()メソッドを使用して、Seriesをpickle形式で保存します。s.to_pickle('example.pkl')のように、保存先のファイル名を指定します。この例では、’example.pkl’というファイル名で保存しています。

Seriesをpickle形式で読み込む方法

Seriesをpickle形式で読み込むには、read_pickle()メソッドを使用します。

以下のサンプルコードは、pickle形式で保存されたSeriesを読み込む例です。

import pandas as pd

# pickle形式で保存されたSeriesを読み込む
s = pd.read_pickle('example.pkl')

# Seriesを表示する
print(s)

まず、pandasをimportします。次に、read_pickle()メソッドを使用して、pickle形式で保存されたSeriesを読み込みます。pd.read_pickle('example.pkl')のように、読み込むファイル名を指定します。この例では、’example.pkl’という「Seriesをpickle形式で保存する方法」で保存したファイル名のSeriesを読み込んでいます。

最後に、print()関数を使用して、読み込んだSeriesを表示します。上記の例では、[10, 20, 30, 40]という4つの数値を含むSeriesが表示されます。

まとめ

PythonのpandasライブラリでDataFrameやSeriesをpickle形式で保存・読み込みする方法を解説しました。

  • PandasのDataFrameやSeriesをpickle形式で保存・読み込みするには、to_pickle()メソッドとread_pickle()メソッドを使用する。
  • DataFrameやSeriesをpickle形式で保存する際は、ファイル名の拡張子に.pklを使用することが一般的です。
  • pickle形式で保存されたデータはバイナリ形式で保存されるため、通常のテキスト形式よりも小さなファイルサイズで保存できる。
  • 別のプログラムでもpickle形式で保存されたデータを読み込むことができるが、Pythonのバージョンが異なる場合は読み込めないことがある。

pickle形式で保存すると、データの圧縮効果があるというのは知りませんでした。これからはpickle形式で保存することも視野に入れたプログラミングをしていきたいと思います。

今回はPythonのpandasライブラリで、DataFrameやSeriesをpickle形式で保存・読み込みする方法を解説しました。pickle形式は、データの圧縮効果があるため、通常のテキスト形式よりも小さなファイルサイズで保存できます。

また、pickle形式で保存したデータは、別のプログラムでも読み込むことができますが、Pythonのバージョンが異なる場合は読み込めないことがあるので注意が必要です。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

コメント

コメントする

CAPTCHA


目次