DataFrameの指定複数列のユニーク値を取得する

スポンサーリンク
python Python

みなさんこんにちは。

今回も初歩的なコードになりますが、私が当時Python慣れていない時に解に辿り着くのに時間が掛かったものになります。

Pythonコード

複数列のユニーク値を取得する方法

import pandas as pd

# 二つの場合(DataFrameで取得できます。)
df_uniques = df[["対象カラム名1", "対象カラム名2"]].drop_duplicates()
print(df_uniques)

おまけ:uniqueとdrop_duplicatesの違い

import pandas as pd

# 一つの場合1(配列で取得できます。)
list_uniques = df["対象カラム名"].unique()
print(list_uniques)

# 一つの場合2(DataFrameで取得できます。)
df_unique = df[["対象カラム名1"]].drop_duplicates()
print(df_unique)

unique()が複数列でも動けばいいのにと激しく思います。

たまに出るエラー

このエラー、不定期にやって「は?」となってしまうので忘れないように記録しておきました。

参考になればと思います。

コメント

タイトルとURLをコピーしました