今回は2つのDataframeを比較して差分をもとめる方法について記載します。
例えば以下のようなDataframeがあるとします。
食べ物の名前と値段が入ったDataframeです。(プログラム上ではdf_allと言う名前のDataframeとして扱います)
それともう一つ、野菜のデータだけが入った以下のDataframeがあったとします。(プログラム上ではdf_vegetableと言う名前のDataframeとして扱います)
この二つのDataframeを比較して
野菜以外のDataframeをもとめたいと思います。
そのためにはisinというものを使います。
以下のように記述し、野菜以外のDataframe「df_other」をもとめます。
import pandas as pd
df_other = df_food_all[~df_food_all['Name'].isin(df_vegetable['Name'])]
df_otherを出力してみると以下のようになります。野菜のみが除去された新しいDataframeが定義できましたね!