機能性表示食品DBのcsvファイル内をキーワード検索してタグ付けを行うコード
機能性表示食品リスト(消費者庁Webサイトからダウンロードできるcsvファイル)上で、「表示しようとする機能性」に含まれる単語を検索して、タグ付けを行うPythonコードです。
<作った背景>
消費者庁の機能性表示食品DBには検索機能がありますが、「表示しようとする機能性」は、2単語のAND検索しかできないため、複数の機能を有する機能性表示食品を抽出しようとする場合に使い勝手が悪い。
そこで、csvファイルで全体をダウンロードしてから、検索キーワードでタグ付けを行い、自由度高く検索できるようにするため、本コードを作成。
<ファイル準備>
消費者庁のDB(機能性表示食品の届出情報検索)から、全体をそのままダウンロード。ファイル名を「届出情報検索一覧(1).csv」とする。
<コード>
import pandas as pd
FFC = pd.read_csv("届出情報検索一覧(1).csv")
words=['体脂肪', '体重', '血糖', '中性脂肪'] #キーワードは任意で増やせる。
for x in words:
tmp = FFC.loc[FFC['表示しようとする機能性'].str.contains(x)]
tmp[x]=1
FFC = pd.merge(FFC, tmp"届出番号",x, on="届出番号", how="outer")
FFC.to_excel("data.xlsx", index=False)
FFC.to_csv("data.csv", index=False)
-------
「機能性表示食品」については以下の記事を参照ください。