はじめに
NDBオープンデータは、レセプト情報・特定健診等情報データベース(National Database: NDB)から作成された「汎用性の高い基礎的な集計表」です。1) 日本全国で行われている診療行為・処方薬・特定健診の数量をみることができます。
今回は、NDBオープンデータとプログラミング言語Pythonを用いて、生物学的製剤のうち、「アクテムラ点滴静注用」2) の使用量の地域差を可視化しました。
NDBオープンデータを使って何ができるかを知りたい方は、本記事をぜひ参考にされてください。
NDBオープンデータとは
NDBオープンデータは、レセプト情報・特定健診等情報データベース(National Database: NDB)から作成された「汎用性の高い基礎的な集計表」です。NDBのような利用申請は不要であり、すぐに分析を始めることができます。診療行為や処方薬、特定健診について、性年齢別と都道府県別の集計をみることができます。現在、第1回から第5回までが公開されており、平成26年度から平成30年度のレセプト情報と、平成25年度から平成29年度の特定健診情報を利用することができます。
※NDBについての詳細は関連記事「NDBではどんな研究ができる?編集部による論文調査結果」をお読みください。
Pythonによるデータの読み込みと整形
分析環境
本稿の作成のための分析環境として、Google Colaboratory3)を使用しています。Google Colaboratoryは自分のパソコンにPythonをインストールすることなく、Google Drive上でPythonを扱えるサービスです。
Pythonと使用したパッケージのバージョンは次の通りです。
- Python: 3.7.11
- numpy: 1.19.5
- pandas: 1.1.5
- matplotlib: 3.2.2
- japanize-matplotlib: 1.1.3
各パッケージの説明
numpy
行列計算を行うためのパッケージです。
pandas
データフレームという、行と列を持った表形式のデータを扱うためのパッケージです。
Excelファイルを直接読み込むこともできます。
matplotlib
グラフ描画のためのパッケージです。
japanize-matplotlib
matplotlibでグラフ描画する際、日本語を使えるようにするためのパッケージです。
使用するデータ
第5回NDBオープンデータから、処方薬→注射→都道府県別薬効分類別数量のファイルを使用します。平成30年度 (2018年度)のデータです。4)
また、各都道府県の人口の影響を除くために、国の人口推計から2018年の10月1日現在の都道府県別人口のデータを使用します。5)
読み込みと整形
データ読み込みと整形は次の手順に従って行いました。
- pandasのread_excel関数を用いて、使用するファイルをそのまま読み込む。
- ファイルから不要な情報を削除する。
- 省略されている行を埋める。
- 分析しやすいよう行の型を整える。
- 縦持ちデータにする。
実際のスクリプトは、添付のPDFファイルをご覧ください。
縦持ちデータ
表形式のデータには「縦持ち」と「横持ち」という2種類の構造があります。
生徒 | 科目 | 点数 |
A | 国語 | 80 |
A | 算数 | 70 |
A | 理科 | 100 |
A | 社会 | 90 |
B | 国語 | 75 |
B | 算数 | 100 |
B | 理科 | 90 |
B | 社会 | 60 |
生徒 | 国語 | 数学 | 理科 | 社会 |
A | 80 | 70 | 100 | 90 |
B | 75 | 100 | 90 | 60 |
表1, 2は同じ内容のデータを縦持ちと横持ちで表した表になります。縦持ちデータでは、1行に「1人の生徒の1科目の点数」が入っています。一方で横持ちデータでは、科目列の内容が横に広がり、1行が「1生徒の4科目の点数」を表しています。
横に広げる項目が選ばれている横持ちデータに比べ、縦持ちデータでは各項目が同じように扱われており、よりニュートラルな形態と言えます。
データ分析前の整形処理のゴールを縦持ちデータにすることで、その後の加工が簡単になります。
都道府県別に生物学的製剤使用量を比較
matplotlibを用いて、平成30年度 (2018年度)のアクテムラ静注用 (80mg・200mg・400mg)の使用量の合計 (単位: mg)を都道府県ごとにプロットしたグラフが次の図1になります。

これでは人口の多い県が多く集計されてしまいますので、各都道府県の人口で割った量で比較したものが図2です。

1位の福井県は、47位の島根県に比べ、1人あたり約7倍もの使用量となりました。都道府県ごとに大きな差があることがわかります。上位の県に注目してみると、香川県・愛媛県・高知県と、四国の県が上位にありますが、徳島県だけは中程度になっています。この結果には何か要因があるのでしょうか。NDBオープンデータを用いた簡単な集計から、次の分析課題が浮かび上がってきます。
更に詳しい分析方法としては、年齢調整標準レセプト比があります。6) その地域の年齢層を考慮してもレセプト数が多いのかを判断することが可能です。
最後に
リアルワールドデータを分析したいと思っても、申請が必要なデータベースが多く、すぐに分析を始めることはできないこともあります。NDBオープンデータには、集計されたデータのみの提供ではありますが、日本全国を網羅したデータをすぐに利用できるというメリットがあります。実際にNDBオープンデータを利用した論文も査読誌に掲載されています。7), 8), 9)
今回は生物学的製剤のうちアクテムラ点滴静注用のみに注目した簡単な分析でした。NDBオープンデータを使えば、他の薬剤での結果や、性年齢別の使用量を調べることもできます。処方薬だけでなく、医科と歯科の診療行為のデータもあり、幅広い利用法が可能です。
関連記事
引用・参考資料
- 厚生労働省, 「NDBオープンデータ」 https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000177182.html
- 中外製薬, 「アクテムラ点滴静注用80mg・200mg・400mg」https://chugai-pharm.jp/product/act/div/
- Google, 「Colaboratory へようこそ」https://colab.research.google.com/notebooks/welcome.ipynb?hl=ja
- 厚生労働省, 「第5回NDBオープンデータ」 https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000177221_00008.html
- e-Stat, 「人口推計 / 各年10月1日現在人口」https://www.e-stat.go.jp/stat-search/files?page=1&layout=datalist&toukei=00200524&tstat=000000090001&cycle=7&year=20180&month=0&tclass1=000001011679
- 松田 晋哉, 藤森 研司, 伏見 清秀, 石川 ベンジャミン 光一, 池田 俊也, 標準化レセプト出現比 (Standardized Claim Ratio: SCR) を用いた我が国の在宅医療の現状分析, 日本ヘルスサポート学会年報, 2017, 3 巻, p. 1-10, 公開日 2018/02/22, Online ISSN 2188-2924, https://doi.org/10.14964/hssanj.3.1
- Naoki Hirose, Miho Ishimaru, Kojiro Morita, Hideo Yasunaga, A review of studies using the Japanese National Database of Health Insurance Claims and Specific Health Checkups, Annals of Clinical Epidemiology, 2020, 2 巻, 1 号, p. 13-26, 公開日 2020/05/14, Online ISSN 2434-4338, https://doi.org/10.37737/ace.2.1_13
- 田中 博之, 持田 有希子, 石井 敏浩, 日本における直接経口抗凝固薬(DOAC)の2014年度 処方状況:日本のレセプト情報・特定健診等情報データベース(NDB)オープンデータを用いた疫学調査, 心臓, 2017, 49 巻, 11 号, p. 1135-1141, 公開日 2019/01/16, Online ISSN 2186-3016, Print ISSN 0586-4488, https://doi.org/10.11281/shinzo.49.1135
- Sugihara T, Yasunaga H, Matsui H, Kamei J, Fujimura T, Kume H. Regional clinical practice variation in urology: Usage example of the Open Data of the National Database of Health Insurance Claims and Specific Health Checkups of Japan. Int J Urol. 2019;26(2):303-305. doi:10.1111/iju.13840