こんにちは。TATです。
今日のテーマは「国会の議事録データを収集して岸田首相の「検討」の発言回数を集計してみた」です。
岸田首相の代名詞といえば、「検討」です。
「緊張感を持って検討する」とか「検討を加速する」とか数々の名言を生み出しています。
巷では検討使なんて呼ばれたりもしています。
国民民主党代表の玉木雄一郎さんが国会で指摘していて話題になったりしましたね。
本日の予算委員会で、岸田総理があまりに検討するとばかり言うので、「検討使」と呼ばれてるんですよ!と指摘したら、質問後、衆議院の記録部から「ケントウシ」とおっしゃたのは、どんな漢字を当てればいいのですか?と問い合わせが来たので、「検討使」です!と答えておきました。議事録に載ります。 pic.twitter.com/bxBejOe7wQ
— 玉木雄一郎(国民民主党代表) (@tamakiyuichiro) May 27, 2022
本記事では、岸田首相が一体どれくらいの頻度で「検討」という言葉を使っているのかを検証してみます。
国会の議事録データを収集して、首相に就任してから現在に至るまでの「検討」発言回数を集計していきます。
実にくだらない内容ですw マジでPythonの無駄使い。。。
目次
国会の議事録データをスクレイピングで収集する
まずはデータの準備です。
国会の議事録データをPythonでスクレイピングして収集します。
詳細についてはこちらの記事で紹介しているので、ここではサクッと進めます。
国会会議録検索システムから収集します
国会の議事録データについては、国会会議録検索システムで全て公開されています。
会議名とか発言者名とか、肩書き名とか、色々な条件検索することができます。
ここでは発言者名を岸田文雄、肩書き名を内閣総理大臣に設定すれば一覧のデータが取得できます。
このプログラムを走らせたのは2022年11月14日の早朝です。
その時点では、2022年10月28日までのデータがありました。
該当会議数は83個です。
収集データを確認する
利用したPythonコードはこちらの記事で紹介しているものと全く同じです。
これを利用して収集したデータがこちらになります。
元々は、title, url, textの3つのカラムのみでしたが、titleカラムから必要なデータを抽出して、議院、会議名、日付、発言者名というカラムを追加しています。
ここから発言者名を岸田首相で絞ればデータが完成します。
ちなみに発言者名を見ると、2通りの書き方がありました。
ここはきちんと統一してほしいですね。
Pythonで国会会議録検索システムをスクレイピングする方法についてはこちらの記事で解説しているので、ご興味あれば合わせてご覧ください。
【Pythonコード解説】Seleniumで国会会議録検索システムをスクレイピングしてみる
続きを見る
「検討」の発言回数を数える
用意したデータの最後の仕上げです。
「検討」の発言回数を数えます。
これはcountを使えば一瞬です。
思わず目を疑いましたが、直近の発言では「検討」と発言してないですねw
とりあえずこれでデータの準備は完了です。
岸田首相の「検討」発言回数を集計してみる
それではここからが本題です。
岸田首相の「検討」発言回数を集計していきます。
色々な条件で集計していきましょう。
期間別の集計
まずは期間別にみていきます。
全体期間
全体期間の「検討」発言回数をみてみます。
合計920回でした。量産してますね。
全体で83個の会議がありましたので、1回あたりの平均「検討」発言回数は約11回になります。
さすがです。
ちなみに、岸田首相に限定せずに、該当会議の全発言者による合計「検討」発言回数は2,838回でした。
したがって、ざっくり、全体の約32%の「検討」が岸田首相1人で発言されていることになります。
月別の推移
次に月別の推移を見てみます。
「年月」というカラムを新たに作成して、棒グラフで示してみました。
1月あたりの平均は92回でした。
土日も含めると、1日あたり3回「検討」と発言している計算になりますねw
会議別の集計
次に会議別に集計しています。
データは発言単位で行が分かれているので、会議別で見るためには少し集計作業が必要です。
箱ひげ図にしてみる
最初に、会議ごとの「検討」発言回数を集計して箱ひげ図にしてみました。
最大で1回の会議の中で35回「検討」と発言してますね。
0回の時もあります。
統計値を確認する
次に統計値を見てみます。
1会議あたりの平均「検討」発言回数は約11回です。
月別の推移
次に月別の推移も見てみましょう。
まずは、1会議当たりの平均「検討」発言回数の推移を見てみます。
月別に見ると、1会議当たりの「検討」発言回数にばらつきが見られますね。
2022年の6月と9月はやたら少ない。。。
ちょっと見方を変えて、会議数と発言数の2軸でも見てみます。
2022年の6月と9月を見ると、会議数そのものの数も少ないですね。
検討する機会自体が少なかったのでしょうか。
もしや、玉木さんの発言影響してる?
ここで余談ですが、冒頭でご紹介した国民民主党代表の玉木雄一郎氏による「検討使」発言について、こちらの発言があったのは2022年5月の後半なんですね。
そして6月になってこの減り方。。。会議数そのものも少ないですが、この減り方はすごいですよね。
もしかしたら玉木さんん発言を気にかけてるのだろうかとふと思いましたが、ここは確かめようがないのでなんとも言えません。
ただの余談でした。
議院別の集計
最後に、議院別に集計していきます。
これは衆議院と参議院の2つしかありません。
これら2つで比較してみます。
全体の「検討」発言回数
まずは全期間における「検討」発言回数を議院別に集計してみます。
あまり大差はないですね。
議院別の会議当たりの「検討」発言回数
次に会議当たりの「検討」発言回数と議院別に集計してみます。
箱ひげ図にしてみました。
全体的に衆議院の方が「検討」の発言回数が多いように思います。
ただ数値で見てみると、大きな差は見られませんでした。
月別の推移
最後に、先ほどと同様に、月別の推移で見てみます。
月によって差があります。これは月によって議院別の会議数の差の影響が大きいように思います。
会議数の推移と一致しています。
データの分析・可視化にはPythonが最適!
本記事で紹介したコードは、全てPythonを使って書いています。
Pythonを使えば、スクレイピングなどによるデータの収集からデータ整形、さらにデータの分析からデータの可視化まで、一連の作業を簡単に実装することができます。
データ分析の他にも、PythonはAI関連のライブラリーも豊富で、昨今のAIブームで需要が急拡大しています。
→ 【いますぐ始められます】データ分析をするならPythonが最適です。
また、Pythonは比較的学びやすい言語でもあります。
実際、僕は社会人になってからPythonを独学で習得して転職にも成功し、Python独学をきっかけに人生が大きく変わりました。
→ 【実体験】ゼロからのPython独学を決意してから転職を掴み取るまでのお話。
Pythonの学習方法についてはいろいろな方法があります。
僕はUdemyを選びましたが、書籍やプログラミングスクールも選択肢になります。
→ 【決定版】Python独学ロードマップ【完全初心者からでもOKです】
→ 【まとめ】Pythonが学べるおすすめプログラミングスクール
→ プログラミングの独学にUdemyをおすすめする理由!【僕はUdemyでPythonを独学しました!】
まとめ
本記事では、「国会の議事録データを収集して岸田首相の「検討」の発言回数を集計してみた」というテーマでお話しました。
Pythonで国会の発言データをスクレイピングして収集して、データを整形して集計して可視化してみました。
検討使の名に恥じない、素晴らしい頻度で「検討」を発言していることがデータからもよくわかりました。
就任開始から10月28日までのデータから、「検討」を発言した回数は全部で920回でした。
該当する会議数は83個だったので、1会議当たりざっくり11回「検討」と発言している計算になります。
さらに、発言者全体の3割以上を岸田首相1人で発言していました。
さすがの頻度でした。
ただ、これは記事ネタとしてはとても面白いのですが、首相としては非常に残念というか、もっと頑張ってほしいところです。
必要なことは「検討」ではなくて、「決断」ですからね。。。
ちょっと久しぶりにこういうふざけた企画をやったら楽しすぎたので、今後もこういう企画は積極的にやっていこうと思います。
ここまで読んでくださり、ありがとうございました。