『DS探究ゼミ』を担当する林先生(写真左)と、【統計データ分析コンペティション2023】で受賞した高2生たち。
創立以来受け継がれる「やってみなはれ」というチャレンジ精神のもと、人生を切り拓く勇気と実行力を備えた“自立型人間”の育成を目指す雲雀丘学園。その実践において重要な位置づけにあるのが、多彩な探究学習です。正課の授業『探究総合』に加え、希望制の課外活動として、大学や企業と連携する『探究プロジェクト』、有志の教員による『探究ゼミ』を展開。興味のある分野を主体的に追求できる場が用意されています。
今回注目するのは『探究ゼミ』の一つで、注目の学問“データサイエンス”を扱う『DS 探究ゼミ』。“データサイエンス”は、データ収集・分析により有益な知見の獲得、新たな価値の創造につなげることを目的として、社会やビジネスの課題解決・発展に貢献するものとして期待されています。『DS 探究ゼミ』の生徒たちはさまざまなコンテストで受賞を果たしており、今回、高2生3人のグループが、総務省や独立行政法人統計センターなどの共催による【統計データ分析コンペティション2023 高校生の部】で、全国3位にあたる統計数理賞に輝きました。
研究テーマは[地価に関する最適モデルの構築と手法提案]。「地価の変動」への興味を出発点に調べていくなかで3人は、「地価=その土地の魅力を総合的に算出した値と捉えると、地価を高める努力をすることが、その土地の魅力を高めることにつながるのではないか」と考えたそうです。そこで、「都市部への人口集中や過疎地域の解決」に貢献することを目指し、あらゆるデータをもとに地価が高い地域の共通点を推定して、過疎化する地方の魅力を高める要因の発見を目標に掲げました。
苦労したポイントは大きく三つあり、まずは3カ月以上を要した“データ収集”。調査対象となった40の道府県庁所在地について、地価のほかに、出生数・各年齢層の人口・従業者と通学者人口・学校数など、地価に影響しそうな約50項目のデータを集めたそうです。
さらに“因子分析”と呼ばれる手法で、増減パターンが似た項目を統合する工程。たとえば、学校数が増えれば教員数も増えるため、この2項目は一つにまとめます。結果、人口因子・非労働人口因子・離婚因子など六つの因子に絞られました。
そして“モデル構築”。地価と因子によって構成されるモデル式を作り上げます。たとえばターゲットの一つである2005年のモデル式を見てみましょう。
つまり、人口・非労働人口・離婚の3因子が地価に影響したということです。同様に2010年、2015年についても、どの因子が、どれだけ地価に影響しているかを導き出すことに成功しました。
「データサイエンスにおいて最も重要なのは、データ収集での“根気”です。必要なデータを見極め、条件をそろえて収集し、整理・整形するという人工知能ではなく人にしかできない部分が、データサイエンティストには求められます。そして“モデル構築”は、宝探しのようなもの。因子の組み合わせを考えるにも根気が不可欠ですから、試行錯誤を重ねた日々が結果につながっていると感じます」(DS 探究ゼミ担当/情報科・林宏樹先生)
生徒たちにも感想を聞いたところ、次のように答えてくれました。
「『探究ゼミ』への参加をきっかけに、大学では統計学と経済学を使った研究がしたいと考えていました。今回の経験で“研究”というものを具体的にイメージできるようになり面白さを実感することができました」 (Kさん)
「離婚因子が影響していたのは、2005年までで、それ以降はあまり影響していません。私たちはその理由を、共働き世帯が増加したことで夫婦ともに経済的に自立できているので、離婚しても職場がある都市にそのまま住み続けるケースが増えて、離婚がその都市の地価の低下に影響しなくなったのではないかと考察しました。時代の変化まで反映される地価に、無限の可能性を感じています。興味の幅が広がり、進路の選択肢も増えました」 (Tさん)
「データを鵜呑みにするのではなく、それが正しいデータなのかを考えたり、その裏にある意図を察知したりできるようになりました。研究で身につけたデータ分析手法や批判的思考を、大学や社会でも活かしていきたいです」(O さん)
それぞれにとって、将来につながるかけがえのない経験となったようです。
「人から与えられた情報について自ら精査し、ジャッジし、行動を選択できる人になってほしいですね。AIも使わず嫌いではなく、上手く活用できるような。今回の3人も、新しく学んだことを自分のものにしようとする意欲、自分らしく活かしていこうとするその姿勢を、忘れずに持ち続けてほしいと思います」 (林先生)