ユーザー事例

共同研究が種の生態の理解を深める

キツネザルの行動についての学際的な研究で、保護方針、飼育環境の改善を目指す

バージニア工科大学

課題統計学を学ぶ大学院生には、知識を現場で活用する経験が重要で、他分野の大学院生は、研究に統計を活用するための支援が必要だった。
ソリューション                                                                                                                                                                                                                                                                バージニア工科大学のStatistical Applications and Innovation Group(SAIG)では、大学院レベルの統計研究者と他分野の科学者がタッグを組み、複雑な研究課題に共同で取り組んでいる。また、統計解析をより親しみやすく、インタラクティブなものにするために、SAIGのコンサルタント達はJMP®を活用。
結果バージニア工科大学で統計学と生態学を専攻する博士課程の学生2名が、フィールドワークで得た栄養に関連するデータをJMPで分析。生物学的に意味のある変数を特定し、マダガスカルに生息する野生のキツネザルが土を食べる理由を解明。この研究成果は、絶滅危惧種であるキツネザルの保護活動にとって貴重な情報となっている。

「科学者+統計学者=新たな発見。シンプルで明快な計算式です」そう語るのは、バージニア工科大学の統計学博士課程に在籍するJiangeng Huang氏です。

Huang氏は、同じくバージニア工科大学で魚類・野生生物保護に関する博士課程に在籍しているBrandon Semel氏とともに、過去3年間にわたってマダガスカルに生息する野生のキツネザルの集団が土壌摂食を行う生態的機能の解明を進めてきました。彼らの努力により、生物学的に重要な多くの変数が明らかになり、キツネザルの行動に関する科学者の理解が深まりました。

フィールドワークから堅牢な統計モデリングへ

霊長類は古くから土を食べることが知られており、これは「ジオファジー(土食)」と呼ばれています。しかし、なぜこの行動が進化し、現在どのような目的で行われているのか、科学者はいまだ説明できていないとSemel氏は語っています。これまでの仮説は、栄養学的、地理的、人口統計学的な要因をもとに、寄生虫の駆除からミネラルの補給、毒素の排出促進まで多岐にわたっています。そして、この疑問の解決は、自然保護活動家がキツネザルという種の存続のために何をすればよいか理解する鍵となりえるのです。

「マダガスカルの森林は急速に消失しているため、そこで暮らし、食物を得ている100種以上のキツネザルの多くが、絶滅の危機に瀕しています。キツネザルの摂食行動の特長について詳しく知ることで、残された最良の生息地に保全活動を集中させ、飼育環境下での繁殖プログラムで最良のケアを提供し、さらには森林再生活動の指針を持つこともできます」とSemel氏は言います。

Semel氏が研究している「ダイアデムシファカ」をはじめとするキツネザルは、マダガスカルの固有種です。同氏は毎年、東部の山地林に足を運んではキツネザルの行動を観察し、摂食率、食物の量や種類、それぞれの食物や土を食べる時間などのデータを記録してきました。そして、これらのデータは実験室で、より簡単に調べられるミネラル、脂肪、カロリー、食物繊維、タンパク質などの栄養に関する情報に変換されます。

3年前のある日、マダガスカルからバージニア州ブラックスバーグに戻ったSemel氏は、分析に関わる課題がいくつかのデータにあることに気づきました。データセットが非常に大きく、変数は多重共線性であり、欠測値は多いというものです。Semel氏は、調査結果の質と精度を高めるために、バージニア工科大学統計学科が運営するSAIG(Statistical Application and Innovation Group)に協力を求めることにしました。

写真提供:Brandon Semel氏

応用的な経験と科学の進展を、大学主導で導く

SAIGは、大学のさまざまな分野の研究者に統計学的コンサルティング、コラボレーション、サポートを提供し、「科学者+統計学者=発見」の公式を体現しています。このグループの目的は、研究者がより堅牢な実験を計画し、データのモデリングと分析のスキルを磨くのを支え、彼らが新たに習得した統計的スキルを将来の研究に活かせるように、必要なソフトウェアの使い方を教えることです。その代わり、統計学を専攻する大学院生は、自分の専門知識を実社会のシナリオに適用する機会を得られるため、業界でのキャリアアップを目指す新卒者にとっては貴重な経験となります。

バージニア工科大学で研究を開始し、SAIGに参加して以来、Jiangeng Huang氏は、林業や土木工学などのさまざまな分野の研究者と一緒に60を超えるプロジェクトに取り組んできました。いくつかは短期のプロジェクトでした。一方でSemel氏との仕事など、長期間にわたるものもあります。「私たちは、同僚の研究状況を聞き取り、その問題を解決するために最も適切なアルゴリズムを考えます。すなわち、釣りに例えると、魚そのものを与えるのではなく、釣り方を教えることで、あとは自分で釣れるようになるのと同じです」とHuang氏は語ります。

Semel氏がSAIGに現れたとき、同氏は統計については限られた知識しかありませんでした。たとえば、線形モデルについて知ってはいたものの、それをどう応用するかについてはよく知りませんでした。一方、Huang氏はキツネザルについては何も知りませんでした。その状況はすぐに変化し、2人は今や信頼できる同僚であると同時に、良き友人にもなりました。コラボレーションすることで、強力なタッグが誕生したのです。

「SAIGの人たちと私は、お互いの専門分野の話をしても嚙みあわず、理解しあうのは難しいのではないかと少し心配していました。抱えていた問題に対する多くの統計的アプローチを検討しましたが、私の問題には手助けが必要だと感じました」と、Semel氏は振り返ります。

JMP®で統計がより身近に

研究の目的と条件を理解するためにSemel氏と面談した後、Huang氏はデータの調査を開始しました。そして、彼らは議論を重ねアプローチの仕方を決めました。その結果、一連の正則化による線形モデルを構築し、1つのステップで重要な機能を選択してその効果を推定できるようにしました。また、Lasso回帰とリッジ回帰を弾性ネットと組み合わせることで、多重共線性の問題を解決することも可能になり、これらのモデルの構築にJMPを使用しました。

「JMPの好きな点は、とてもインタラクティブなところです。また、非常にユーザーフレンドリーで、多くのツールが用意されています」とHuang氏は言います。また、JMPではプログラミングの必要がないため、フィールドワークに時間を割きたいSemel氏のような研究者にとって、統計手法をより身近なものにしてくれると同氏は述べています。

「他分野の研究者でも、プログラミングスキルや統計学の知識のレベルはまちまちです。現在進行中の研究プロジェクトの多くは学際的な性質を持っており、特定分野の専門家と統計学の専門家の両方からの効果的な協力が必要です」とHuang氏は言います。

そして、JMPはこのプロセスを容易にします。「特に初期の探索的な段階では、いろいろな手法を試して、どの手法が取り組んでいる問題に最適かを検討することがよくあります。複数の研究やコンサルティングのプロジェクトを同時に進めているときに、試したいと思う手法すべてについて、10時間以上かけてゼロからプログラミングすることはできません」とHuang氏。

このような背景から、SAIGは研究者に基本的な知識を身に付けてもらうだけでなく、JMPの使い方を教えることも目的としています。「JMPにはさまざまなオプションが用意されているので、他のツールはもはや不要です。また、JMPは研究者のデータ分析をとても簡単にしてくれます。それがJMPの本当に素晴らしいところだと思います」とHuang氏は言います。


「キツネザルの摂食行動の特長について詳しく知ることで、残された最良の生息地に保全活動を集中させ、飼育環境下での繁殖プログラムで最良のケアを提供し、森林再生活動の指針を持つこともできます」とSemel氏。


Semel氏は毎年、マダガスカル東部の山地林に足を運んでは、キツネザルの行動を観察し、摂食率、食物の量や種類、それぞれの食物や土を食べる時間などのデータを記録してきました。

 

 

写真提供:Brandon Semel氏

一般化線形モデルがゼロ過剰の課題を解決

Semel氏の持つデータセットは特に複雑です。というのも、キツネザルが土以外の物を食べた場合にはゼロの値が記録されますが、すべてのキツネザルが土を食べるわけではないので、データセットの半分がゼロになる可能性があるのです。

「このデータセットは、応答変数の構造に特殊です。これをゼロ過剰と呼んでいます。応答変数を見ると、ゼロが多いカウントデータがあります。これは非正規のデータセットですが、JMPではリンク関数を使って一般化線形モデルに拡張することで対応しました。また、リンク関数を工夫する必要がありますが、今回はゼロ過剰なポアソン分布モデルが有効であることがわかりました」とHuang氏は言います。

「非正規」のデータセットは、教育を受けた統計学者であっても扱うのは困難です。しかし、今回と同様のことが、Semel氏の今後のキャリアで再び発生することを知っていたHuang氏は、Semel氏と協力して、JMPで簡単に再現可能かつ適応可能で標準的方法を開発しました。「自分でできますよ。JMPなら可能です」とSemel氏に伝えたことを、Huang氏は覚えています。

未来に向けた経験

「コラボレーションを行うことが、私たちのプログラムの強みだと思います。統計学は非常に学際的です。統計手法が実際の問題にどのように適用されるかを、SAIGは私たち統計学者に見せてくれます。アルゴリズムを実際どのように使うのかについて、今は習熟していたとしても、現実の問題にそれを適用していかなければスキルが錆びついてしまうかもしれません」とHuang氏はSAIGについて語っています。

すべてはコラボレーションのパラダイムに帰結すると同氏は言います。「研究を進めるだけでなく、その過程で学んでもいるのです。統計と関係ない仕事に移ったときに応用できるスキルを身につけることができます。そして、もちろん研究自体も興味深いものです。一緒に協力すれば、解決策が得られます」とHuang氏。

Semel氏は、キツネザルの土食に関する研究を進める一方で、気候変動によってキツネザルの個体数がどのような影響を受けるかを調査しています。「森林の種類によっては、他の森林よりも多くのキツネザルが生息できることがわかっています」と、同氏は言います。

「気候変動がすでに世界中の森林の種類に変化をもたらしていることもわかっています。さまざまな種類の森林におけるキツネザルの食生活や個体数を調査することで、現在の保護区域の広さや多岐にわたる気候変動のシナリオに基づいた将来のキツネザルの生息数を予測したいと考えています。そのモデル化のためにこれからもSAIGに足を運びます」とHuang氏。

そして、Huang氏は次のように締めくくりました。「私たちは皆、異なる才能を持っています。だからこそ、共同研究が必要だと考えています。私が統計学を選んだのは、他分野の多くの人とコラボレーションできるからなのです」

The results illustrated in this article are specific to the particular situations, business models, data input and computing environments described herein. Each SAS customer’s experience is unique, based on business and technical variables, and all statements must be considered nontypical. Actual savings, results and performance characteristics will vary depending on individual customer configurations and conditions. SAS does not guarantee or represent that every customer will achieve similar results. The only warranties for SAS products and services are those that are set forth in the express warranty statements in the written agreement for such products and services. Nothing herein should be construed as constituting an additional warranty. Customers have shared their successes with SAS as part of an agreed-upon contractual exchange or project success summarization following a successful implementation of SAS software.

Back to Top