ユーザー事例

ビッグデータでサンゴ礁の保護に挑む

気候変動によりサンゴ礁の白化現象が地球規模で進行するなか、海洋生物学者は予測モデルを用いて保護活動の優先順位を決定。

Khaled bin Sultan Living Oceans Foundation

課題急速に気候変動が進み、サンゴ礁の存続が世界的に危惧されている。時間との戦いのなか、科学者たちはサンゴ礁の保護活動のあるべき姿を模索し、さらなる劣化や白化を防ぐための活動を繰り広げている。
ソリューション                                                                                                     研究における統計分析のレベル向上が、サンゴ礁に関するデータから、より意義深い結論を導き出すきっかけに。JMP®を活用すれば、統計の専門家でなくても、堅牢な統計モデルを活用可能。
結果科学者たちは、コラボレーションの強化やデータの透明性を高めることで、将来のサンゴ礁保護活動を最も効果的に推進する新たなアプローチを見出しつつある。

サンゴ礁は地球上の海の面積の2%未満にすぎませんが、海洋の健全性に重要な役割を果たしており、また、地球上で最も多様な生態系のひとつでもあります。そこは数多くの海洋生物が生息する場であるだけでなく、漁業を支え、観光を促進し、海岸線の浸食を防ぐなど、地域経済にも大きく貢献しています。実際、サンゴ礁が経済に与える影響は、毎年数十億ドルにのぼると試算されています。

このようにサンゴ礁は、環境的にも経済的にも非常に重要な役割を果たしており、その保護は世界的な優先事項であるはずにもかかわらず、現実には世界中のサンゴ礁は劣化し続けています。

特に気候変動はサンゴ礁の劣化を加速させており、科学者たちは気候変動や人間の活動が原因で、過去40年間に世界のサンゴ礁の半分以上が失われたと推定しています。

サンゴ礁の白化やそれに続く死滅の原因については、科学者に広く理解されていますが、サンゴ礁のうちで最も危機に面しているもの、最も回復力があるもの、優先的に保護すべきもの等を具体的に予測することは、この分野における最も重要な課題であり続けています。

Khaled bin Sultan Living Oceans Foundationのような組織は、これらの疑問に対する答えを探求しており、また、世界中の海洋科学者たちは、サンゴ礁の研究、保護活動、修復活動に精力を注いでいます。

Anderson Mayfield博士は、手遅れになる前に環境変化によるサンゴ礁の破壊状況や原因を理解し被害を軽減するには、より厳密で統計的なアプローチを推進する必要があると主張しています。博士は財団や他の研究者の支援に支えられながら、サンゴの生理学の研究にキャリアを捧げてきました。

時間との戦いの分野で、統計的アプローチが研究を加速

海洋生物学の分野では、多くの研究対象が海面下にあるせいで、可視化が容易ではありません。そのため、科学者たちが最初に取り組むべきことは、サンゴ礁がどこにどれだけあるのか、どれだけ健康なのかを把握し、サンゴ礁が直面するリスク要因を、観察し理解することです。

そして、このサンゴ礁という脆弱な生態系が、海水温度や酸性度の上昇といった気候変動関連要因によって、どのような影響を受けるかを理解するには、時間をかけてサンゴ礁の健康状態の変化を記録することが最も重要です。

しかし、世界中のサンゴ礁生態系が直面している脅威が喫緊の問題であることを考えると、海洋科学、特に海洋保護活動について、もっと積極的に取り組む必要があると、マイアミにある米国海洋大気庁大西洋海洋気象研究所のアシスタント・サイエンティストであるMayfield博士は考えています。

そのため、博士と共同研究者たちは、統計的なアプローチの必要性を訴えています。予測モデルを使えば、環境ストレスの影響を受けやすいサンゴ礁や、回復力に最も優れているサンゴ礁を判別できるため、それを元に環境保護に資金を提供する機関は、対象となる保護活動に優先順位をつけられると博士は述べています。

サンゴのポリプの健全性は、その組織内に生息する微細な藻類との内部共生関係に依存しています。これらの藻類は、サンゴの色の由来となるばかりか、サンゴの主な食料源にもなっています。しかし、水温が上昇するとこの共生関係にストレスがかかって藻類が退散し始め、サンゴが白くなったり、「白化」と呼ばれる栄養失調状態に陥ったりします。

「一部のサンゴはどうやっても白化するでしょう。しかし、局所的にでも状況が改善できれば、生存できる可能性が高くなるサンゴ礁もあります」とMayfield博士は説明します。

どのサンゴ礁を優先的に保護すべきか判断するのは困難ですが、台湾南部のサンゴ礁のように、環境圧の増加があるにもかかわらず高い回復力を示しているものもあります。「このサンゴ礁は優先的に保護・研究すべき候補と言えます。なぜこれほどの回復力を持っているのか解明する必要があるからです」と博士は言います。

カギとなる生存要因を特定できれば、Mayfield博士のような研究者は、どのサンゴ礁がストレスを受けやすいか、より正確に予測し、他の場所で起こる将来の白化現象を阻止できるかもしれません。


インドネシア、マルク州、バンダ諸島の活火山の麓にある健康なサンゴ

統計を武器に、科学的根拠に基づく結論を導く

Mayfield博士は、それまで実験室の水槽で育てたサンゴを使った実験結果を信頼していました。しかし、自然の種の変化を説明するには、それでは統計的に十分ではなかったため、自分で統計モデルを構築しました。

「ビッグデータ」を用いた統計モデルでは、個人の科学者が蓄積したデータより内容が豊かで、地理的にも広範な世界規模のデータ調査(博士も参加し、最近完了したLiving Oceans Foundationの「Global Reef Expedition」で実施された調査など)の結果を活用できます。

たとえば、Platax (2018年)とJournal of Sea Research(2019年)に掲載された最近の論文では、Mayfield博士と共著者たちが、フィジーのラウ諸島と南太平洋の深部(仏領ポリネシアのオーストラル諸島とクック諸島)の、それぞれ研究が進んでいない地域のデータセットを、一変量分析法と多変量分析法を組み合わせて調査したことについて言及されています。

さらに、彼らはサンゴの生理機能に影響を与えると考えられる12の環境要因(温度、サンゴ礁の構造、魚類のバイオマスなど)を調査しました。そして、ステップワイズ回帰とPLS回帰による最適モデルのあてはめによって、生理学的反応の変化の大部分を説明するには、日常的に評価されている環境パラメータのサブセットのみが必要であることが分かりました。

今回の研究では、いくつかのモデルの予測能力はそれほど高くないことが判明しましたが、Mayfield博士は、この方法は概念実証であり、過去に収集したデータを使って海洋生物の健康状態の予測を試みることに価値があると考えています。


「サンゴ礁の問題の対処に必要なデータはすでに揃っているかもしれませんが、正しい方法で分析できていないのです」

– Anderson Mayfield博士
米国海洋大気庁のアシスタント・サイエンティスト

JMP PublicでMayfield博士によって可視化されたさまざまなグラフをご覧いただけます。

グラフ電卓からJMP®

Mayfield博士が、まずデューク大学、次にハワイ大学マノア校で海洋生物学を学び始めた頃は、現在のように積極的に統計的手法の採用を提唱していませんでした。

その頃、博士はまだ本格的に多変量解析を学んでおらず、初期の実験室での水槽実験は変数がほとんど分かっていて、厳密に制御されていました。そのため、必要な分析はグラフ電卓でできるもの(一元配置分散分析など)に限られていたと博士は冗談めかして語っています。

Mayfield博士は、電卓やエクセルなどのツールを以前は頼っていましたが、研究でフィールドワーク中心のプロジェクトが増え、より高水準の統計学的精緻さが必要になったため、ツールをより高度なものに変更する必要がありました。ちょうどその頃、博士はJMPを使い始めました。そして、今では、それは手放せないものになっています。

「最初はJMPを使って、分布を見たり、t検定、ANOVA、線形回帰などの簡単な比較分析をしたりしていました。おそらくJMPの全機能の5%以下しか利用していませんでした」と、博士は振り返ります。しかし、最終的に博士は残りの95%も活用しようと決めました。この決断により、データ分析の方法だけでなく、データ収集の方法も変わったと博士は考えています。

「サンゴ礁に調査に出かけている間も、JMPの表や図を見ながら、どうすればサンプルから最大限の情報を得られるかを考えています」とMayfield博士。博士はJMPの統計機能を使えるようになったことで、水中でどこに注目し、どのサンプルを採取すべきかを戦略的に判断できるようになったと言います。「これらは、あらかじめJMPで検定できます」と博士。

さらにJMPでは、「同じ量のデータでも、得られる情報量は指数関数的に増えています」と博士は太鼓判を押します。組織内で統計データを処理することで、外部の統計資料に頼らず済むようになり、そのおかげで研究プロセスに多くの時間を割けるようになりました。

サンゴ礁の白化という危機が高まっていることを考えると、時間は非常に貴重であり、無駄にはできないのです。「何年もかけてデータの分析方法を考えている余裕はありません」と博士は言います。


2015年夏、インド洋に浮かぶチャゴス諸島のペロス・バンホス地域でサンゴ礁の大量白化現象が発生

「このようなアイデアを実際にサンゴ礁の研究に使えるとは思いもしませんでした」

JMPでモデリングスキルを深めることで、データセットを創造的に扱い、隠れていた情報を引き出す統計的アプローチを考案する力が得られたとMayfield博士は述べています。

アイデアを得るため、博士は他の企業や機関が大規模なデータセットをどのように扱っているかを調べています。他の分野のアナリストは、行動データを使って、たとえば買い物の好みやメンテナンスが必要な時期などを予測するアルゴリズムを開発しています。

なぜ同じ原則をサンゴ礁の生態とその生存に適用できなかったのでしょう?

「サンゴが死ぬかどうかを100%確実に予測することはできないかもしれませんが、過去のサンゴの生態について十分なデータがあれば、そのデータに基づいて、海水温度が1度上昇するとサンゴの成長が30%変化するなどと言えるようになるかもしれません」とMayfield博士は推論しています。

博士と彼の共同研究者たちは、Living Oceans FoundationのGlobal Reef Expeditionの一環として行われた世界規模のデータ調査の結果を利用することで、現象の説明のみならず、将来起こる事象の予測までできる可能性があります。

「JMPで何ができるか分かるようになった今、このような課題を探求していきたいと思います」とMayfield博士は語っています。

一方で博士は、Galit Shmueli博士の先駆的な研究(2011)で示された「あるデータセットが過去の観察結果を説明するのに優れているからといって、そのデータセットが必ずしも対象となる動物の将来の行動を予測できることを意味するわけではない」という言葉も否定していません。これは、過去の結果から未来の予測がまったくできないということではなく、この両者の関係を実地に検証しなければならないということを意味しています。

まだ始まったばかりではありますが、Mayfield博士は、ビッグデータがサンゴ礁の生理学分野の研究にもたらす可能性を探りたいと考えています。たとえば、膨大なフィールドデータを使って、JMPで作成した新しいモデルの精度を予測することなどです。

「モデルは実際に試すまで、それが機能するかどうかわかりません」と、博士は言います。ですが、幸いなことに、JMPにはこのタイプのモデル精度テストをサポートするプラットフォームが組み込まれています。

モデルを作成すると、JMPはそれが各サンプルで機能するかどうかを明らかにします。「JMPの予測モデルに関するプラットフォームは、すでに必要なものがすべて整っており、あとはデータを入力するだけです」と博士。

Mayfield博士は、JMPのモデリング機能だけでなく、ニューラルネットワークや外れ値分析のためのプラットフォームも活用しています。外れ値分析については、異常な行動が認められるサンゴのデータ(外れ値)を無視すべきではなく、他と異なる行動をする個体が、実はデータセットの中で最もストレス耐性があり、生理学者にとって最も興味深い対象である場合が多いと博士は主張しています。

つまり、すべての生体検査を行うには資金が不足している場合が多いという現実的な制約下でも、Mayfield博士はJMPを活用することで、優先的に分析すべきサンゴ生体検査を特定できるのです。


インドネシア・スラウェシ島マカッサル沖のミドリイシサンゴ


インドネシア、西パプア州のラジャ・アンパット沖のミドリイシサンゴ


インドネシア、ヌサ・テンガラのコモド国立公園沖のミドリイシサンゴ

データの透明性が研究を加速

膨大な量のデータが、分析する時間も統計学の知識もない研究者によって使われずに放置されていることをMayfield博士は残念に感じています。

また、論文を発表することへのプレッシャーや科学者間の競争の激しさから、ほとんどの研究者が自分のデータ(出版物で、すでに使用したデータも含む)を共有することに消極的です。

しかし、サンゴ礁の白化現象のように一刻を争う問題では、データの共有が科学の進歩を促し、最も効果的な保護戦略を決定するための重要な要素となります。「特に私たちの分野では、科学者はデータをどのように分析しているかをもっとオープンにして、それを公開するよう努力すべきだと思います。パソコンに向かっているだけでは何の役にも立ちません」と博士。

この点、Mayfield博士は率先して行動を起こしています。 JMPのリアルタイムのデータ分析を可能にするインタラクティブなHTML機能など、自身の研究の透明性を高めるツールを活用しています。

「JMPを使うことで、多くのアイデアが浮かんできました。たとえば、データをもっとインタラクティブにする方法や、単に可視化するだけでなく、どのように分析したかという思考プロセスを人々に示す方法などです」と博士は説明します。

Mayfield博士は、自身のウェブサイト(coralreefdiagnostics.com)にデータセットを掲載するだけでなく、JMPでダイナミックに可視化されたデータを多くの人と共有する手段としてJMP Publicを使用しています。

JMPのデータフィルタ機能によって、博士の共同研究者を含むさまざまな人々が、データセット内の特定の特性を示すサンゴ礁を「見つける」ことができると博士は言います。

たとえば、蛍光タンパク質を過剰発現していたフィジーの白化サンゴなどです。JMP Publicのこの機能は、共同研究者が、アーカイブ化された生検試料や標本採取されたサンゴのコロニーのGPS座標など、より詳細に分析したいサンプルを素早く特定するのに役立ちます。

> >フィジーのサンゴ礁関連データの主成分分析をJMP Publicで確認 

「統計に関する説明を1時間もされれば、ほとんどの人は寝てしまうでしょう。しかし、データテーブルから図に至るまでの過程を見てもらうだけで、彼らはあなたのデータに納得するはずです」とMayfield博士は述べます。

博士は、自らの研究の詳細を積極的に公開し、その手法の再現性を高めることで、他の研究者が後に続くことを期待しており、サンゴ礁の減少に対する具体的な解決策を共に見つけていければと考えています。

「サンゴ礁の問題の対処に必要なデータは、すでに揃っているのかもしれません。ただ、正しい方法で分析できていないだけなのです」とMayfield博士は言います。そして、JMPはそれを可能にします。

今やMayfield博士の研究を妨げるものは何もありません。

参考文献

Mayfield AB, Dempsey AC, Inamdar J, Chen CS (2018), A statistical platform for assessing coral health in an era of changing global climate-I: A case study from Fiji’s Lau Archipelago.Platax 15, 1-35.

Mayfield AB, Chen CS, Dempsey AC (2019), Modeling environmentally mediated variation in reef coral physiology. Journal of Sea Research 145, 44-54.

Shmueli G (2011), To explain or to predict?Statistical Science 25(3), 289-310.

The results illustrated in this article are specific to the particular situations, business models, data input and computing environments described herein. Each SAS customer’s experience is unique, based on business and technical variables, and all statements must be considered nontypical. Actual savings, results and performance characteristics will vary depending on individual customer configurations and conditions. SAS does not guarantee or represent that every customer will achieve similar results. The only warranties for SAS products and services are those that are set forth in the express warranty statements in the written agreement for such products and services. Nothing herein should be construed as constituting an additional warranty. Customers have shared their successes with SAS as part of an agreed-upon contractual exchange or project success summarization following a successful implementation of SAS software.

Back to Top