生存分析の概念を直感的に理解できるインタラクティブシミュレーターを無料公開しました
医学研究者や統計学習者のための視覚的教育ツール
EMUYN LLC は、生存分析の複雑な概念を視覚的に学べるウェブアプリケーション「生存分析シミュレーター」を公開しました。このシミュレーターは、医学研究や臨床試験でよく用いられる生存時間解析の基本概念を、インタラクティブな操作を通じて学べる教育ツールです。 サンプルサイズ、打ち切り率、ハザード比、処置群/対照群比率などのパラメータを調整すると、リアルタイムでカプランマイヤー生存曲線や累積ハザード関数がグラフ上に更新され、統計的検定結果も同時表示されます。これにより、パラメータの変化が結果にどのように影響するかを直感的に理解できます。 医学統計における「打ち切りデータ」の扱いや「ハザード比」といった理解が難しい概念も、視覚的な体験を通して自然に習得できる点が特徴です。このツールは、全ての医療者のお役に立つでしょう。
■背景と開発目的
生存分析は、ある事象(疾患からの死亡、機器の故障など)が発生するまでの時間を分析する統計手法です。特に医学研究では、新薬や治療法の効果を評価する際に欠かせないアプローチですが、「打ち切りデータ」の概念や「ハザード比」の解釈など、初学者にとって理解が難しい概念が多く含まれています。
当社が開発した「生存分析シミュレーター」は、これらの概念を視覚的・体験的に学べるよう設計されています。実データを使わなくても、様々なシナリオをシミュレーションできるため、教育現場や自己学習に最適です。
■主な機能
インタラクティブパラメータ調整
- サンプルサイズ
- 打ち切り率
- ハザード比
- 処置群/対照群比率
- 基準ハザード率
- 最大追跡期間
リアルタイムグラフ表示
- カプランマイヤー生存曲線
- 累積ハザード関数
- 95%信頼区間の表示オプション
- 生存時間・生存率の視覚的比較
統計結果の自動計算
- ログランク検定のp値
- ハザード比と95%信頼区間
- 特定生存率における生存時間の比較
- 特定時間における生存率の比較
教育的機能
- 数式を含む生存分析の基本概念を解説
- シミュレーションデータのCSVダウンロード機能
- 自動シミュレーション機能
■活用シーン
医学教育: リアルタイムで様々なシナリオを示しながら、生存分析の概念を説明できます。例えば、サンプルサイズを小さくした場合の信頼区間の広がりや、ハザード比が検定結果に与える影響を視覚的に示せます。
統計学の自己学習: 教科書だけでは理解しづらい概念も、パラメータを変えながら結果の変化を観察することで、直感的な理解が深まります。特に「打ち切り」の概念や「比例ハザード」の意味が視覚的に把握できます。
臨床研究の計画段階: 必要なサンプルサイズや検出力の予備的検討に活用できます。例えば、期待されるハザード比に対して、どの程度のサンプルサイズが必要かを探索的に調査できます。
■技術的特徴
このシミュレーターは、データ生成から統計計算、グラフ描画までをクライアントサイドで完結させることで、快適に動作します。
生存時間データ生成の際には指数分布を用い、実際の臨床試験データに近い特性を持つデータをシミュレートします。また、打ち切りデータも単純なランダム割り当てではなく、競合リスクモデルに基づいて生成するなど、統計学的に妥当なアプローチを採用しています。
■EMUYN 統計シミュレーター
EMUYN LLC では、ブラウザだけで使える無料統計ソフトの Reactive stat を提供しておりますが、その姉妹機能として一連のシミュレーションアプリを提供しています。生存分析シミュレーターはそのうちの一つになります。
Reactive stat
ブラウザとデータファイルがあれば、すぐに解析できます
- マニュアル本は要りません。
- すべての統計手法のページには、利用に必要な解説が載っていますし、必要な情報へのリンクも用意してあります。
- PCにソフトウェアをインストールする必要はありません。
- 信頼性の高い R での結果が得られます。
- ウェブアプリで結果を得たあとに、そのデータを外部の R サーバーに送信し、その実行結果を得ることができます。
- 外部の R サーバーに送信されるデータは、セキュリティを考慮し、数値計算に必要な最小限のセットとしています。また、送信前に内容を確認できます。自動的に送信されることはありません。
- 常に最新バージョンのRを利用できます。
- 結果がリアルタイムに反映されるウェブアプリですので、統計解析に不慣れな場合でも試行錯誤が容易です。
- データの内容を常に把握しながら作業が行えるように工夫してありますので、どうしたらいいかわからない、という状況に陥ることがありません。
- 出力されるグラフはインタラクティブな高機能なものです。
- データファイルを読み込んで利用できます。
- CSV 形式データファイルおよびエクセルファイルに対応
- データファイルはブラウザ内部に読み込まれるだけで外部には送信されませんので、セキュリティの問題はありません。
- 日本語のデータファイルを扱うことができます
- 海外製のアプリですと、カラム名が日本語だと受け付けられないなどの制約がしばしばありますが、Reactive stat にはそのような制限はありません。
共用PCやタブレットでも
ソフトをインストールできない共用のPCや、iPad などタブレットでも実行可能です。
モバイルデバイスの場合は、 Google Drive, One Drive などのクラウドストレージからファイルを直接読み込むことができます。
読み込んだデータファイルの内容がそのままクラウドに送信されることはありませんので、個人情報を含むデータでも安心して解析できます。 共用PCの場合は、ログアウトすればすべて消去されますので安心です。
なお、R での解析やその結果を AI に解説させる機能では、クラウドに最小限のデータを送信しますが、統計解析に必要最小限のデータであり、個人情報が送信されることはなく、また、送信前にその内容を確認する手順になっていますので安心です。
スマートフォンでも
スマートフォンでも使えるように画面設計してあります!
最終的な統計解析を行うことを想定しているわけではなく、統計に不慣れなユーザーに手軽に親しんでいただくことが目的です。 専用のサンプルデータを解析手法ごとに用意していますし、 膨大な数の R のサンプルデータを簡単に検索して読み込めます。 また、できるだけ詳細に解説を付けてありますので、実際にデータを操作しながら統計を学んでいただくことが可能です。
Google Drive や One Drive のデータファイルを読み込めますので、ご自身のデータの解析して論文の原稿を書くこともできてしまいます!
インタラクティブな解析で理解が深まります
Reactive stat の名前の由来は
データの内容を常に確認しながら設定し、設定を変更するとリアルタイムにグラフなどが変化することが名称の由来です。
常にデータ内容を視覚的に把握しつつ解析を行えます
小さなヒストグラムなどで、しつこいほどにデータ内容を視覚的に示します。
統計処理においては、常にそのデータの性質、すなわち、カテゴリー変数なのか連続変数なのか、どのような分布をしているのかなどを把握しておく必要があります。
常にデータ内容を意識しつつ作業できますので、迷うことなく素早く正しい結果に到達できます。
すべての統計手法にデータと設定のサンプルを用意してあります
すべての統計手法のページには、 サンプルデータと設定の呼び出し ボタンが付いています。 これを押すと、典型的なサンプルデータと、そのデータに対する解析のための設定内容が読み込まれます。
その統計手法を初めて扱う場合でも、 どのような形式のデータが必要なのか、どのような形で結果が得られるのか、 サンプルを読み込んで実際に動かすころで理解が深まります。 そして、ご自身のデータをどう処理すればよいかがすぐに分かります。
信頼できる R の解析結果を AI に解説させて容易に理解できます
Reactive stat では、ほとんどの統計解析を R言語 (統計解析を主な目的とする専門的なシステム) を利用して行うことができます。
R は数多くの専門家が参画して作り上げられたシステムで、信頼性が高く、無料で利用できる素晴らしいものですが、なかなか敷居が高いです。 出力された解析結果も、英語で書いてあってわかりにくいです。
それを劇的に使いやすくしてくれたのが EZR ですが、インストールが必要だったり、やはり統計解析の初心者には難しいという声も聞かれます。
そこで、Reactive stat では、ブラウザでの簡単な操作で、インタラクティブに R による解析が行えるようにしてみました。 さらに、その解析結果を、AI に解説してもらう機能が付いています。
AI による解説には、そこで使われている統計手法の説明から、得られた結果の解釈、さらには学会発表や論文にどのように表現すればよいかまで含まれます。
論文や学会発表の準備が簡単になります
医療統計でよく使う統計手法を網羅しています
特に医療分野で頻繁に使われる統計手法を広くサポートし、また、医学論文で必要なグラフの作成が簡単に行えます。 今後、リクエストがあればさらに拡充してゆく計画です。
また、心理統計の領域で使われる手法も今後拡充してゆきます。
最新の R による解析結果が得られ、論文への記載が容易です
- 論文発表や学会発表において、「統計解析はRで行いました」と書くことができます。
- Rは通常、毎年2回 (4月と10月) バージョンアップされます。これらのリリースにはバグ修正などが含まれます。
- 解析ごとに、R 本体および使用されたすべてのライブラリのバージョンを表示します。
- 近年重要視されるようになった効果量の値の計算が多くの統計手法でサポートされています。
- 論文にどのように書けばよいか、AI が教えてくれます。
論文や学会発表で必要なサマリー表がすぐに作成できます
ほとんどの臨床系の論文で必要とされる、症例の背景因子の表が、あっという間に作成できます。 一つ一つの因子を統計解析し、その数値をまとめて表にするのは、意外と手間のかかるのもです。 これを、本当にあっという間に作成してくれます。 ぜひお試しください。
ドラッグ&ドロップで項目を入れ替えたり、統計処理がパラメトリックとノンパラメトリックから選べたり、徹底的に使いやすさを追求しています。 使いこなしていただけると嬉しいです。
p値まで含んだ表が出力されますので、学会発表くらいなら統計処理がこの機能だけで済んでしまう場合もしばしばあります。
本当に「あっという間に」思い通りのサマリー表が作成できてしまいます!
多彩なチャートを簡単に作成できます
多く用いられるチャートを簡単に作成できるよう、チャート作成機能を充実させました。
対象ユーザー
- 統計学には興味は無いが学会発表があるのでちゃちゃっとデータ処理を済ませたい方
- 実際のデータを触りながら統計を学びたい初心者
- 手持ちのデータを探索的に把握したい研究者
などなど、(統計学者以外の) あらゆる方が対象です。
統計結果のグラフは、設定の変更をリアルタイムに反映しますから、その理解が簡単です。 上の例にも示すように、ROC曲線における閾値の変化で、感度や特異度がどう変わるのか、実際にサンプルデータで試してみることで、その原理まで理解が深まります。
また、常にデータの内容を視覚的に示しつつ設定を進めてゆくという基本コンセプトですので、どうしていいかわからない迷子になってしまうことがありません。
Reactive stat により、統計嫌いが少しでも減ることを願っています。 そして、皆様の貴重な研究成果の発表のお手伝いができると嬉しいです。
企業担当者の連絡先を閲覧するには
会員登録を行い、ログインしてください。