ブラウザだけで使える無料統計ソフト Reactive stat で 一般化推定方程式(GEE)機能を実装しました
柔軟な経時データ解析を実現 ・臨床研究のための新たな統計解析手法を提供開始しました。臨床試験や疫学研究に最適な経時データの解析が直感的なUIで可能です。
Reactive stat では、一般化推定方程式(GEE)による解析機能を新たに実装しました。 同一被験者からの複数回測定データに対応し、測定値間の相関構造を柔軟にモデル化できます。 直感的なインターフェースで複雑な統計モデルを簡単に構築でき、臨床試験や疫学研究における経時データの解析を強力にサポートします。 実際には、クラウドの R を呼び出して統計解析を実施します。 多様なデータ分布や欠損値にも対応し、研究者の解析ニーズに応える機能を提供いたします。
一般化推定方程式 (Generalized Estimating Equations, GEE) は、同じ対象から複数回データを取得する場合に使用する統計手法です。 例えば、同じ患者の血圧を治療前後で複数回測定する場合などに適しています。
通常の統計手法は、全てのデータが互いに独立していることを前提としますが、同じ人から取得したデータには関連性があります。 GEEは、このような関連性を考慮しながら分析を行うことができます。
比較的新しい統計手法ですが、実験デザインやデータの性質に応じて、相関構造を使ってデータの変動をより適切にモデル化できるため、幅広い分野で応用されつつあります。
GEEを使用する状況
以下のような場合にGEEの使用を検討します。
- 同一対象から複数回のデータを取得する場合
- データ間に時間的な関係がある場合
- 測定値同士に関連性がある場合
- 欠測値を含むデータを分析する必要がある場合
GEEの利点と制限
利点:
- データ間の関連性を適切に扱える
- 様々なタイプのデータに対応できる
制限:
- 解釈が複雑になることがある
- 適切な相関構造の選択が必要
- 一定のサンプルサイズが必要
数学的な表現
GEEは以下の数式で表現されます。
E(Yit)=μit=g−1(Xitβ)
各要素の意味は以下の通りです。
- Yit: 個体 i の時点 t での測定値
- Xit: 説明変数 (例: 治療の種類、投薬量など)
- β: 説明変数の影響を表す係数
- g: データの性質に応じて選択する関数
相関構造の種類
GEEでは、データ間の関連性を以下の3つの方法で表現できます。
- 交換可能: 全ての測定値間で関連性が同じ
- 自己回帰: 時間的に近い測定ほど関連性が強い
- 非構造化: 各測定値の組み合わせで関連性が異なる
データの準備
GEEで使用するデータは、以下の2つの形式で準備できます。
長い形式 (推奨):
広い形式:
欠損値の取り扱い
一般化推定方程式 (GEE) は、欠損値の取り扱いについて2つの方法を選択することができます。
1. 欠損値を含むデータのまま解析を行う場合
GEEの重要な特徴の一つとして、不完全なデータセットでも適切な解析が可能であることが挙げられます。
データの有効活用 - 一部の時点でデータが欠損していても、その被験者の他の時点のデータを活用できます - サンプルサイズの減少を最小限に抑えることができます
前提条件 - 欠損メカニズムがMAR (Missing At Random: ランダムな欠損) であることを仮定します - 観測されたデータに基づいて、欠損が生じる確率が決まると考えます
利点 - 統計的検出力の維持が期待できます - より多くの情報を活用した推定が可能です
2. 欠損値を含む行を除外して解析を行う場合
データが揃っている被験者のみを対象とした解析を行います。
Wide format の場合には、内部的に Long format に変換した後に、データが揃った行を選択します。 したがって、複数回の測定のうち一部が欠損値となっていても、それ以外のデータは有効になります。
完全ケース分析 - 欠損のない完全なデータセットでの解析となります - より保守的な結果が得られる可能性があります
注意点 - サンプルサイズが減少します - 統計的検出力が低下する可能性があります - 選択バイアスが生じる可能性があります
解析の設定
データ形式や欠損値の扱い、カラムの設定を行います。
全てマウスで操作することが可能で、常にカラムの内容を確認しながらの作業となりますので、間違った設定をしてしまう可能性を排除できます。
クラウド R へ送信される内容
クラウド R からの解析結果
AI による解析結果の解説
R の出力結果は、慣れていないと難解で、どのように解釈すべきかわからない場合もあると思いますが、AI がわかりやすく解説し、学会や論文でどのように発表すればよいかまで教えてくれます。
この解説を読むことで、GEEへの理解も深まると思います。
Reactive stat について
~ブラウザだけで使える無料統計ソフト~ 信頼性の高い R で統計解析し、その結果を AI が解説します!
ブラウザとデータファイルがあれば、すぐに解析できます
- マニュアル本は要りません。
- すべての統計手法のページには、利用に必要な解説が載っていますし、必要な情報へのリンクも用意してあります。
- PCにソフトウェアをインストールする必要はありません。
- 信頼性の高い R での結果が得られます。
- ウェブアプリで結果を得たあとに、そのデータを外部の R サーバーに送信し、その実行結果を得ることができます。
- 外部の R サーバーに送信されるデータは、セキュリティを考慮し、数値計算に必要な最小限のセットとしています。また、送信前に内容を確認できます。自動的に送信されることはありません。
- 常に最新バージョンのRを利用できます。
- 結果がリアルタイムに反映されるウェブアプリですので、統計解析に不慣れな場合でも試行錯誤が容易です。
- データの内容を常に把握しながら作業が行えるように工夫してありますので、どうしたらいいかわからない、という状況に陥ることがありません。
- 出力されるグラフはインタラクティブな高機能なものです。
- データファイルを読み込んで利用できます。
- CSV 形式データファイルおよびエクセルファイルに対応
- データファイルはブラウザ内部に読み込まれるだけで外部には送信されませんので、セキュリティの問題はありません。
- 日本語のデータファイルを扱うことができます
- 海外製のアプリですと、カラム名が日本語だと受け付けられないなどの制約がしばしばありますが、Reactive stat にはそのような制限はありません。
共用PCやタブレットでも
ソフトをインストールできない共用のPCや、iPad などタブレットでも実行可能です。
モバイルデバイスの場合は、 Google Drive, One Drive などのクラウドストレージからファイルを直接読み込むことができます。
読み込んだデータファイルの内容がそのままクラウドに送信されることはありませんので、個人情報を含むデータでも安心して解析できます。 共用PCの場合は、ログアウトすればすべて消去されますので安心です。
なお、R での解析やその結果を AI に解説させる機能では、クラウドに最小限のデータを送信しますが、統計解析に必要最小限のデータであり、個人情報が送信されることはなく、また、送信前にその内容を確認する手順になっていますので安心です。
スマートフォンでも
スマートフォンでも使えるように画面設計してあります!
最終的な統計解析を行うことを想定しているわけではなく、統計に不慣れなユーザーに手軽に親しんでいただくことが目的です。 専用のサンプルデータを解析手法ごとに用意していますし、 膨大な数の R のサンプルデータを簡単に検索して読み込めます。 また、できるだけ詳細に解説を付けてありますので、実際にデータを操作しながら統計を学んでいただくことが可能です。
Google Drive や One Drive のデータファイルを読み込めますので、ご自身のデータの解析して論文の原稿を書くこともできてしまいます!
インタラクティブな解析で理解が深まります
Reactive stat の名前の由来は
データの内容を常に確認しながら設定し、設定を変更するとリアルタイムにグラフなどが変化することが名称の由来です。
常にデータ内容を視覚的に把握しつつ解析を行えます
小さなヒストグラムなどで、しつこいほどにデータ内容を視覚的に示します。
統計処理においては、常にそのデータの性質、すなわち、カテゴリー変数なのか連続変数なのか、どのような分布をしているのかなどを把握しておく必要があります。
常にデータ内容を意識しつつ作業できますので、迷うことなく素早く正しい結果に到達できます。
すべての統計手法にデータと設定のサンプルを用意してあります
すべての統計手法のページには、 サンプルデータと設定の呼び出し ボタンが付いています。 これを押すと、典型的なサンプルデータと、そのデータに対する解析のための設定内容が読み込まれます。
その統計手法を初めて扱う場合でも、 どのような形式のデータが必要なのか、どのような形で結果が得られるのか、 サンプルを読み込んで実際に動かすころで理解が深まります。 そして、ご自身のデータをどう処理すればよいかがすぐに分かります。
信頼できる R の解析結果を AI に解説させて容易に理解できます
Reactive stat では、ほとんどの統計解析を R言語 (統計解析を主な目的とする専門的なシステム) を利用して行うことができます。
R は数多くの専門家が参画して作り上げられたシステムで、信頼性が高く、無料で利用できる素晴らしいものですが、なかなか敷居が高いです。 出力された解析結果も、英語で書いてあってわかりにくいです。
それを劇的に使いやすくしてくれたのが EZR ですが、インストールが必要だったり、やはり統計解析の初心者には難しいという声も聞かれます。
そこで、Reactive stat では、ブラウザでの簡単な操作で、インタラクティブに R による解析が行えるようにしてみました。 さらに、その解析結果を、AI に解説してもらう機能が付いています。
AI による解説には、そこで使われている統計手法の説明から、得られた結果の解釈、さらには学会発表や論文にどのように表現すればよいかまで含まれます。
論文や学会発表の準備が簡単になります
医療統計でよく使う統計手法を網羅しています
特に医療分野で頻繁に使われる統計手法を広くサポートし、また、医学論文で必要なグラフの作成が簡単に行えます。 今後、リクエストがあればさらに拡充してゆく計画です。
また、心理統計の領域で使われる手法も今後拡充してゆきます。
最新の R による解析結果が得られ、論文への記載が容易です
- 論文発表や学会発表において、「統計解析はRで行いました」と書くことができます。
- Rは通常、毎年2回 (4月と10月) バージョンアップされます。これらのリリースにはバグ修正などが含まれます。
- 解析ごとに、R 本体および使用されたすべてのライブラリのバージョンを表示します。
- 近年重要視されるようになった効果量の値の計算が多くの統計手法でサポートされています。
- 論文にどのように書けばよいか、AI が教えてくれます。
論文や学会発表で必要なサマリー表がすぐに作成できます
ほとんどの臨床系の論文で必要とされる、症例の背景因子の表が、あっという間に作成できます。 一つ一つの因子を統計解析し、その数値をまとめて表にするのは、意外と手間のかかるのもです。 これを、本当にあっという間に作成してくれます。 ぜひお試しください。
ドラッグ&ドロップで項目を入れ替えたり、統計処理がパラメトリックとノンパラメトリックから選べたり、徹底的に使いやすさを追求しています。 使いこなしていただけると嬉しいです。
p値まで含んだ表が出力されますので、学会発表くらいなら統計処理がこの機能だけで済んでしまう場合もしばしばあります。
本当に「あっという間に」思い通りのサマリー表が作成できてしまいます!
多彩なチャートを簡単に作成できます
多く用いられるチャートを簡単に作成できるよう、チャート作成機能を充実させました。
対象ユーザー
- 統計学には興味は無いが学会発表があるのでちゃちゃっとデータ処理を済ませたい方
- 実際のデータを触りながら統計を学びたい初心者
- 手持ちのデータを探索的に把握したい研究者
などなど、(統計学者以外の) あらゆる方が対象です。
統計結果のグラフは、設定の変更をリアルタイムに反映しますから、その理解が簡単です。 上の例にも示すように、ROC曲線における閾値の変化で、感度や特異度がどう変わるのか、実際にサンプルデータで試してみることで、その原理まで理解が深まります。
また、常にデータの内容を視覚的に示しつつ設定を進めてゆくという基本コンセプトですので、どうしていいかわからない迷子になってしまうことがありません。
Reactive stat により、統計嫌いが少しでも減ることを願っています。 そして、皆様の貴重な研究成果の発表のお手伝いができると嬉しいです。
企業担当者の連絡先を閲覧するには
会員登録を行い、ログインしてください。