ブラウザだけで使える無料統計ソフト Reactive stat では 線形混合効果モデル(LMM)機能を利用して柔軟なデータ分析が可能です

エミュイン合同会社

2024.12.09 07:30

直感的なUIにて高度な統計機能を実行できます - 臨床研究から経時データまで、あらゆる階層的データ構造に対応します

線形混合効果モデル(Linear Mixed Effects Model, LMM)は、統計モデリングの一種で、データ解析において非常に有用なツールです。 LMMは、データの中に階層構造やクラスター構造がある場合や、データが時間依存性を持つ場合など、様々な応用で利用されます。

a6c266ab38418f381733398195.png


線形混合効果モデル(Linear Mixed Effects Model, LMM)の特徴

  • 固定効果とランダム効果の組み合わせ
    • 固定効果は、研究全体で一般化可能な系統的な効果を表します(例:治療効果、性別の影響)
    • ランダム効果は、データの階層構造から生じる変動を表します(例:個体差、施設間差)
    • これらを組み合わせることで、複雑なデータ構造を適切にモデル化できます
  • 階層データの取り扱い
    • 被験者内の反復測定
    • グループ内のクラスタリング
    • マルチレベル構造
  • 時間依存性データの解析
    • 経時測定データの分析
    • 不均衡なデータにも対応
    • 変化パターンの個体差を考慮
  • 欠損値への対応
    • 完全なデータセットが不要
    • 不完全データでも解析可能
    • MAR(Missing At Random)を仮定

 

データ形式

本アプリケーションでは、以下の2つのデータ形式に対応しています:

長い形式 (Long Format)

各行が1つの観測値を表す形式です。 時系列データの自然な表現に適しています。

cc64d524fcd40d071733397910.png

広い形式 (Wide Format)

1行に全測定値が含まれる形式です。 複数の時点での測定値が別々の列として表現されます。

bb9c7a6382d7ddc31733397924.png

モデルの設定

固定効果の指定

  • 実験条件や介入(治療群/対照群)
  • 共変量(年齢、性別など)
  • 時間要因(測定時点、経過期間)
  • 数値型の場合:
    • 連続変数として扱う(例:年齢、体重)
    • カテゴリ変数として扱う(例:グレード、ステージ)

ランダム効果の指定

  • 被験者要因(患者ID、個体ID)
  • クラスター要因(施設ID、医師ID)
  • 必ずカテゴリカル変数を指定
  • 十分なサンプルサイズが必要

ランダム効果の構造

  • ランダム切片のみ
    • グループごとのベースラインの違いを考慮
    • 最もシンプルなモデル
  • 変数との交互作用を含める
    • グループごとの傾きの違いを考慮
    • より複雑なモデル
    • 十分なデータ数が必要

パラメータ推定方法

  • 制限最尤法 (REML)
    • ランダム効果の推定に適している
    • 小サンプルでも信頼性が高い
  • 最尤法 (ML)
    • モデル比較に適している
    • AIC/BICによるモデル選択が可能

d6d19d4da268b0a51733398113.png

欠損値の取り扱い

線形混合モデル(LMM)では、欠損値の取り扱いについて2つの方法を選択することができます。

9f38e6a6df88f92b1733398044.png

1. 欠損値を含むデータのまま解析を行う場合

LMMの重要な特徴の一つとして、不完全なデータセットでも適切な解析が可能であることが挙げられます。

データの有効活用

  1. 一部の時点でデータが欠損していても、その被験者の他の時点のデータを活用できます
  2. サンプルサイズの減少を最小限に抑えることができます

前提条件

  1. 欠損メカニズムがMAR(Missing At Random:ランダムな欠損)であることを仮定します
  2. 観測されたデータに基づいて、欠損が生じる確率が決まると考えます

利点

  1. 統計的検出力の維持が期待できます
  2. より多くの情報を活用した推定が可能です

2. 欠損値を含む行を除外して解析を行う場合

データが揃っている被験者のみを対象とした解析を行います。

Wide format の場合には、内部的に Long format に変換した後に、データが揃った行を選択します。 したがって、複数回の測定のうち一部が欠損値となっていても、それ以外のデータは有効になります。

完全ケース分析

  1. 欠損のない完全なデータセットでの解析となります
  2. より保守的な結果が得られる可能性があります

注意点

  1. サンプルサイズが減少します
  2. 統計的検出力が低下する可能性があります
  3. 選択バイアスが生じる可能性があります

注意事項

以下の点について、十分な検討を行うことをお勧めします。

  1. 欠損値の発生パターンを十分に検討してください
  2. 欠損メカニズムの仮定が妥当かどうかを検討してください
  3. 解析結果の解釈には、選択した欠損値の取り扱い方法を考慮してください
  4. 必要に応じて、両方の方法で解析を行い、結果を比較することをお勧めします

注意: いずれの方法を選択した場合でも、LMMは欠損値の自動的な補完は行いません。欠損値の補完が必要な場合は、別途適切な方法で行う必要があります。

 

注意事項

特殊なカラム名について

以下のカラム名は内部処理用に予約されているため、使用を避けてください:

  • LMM_TIME
  • LMM_RESPONSES

 

Reactive stat について

~ブラウザだけで使える無料統計ソフト~ 信頼性の高い R で統計解析し、その結果を AI が解説します!

ブラウザとデータファイルがあれば、すぐに解析できます

  • マニュアル本は要りません。
    • すべての統計手法のページには、利用に必要な解説が載っていますし、必要な情報へのリンクも用意してあります。
  • PCにソフトウェアをインストールする必要はありません。
  • 信頼性の高い R での結果が得られます。
    • ウェブアプリで結果を得たあとに、そのデータを外部の R サーバーに送信し、その実行結果を得ることができます。
    • 外部の R サーバーに送信されるデータは、セキュリティを考慮し、数値計算に必要な最小限のセットとしています。また、送信前に内容を確認できます。自動的に送信されることはありません。
    • 常に最新バージョンのRを利用できます。
  • 結果がリアルタイムに反映されるウェブアプリですので、統計解析に不慣れな場合でも試行錯誤が容易です。
    • データの内容を常に把握しながら作業が行えるように工夫してありますので、どうしたらいいかわからない、という状況に陥ることがありません。
  • 出力されるグラフはインタラクティブな高機能なものです。
  • データファイルを読み込んで利用できます。
    • CSV 形式データファイルおよびエクセルファイルに対応
    • データファイルはブラウザ内部に読み込まれるだけで外部には送信されませんので、セキュリティの問題はありません。
  • 日本語のデータファイルを扱うことができます
    • 海外製のアプリですと、カラム名が日本語だと受け付けられないなどの制約がしばしばありますが、Reactive stat にはそのような制限はありません。

 

共用PCやタブレットでも

ソフトをインストールできない共用のPCや、iPad などタブレットでも実行可能です。

モバイルデバイスの場合は、 Google Drive, One Drive などのクラウドストレージからファイルを直接読み込むことができます。

読み込んだデータファイルの内容がそのままクラウドに送信されることはありませんので、個人情報を含むデータでも安心して解析できます。 共用PCの場合は、ログアウトすればすべて消去されますので安心です。

なお、R での解析やその結果を AI に解説させる機能では、クラウドに最小限のデータを送信しますが、統計解析に必要最小限のデータであり、個人情報が送信されることはなく、また、送信前にその内容を確認する手順になっていますので安心です。

スマートフォンでも

スマートフォンでも使えるように画面設計してあります!

最終的な統計解析を行うことを想定しているわけではなく、統計に不慣れなユーザーに手軽に親しんでいただくことが目的です。 専用のサンプルデータを解析手法ごとに用意していますし、 膨大な数の R のサンプルデータを簡単に検索して読み込めます。 また、できるだけ詳細に解説を付けてありますので、実際にデータを操作しながら統計を学んでいただくことが可能です。

Google Drive や One Drive のデータファイルを読み込めますので、ご自身のデータの解析して論文の原稿を書くこともできてしまいます!

 

インタラクティブな解析で理解が深まります

 

Reactive stat の名前の由来は

データの内容を常に確認しながら設定し、設定を変更するとリアルタイムにグラフなどが変化することが名称の由来です。

常にデータ内容を視覚的に把握しつつ解析を行えます

小さなヒストグラムなどで、しつこいほどにデータ内容を視覚的に示します。

統計処理においては、常にそのデータの性質、すなわち、カテゴリー変数なのか連続変数なのか、どのような分布をしているのかなどを把握しておく必要があります。

常にデータ内容を意識しつつ作業できますので、迷うことなく素早く正しい結果に到達できます。

ROC曲線と感度・特異度の解析の例

すべての統計手法にデータと設定のサンプルを用意してあります

すべての統計手法のページには、 サンプルデータと設定の呼び出し ボタンが付いています。 これを押すと、典型的なサンプルデータと、そのデータに対する解析のための設定内容が読み込まれます。

その統計手法を初めて扱う場合でも、 どのような形式のデータが必要なのか、どのような形で結果が得られるのか、 サンプルを読み込んで実際に動かすころで理解が深まります。 そして、ご自身のデータをどう処理すればよいかがすぐに分かります。

 

信頼できる R の解析結果を AI に解説させて容易に理解できます

Reactive stat では、ほとんどの統計解析を R言語 (統計解析を主な目的とする専門的なシステム) を利用して行うことができます。

R は数多くの専門家が参画して作り上げられたシステムで、信頼性が高く、無料で利用できる素晴らしいものですが、なかなか敷居が高いです。 出力された解析結果も、英語で書いてあってわかりにくいです。

それを劇的に使いやすくしてくれたのが EZR ですが、インストールが必要だったり、やはり統計解析の初心者には難しいという声も聞かれます。

そこで、Reactive stat では、ブラウザでの簡単な操作で、インタラクティブに R による解析が行えるようにしてみました。 さらに、その解析結果を、AI に解説してもらう機能が付いています。

AI による解説には、そこで使われている統計手法の説明から、得られた結果の解釈、さらには学会発表や論文にどのように表現すればよいかまで含まれます。

 

論文や学会発表の準備が簡単になります

医療統計でよく使う統計手法を網羅しています

特に医療分野で頻繁に使われる統計手法を広くサポートし、また、医学論文で必要なグラフの作成が簡単に行えます。 今後、リクエストがあればさらに拡充してゆく計画です。

また、心理統計の領域で使われる手法も今後拡充してゆきます。

Reactive stat 統計手法一覧

 

最新の R による解析結果が得られ、論文への記載が容易です

  • 論文発表や学会発表において、「統計解析はRで行いました」と書くことができます。
    • Rは通常、毎年2回 (4月と10月) バージョンアップされます。これらのリリースにはバグ修正などが含まれます。
    • 解析ごとに、R 本体および使用されたすべてのライブラリのバージョンを表示します。
  • 近年重要視されるようになった効果量の値の計算が多くの統計手法でサポートされています。
  • 論文にどのように書けばよいか、AI が教えてくれます。

論文や学会発表で必要なサマリー表がすぐに作成できます

ほとんどの臨床系の論文で必要とされる、症例の背景因子の表が、あっという間に作成できます。 一つ一つの因子を統計解析し、その数値をまとめて表にするのは、意外と手間のかかるのもです。 これを、本当にあっという間に作成してくれます。 ぜひお試しください。

ドラッグ&ドロップで項目を入れ替えたり、統計処理がパラメトリックとノンパラメトリックから選べたり、徹底的に使いやすさを追求しています。 使いこなしていただけると嬉しいです。

p値まで含んだ表が出力されますので、学会発表くらいなら統計処理がこの機能だけで済んでしまう場合もしばしばあります。

本当に「あっという間に」思い通りのサマリー表が作成できてしまいます!

サマリー表の作成機能

 

多彩なチャートを簡単に作成できます

多く用いられるチャートを簡単に作成できるよう、チャート作成機能を充実させました。

8bfcd04a9fe0797f1723469792.png

チャート作成機能

 

対象ユーザー

  • 統計学には興味は無いが学会発表があるのでちゃちゃっとデータ処理を済ませたい方
  • 実際のデータを触りながら統計を学びたい初心者
  • 手持ちのデータを探索的に把握したい研究者

などなど、(統計学者以外の) あらゆる方が対象です。

統計結果のグラフは、設定の変更をリアルタイムに反映しますから、その理解が簡単です。 上の例にも示すように、ROC曲線における閾値の変化で、感度や特異度がどう変わるのか、実際にサンプルデータで試してみることで、その原理まで理解が深まります。

また、常にデータの内容を視覚的に示しつつ設定を進めてゆくという基本コンセプトですので、どうしていいかわからない迷子になってしまうことがありません。

Reactive stat により、統計嫌いが少しでも減ることを願っています。 そして、皆様の貴重な研究成果の発表のお手伝いができると嬉しいです。

 

企業担当者の連絡先を閲覧するには
会員登録を行い、ログインしてください。

種類
商品サービス

カテゴリ
システム・通信

サブカテゴリ
デジタル