🏃‍♂️ Garmin運動手環多變量分析

探討活動量與睡眠品質間的關聯性

🎉 完整分析流程圓滿完成 - 學術研究價值確立

本研究透過系統性的資料處理與多變量統計分析,深入探討71位Garmin使用者的活動與睡眠模式。 成功完成嚴格的資料清理、全面的探索性分析、以及完整的多變量統計建模,統計學驗證了「活動- 睡眠質量互補假設」(ANOVA, p = 0.0084),同時揭示了睡眠時長預測的複雜性與限制(交叉驗證R² = -8.5%)。

📋 開始瀏覽完整報告 📊 查看研究成果

🎯 研究概述與完整成果

研究背景與學術價值

隨著穿戴式健康裝置的普及,大量的生理與活動資料為健康研究提供了新的機會。本研究專注於探討日常活動量與睡眠品質間的複雜關聯性,透過Garmin運動手環收集的真實世界資料,運用嚴格的資料清理與完整的多變量統計分析方法進行深度研究。

學術成就:成功建立從資料清理到理論驗證的完整研究範式,以統計學方法驗證「活動-睡眠質量互補假設」(p = 0.0084),同時揭示了睡眠行為預測的複雜性與挑戰,為穿戴式裝置資料分析建立學術標準。

研究期間
2.7年
2020年10月 - 2023年6月
研究對象
71位
Garmin使用者
原始資料
3,976筆
睡眠記錄
最終分析
1,031筆
高品質配對資料

🏆 多變量分析學術成果總覽

PCA降維成果
99.8%
4個主成分解釋變異
聚類分析結果
2群體
平衡型 vs 活躍型
ANOVA假設驗證
✓成功
p < 0.05 顯著
預測模型R²
-8.5%
睡眠時長預測的複雜性與限制

🎓 核心學術發現

  • 技術創新:成功解決嚴重多重共線性問題(r=0.991),展現PCA降維的威力
  • 理論驗證:「活動-睡眠質量互補假設」獲得統計學支持(ANOVA p < 0.05)
  • 行為識別:發現平衡型(73.0%)vs 活躍型(28.0%)兩大生活型態
  • 預測建模:揭示睡眠時長預測的複雜性與限制(交叉驗證R² = -8.5%)

🌟 完整分析流程與成果

🔧

系統性資料清理

重大發現:識別並解決關鍵的時區混亂問題(1.8% → 95.5%正常化),建立嚴格的品質控制流程, 處理69.3%的重複記錄、異常值與日期歸屬邏輯,確保分析結果的學術可信度。

25.9% 資料保留率
86.9% 配對成功率
📊

探索性資料分析

關鍵發現:深入分析71位使用者的睡眠與活動指標分布特徵,發現嚴重的多重共線性問題(r=0.991), 驗證「活動-睡眠質量互補假設」的初步證據,為後續多變量分析奠定實證基礎。

7.47h 平均睡眠時長
2,800 平均日步數
🔬

多變量統計分析

學術成就:成功運用PCA解決共線性問題(99.8%解釋變異),K-means識別行為群體, ANOVA驗證核心假設(p < 0.05),迴歸預測揭示睡眠行為預測需考慮更多元因素(R² = -8.5%)。
✅ 完整分析鏈圓滿達成

4方法 PCA·聚類·ANOVA·迴歸
學術級 研究品質

📈 完整分析流程時間軸

Phase 1 - 完成
資料清理與品質控制
重大發現:系統性識別時區問題(1.8% → 95.5%正常化),處理69.3%重複記錄與異常值。 最終從3,976筆原始記錄中提煉出1,031筆高品質配對資料,建立學術嚴謹的清理流程。
Phase 2 - 完成
探索性資料分析 (EDA)
關鍵發現:平均睡眠時間7.47±1.46小時符合WHO標準,發現活動指標間嚴重多重共線性(r=0.991)。 建立「活動-睡眠質量互補假設」的初步證據,為多變量分析奠定理論基礎。
Phase 3 - 完成
多變量統計分析
學術成就:PCA降維解決共線性並揭示4大潛在因子(99.8%解釋變異), K-means識別2個行為群體,ANOVA成功驗證核心假設(p < 0.05), 迴歸預測揭示睡眠行為預測需考慮更多元因素(R² = -8.5%)。
🏆 完整的多變量分析鏈圓滿達成!

🏆 完整研究的關鍵學術發現

🌏 時區問題的重大發現
首次系統性識別穿戴式裝置的時區記錄問題:原始資料僅1.8%睡眠記錄出現在正常夜間時段,修正後95.5%恢復正常,展現批判性資料檢查的重要性
🔬 PCA降維的學術創新
成功解決嚴重多重共線性問題(r=0.991),4個主成分解釋99.8%變異,揭示綜合活動水平、睡眠品質權衡、壓力主導、活動效率等4大潛在因子
✅ 「活動-睡眠質量互補假設」統計驗證
ANOVA確認活躍型睡眠時間較短(-0.269h, p = 0.0084, Cohen's d = 0.185)但深睡比例較高(+2.8%),獲得完整統計學支持
👥 行為群體識別成功
K-means識別平衡型(73.0%)vs 活躍型(27.0%)兩大生活型態,10倍活動量差異具有顯著統計意義,輪廓係數0.468確認聚類有效性
🎯 預測模型建立
建立睡眠時長預測模型(R² = -8.5%),理解預測模型限制,體現在行為科學領域研究的複雜性
📊 方法學範式建立
建立從資料清理到預測建模的完整學術研究流程,為穿戴式裝置資料分析提供標準化方法學範例,具有高度可重現性

🛠️ 技術架構與學術價值

前端技術架構

  • HTML5 + CSS3:響應式學術報告設計
  • JavaScript ES6:互動式圖表與導航系統
  • Chart.js:專業統計圖表視覺化
  • 模組化架構:便於維護與學術審查

統計分析方法

  • PCA降維:解決多重共線性,揭示潛在結構
  • K-means聚類:識別行為模式群體
  • ANOVA檢驗:驗證群體間統計差異
  • 線性迴歸:建立預測模型

🎓 完整研究的學術價值與實務意義

學術貢獻:建立穿戴式裝置資料分析的標準流程,首次在台灣使用者中系統性驗證活動-睡眠關係,提供方法學創新與理論驗證。成功整合PCA、聚類、ANOVA、迴歸等多變量方法,展現統計學在行為科學中的強大應用潛力。

實務應用:為個別化健康管理、穿戴式裝置演算法改進、公共衛生政策制定提供科學基礎。研究結果可直接應用於Garmin等裝置的功能改進與健康建議系統優化。

🔒 資料來源與隱私

負責任地處理第三方個人健康資料

本研究分析的是 Garmin 運動手環的穿戴式裝置資料(71 位使用者、約 2.7 年、原始 3,976 筆睡眠記錄),屬於第三方專有且含個人健康資訊的資料。基於資料授權與隱私考量,原始與逐筆資料一律不公開。

✅ 公開前採取的資料保護措施

  • 不公開原始與逐筆資料:所有含個人紀錄的檔案皆排除於版本控制之外。
  • 只揭露彙總結果:本報告與儀表板僅呈現變數層級的統計量(平均、相關、負載等),不含任何可識別個人的內容。
  • 去識別化:移除報告中殘留的使用者代碼,確保無法回溯到個別使用者。
  • 可重現但不洩密:GitHub 專案附合成假資料產生器,讓他人能執行完整分析流程而不接觸真實資料。

📄 完整的資料來源、schema 與隱私說明見 GitHub: DATA.md

📖 探索完整的分析報告