🎯 研究概述與完整成果
研究背景與學術價值
隨著穿戴式健康裝置的普及,大量的生理與活動資料為健康研究提供了新的機會。本研究專注於探討日常活動量與睡眠品質間的複雜關聯性,透過Garmin運動手環收集的真實世界資料,運用嚴格的資料清理與完整的多變量統計分析方法進行深度研究。
學術成就:成功建立從資料清理到理論驗證的完整研究範式,以統計學方法驗證「活動-睡眠質量互補假設」(p = 0.0084),同時揭示了睡眠行為預測的複雜性與挑戰,為穿戴式裝置資料分析建立學術標準。
🏆 多變量分析學術成果總覽
🎓 核心學術發現
- 技術創新:成功解決嚴重多重共線性問題(r=0.991),展現PCA降維的威力
- 理論驗證:「活動-睡眠質量互補假設」獲得統計學支持(ANOVA p < 0.05)
- 行為識別:發現平衡型(73.0%)vs 活躍型(28.0%)兩大生活型態
- 預測建模:揭示睡眠時長預測的複雜性與限制(交叉驗證R² = -8.5%)
🌟 完整分析流程與成果
系統性資料清理
重大發現:識別並解決關鍵的時區混亂問題(1.8% → 95.5%正常化),建立嚴格的品質控制流程, 處理69.3%的重複記錄、異常值與日期歸屬邏輯,確保分析結果的學術可信度。
探索性資料分析
關鍵發現:深入分析71位使用者的睡眠與活動指標分布特徵,發現嚴重的多重共線性問題(r=0.991), 驗證「活動-睡眠質量互補假設」的初步證據,為後續多變量分析奠定實證基礎。
多變量統計分析
學術成就:成功運用PCA解決共線性問題(99.8%解釋變異),K-means識別行為群體,
ANOVA驗證核心假設(p < 0.05),迴歸預測揭示睡眠行為預測需考慮更多元因素(R² = -8.5%)。
✅ 完整分析鏈圓滿達成
📈 完整分析流程時間軸
🏆 完整的多變量分析鏈圓滿達成!
🏆 完整研究的關鍵學術發現
🛠️ 技術架構與學術價值
前端技術架構
- HTML5 + CSS3:響應式學術報告設計
- JavaScript ES6:互動式圖表與導航系統
- Chart.js:專業統計圖表視覺化
- 模組化架構:便於維護與學術審查
統計分析方法
- PCA降維:解決多重共線性,揭示潛在結構
- K-means聚類:識別行為模式群體
- ANOVA檢驗:驗證群體間統計差異
- 線性迴歸:建立預測模型
🎓 完整研究的學術價值與實務意義
學術貢獻:建立穿戴式裝置資料分析的標準流程,首次在台灣使用者中系統性驗證活動-睡眠關係,提供方法學創新與理論驗證。成功整合PCA、聚類、ANOVA、迴歸等多變量方法,展現統計學在行為科學中的強大應用潛力。
實務應用:為個別化健康管理、穿戴式裝置演算法改進、公共衛生政策制定提供科學基礎。研究結果可直接應用於Garmin等裝置的功能改進與健康建議系統優化。
🔒 資料來源與隱私
負責任地處理第三方個人健康資料
本研究分析的是 Garmin 運動手環的穿戴式裝置資料(71 位使用者、約 2.7 年、原始 3,976 筆睡眠記錄),屬於第三方專有且含個人健康資訊的資料。基於資料授權與隱私考量,原始與逐筆資料一律不公開。
✅ 公開前採取的資料保護措施
- 不公開原始與逐筆資料:所有含個人紀錄的檔案皆排除於版本控制之外。
- 只揭露彙總結果:本報告與儀表板僅呈現變數層級的統計量(平均、相關、負載等),不含任何可識別個人的內容。
- 去識別化:移除報告中殘留的使用者代碼,確保無法回溯到個別使用者。
- 可重現但不洩密:GitHub 專案附合成假資料產生器,讓他人能執行完整分析流程而不接觸真實資料。
📄 完整的資料來源、schema 與隱私說明見 GitHub: DATA.md
📖 探索完整的分析報告
資料清理與品質控制
深入了解時區問題的發現過程、系統性清理方法論,以及如何從3,976筆原始記錄 中提煉出1,031筆高品質資料的完整流程。展現學術嚴謹的資料處理標準。
探索性資料分析
深入分析71位使用者的睡眠與活動指標分布特徵、相關性關係, 建立「活動-睡眠質量互補假設」的統計證據與多重共線性發現。
多變量統計分析
完整的PCA降維解決共線性問題、K-means聚類識別使用者群體、
ANOVA檢驗差異顯著性,並建立預測迴歸模型(交叉驗證R² = -0.085)揭示了睡眠行為預測的複雜性。
🏆 學術研究的完美收官
研究限制與未來改進
誠實檢視資料(重複測量)、統計方法(前處理洩漏、因子分析適切性)
與工程面的限制,並提出具體改進方向。
🔎 科學誠實與成熟度的展現