主要內容: 資料的整理與顯示: 次數分配表 (Frequency Distribution Table): 將資料分成若干組,列出各組的次數。 直方圖 (Histogram): 用長方形的高度表示各組的次數,呈現資料的分布情況。 累積次數分配表 (Cumulative Frequency Distribution Table): 列出各組及其之前所有組的次數總和。 盒狀圖 (Boxplot): 用盒子的長度表示四分位距 (IQR),用線段表示最大值、最小值,呈現資料的集中程度和離散程度。 散佈圖 (Scatter Plot): 用點表示兩個變數之間的關係,呈現資料的相關性。 統計量: 集中趨勢 (Measures of Central Tendency): 平均數 (Mean): 資料的總和除以資料的個數。 樣本平均數:x̄ = (Σxᵢ) / n 中位數 (Median): 將資料排序後,位於中間位置的數值。 眾數 (Mode): 資料中出現次數最多的數值。 離散程度 (Measures of Dispersion): 全距 (Range): 最大值與最小值之差。 四分位距 (Interquartile Range, IQR): 第 75 百分位數 (Q3) 與第 25 百分位數 (Q1) 之差。 變異數 (Variance): 資料與平均數之差的平方的平均數。 樣本變異數:s² = Σ(xᵢ - x̄)² / (n - 1) 標準差 (Standard Deviation): 變異數的平方根。 樣本標準差:s = √s² 百分位數 (Percentile): 將資料排序後,小於或等於該數值的資料佔總資料的百分比。 例如:第 25 百分位數 (Q1)、第 50 百分位數 (Q2,即中位數)、第 75 百分位數 (Q3)。 相關係數 (Correlation Coefficient): 定義: 衡量兩個變數之間線性關係強弱的指標,取值範圍在 -1 到 1 之間。 公式: r = Σ[(xᵢ - x̄)(yᵢ - ȳ)] / [√Σ(xᵢ - x̄)² * √Σ(yᵢ - ȳ)²] 解釋: r > 0:正相關 (Positive Correlation),一個變數增加,另一個變數也傾向於增加。 r < 0:負相關 (Negative Correlation),一個變數增加,另一個變數傾向於減少。 r ≈ 0:無相關 (No Correlation),兩個變數之間沒有明顯的線性關係。 |r| ≈ 1:強相關 (Strong Correlation),兩個變數之間的線性關係很強。 注意: 相關係數只能衡量線性關係,不能衡量非線性關係。 線性迴歸 (Linear Regression): 目的: 找到一條直線,盡可能地擬合兩個變數之間的關係,用於預測或推斷。 迴歸直線方程式: y = a + bx a:截距 (Intercept) b:斜率 (Slope) 最小平方法 (Least Squares Method): 用於估計迴歸直線的參數 a 和 b,使得實際值與預測值之間的誤差平方和最小。 學習方法建議: 理解概念: 掌握數據分析的基本概念和術語,例如平均數、標準差、相關係數等。 熟悉公式: 熟記相關公式,並能正確計算。 善用工具: 學習使用計算機、試算表軟體 (如 Excel) 或統計軟體 (如 R) 進行數據分析。 解讀結果: 學會解讀數據分析的結果,並能做出合理的推論。 聯繫生活: 將數據分析知識與生活中的實際例子聯繫起來,加深理解。 學習這個章節的重要性: 分析資料: 數據分析可以幫助我們從大量資料中提取有用的資訊。 做出決策: 數據分析可以幫助我們做出更明智的決策。 理解社會現象: 數據分析可以幫助我們理解社會現象的規律。 應用於各領域: 數據分析廣泛應用於商業、科學、醫學、社會科學等領域。 一些具體例子: 市場調查: 分析消費者行為,制定行銷策略。 醫學研究: 分析疾病的發生率和影響因素,開發新的治療方法。 金融分析: 分析股票價格的變動,預測市場趨勢。