題組內容

Anscombe（1973）發表了四組數據集，每一組都只有一個解釋變數和一個反應變數，這四組數據集經常被用來示範散佈圖（scatter plot）在迴歸分析的重要性。數據如下所示：

其中「x1, x2, x3, x4」依序分別表示第一組數據集的解釋變數、第二組數據集的解釋變數、第三組數據集的解釋變數、第四組數據集的解釋變數。「y1, y2, y3, y4」依序分別表示第一組數據集的反應變數、第二組數據集的反應變數、第三組數據集的反應變數、第四組數據集的反應變數。有了數據之後，在假設簡單線性迴歸模型之前，通常會先繪製散佈圖，但這一回我們先配適這個模型「y = A + Bx」，其中「y」是反應變數、「A」是截距、「B」是斜率、「x」是解釋變數。

答題時，請用「A1」代表第一組數據集上述模型「A」的估計值、「B1」代表第一組數據集上述模型「B」的估計值；用「A2」代表第二組數據集上述模型「A」的估計值、「B2」代表第二組數據集上述模型「B」的估計值；用「A3」代表第三組數據集上述模型「A」的估計值、「B3」代表第三組數據集上述模型「B」的估計值；用「A4」代表第四組數據集上述模型「A」的估計值、「B4」代表第四組數據集上述模型「B」的估計值。

為了估計「A（截距）」和「B（斜率）」，有下列4組數據集。（請注意，欄位名稱x和y是原始數據、xx表示解釋變數的平方、yy表示反應變數的平方、xy 表示解釋變數乘以反應變數。「總和」為其上方11個數字的加總）

1.第一組數據集：

2.第二組數據集：

3.第三組數據集：

4.第四組數據集：

一、請利用上述表格計算解釋變數與反應變數之間的相關係數到小數點第四位，並且由小到大排序計算結果。（假設第一組數據集的相關係數為「r1」、第二組數據集的相關係數為「r2」、第三組數據集的相關係數為「r3」、第四組數據集的相關係數為「r4」。）（20分）

題組內容

相關申論題

相關試卷