[90(2001).10.15]

                                                                                
Joincer, B. L.(1982)
  Practicing statistics or what they forgot
  to say in the classroom.
    In: Rustagi, J. S. and Wolfe, D. A. (eds)
    Teaching of Statistics and Statistical Consulting.
                                                                                
Note:
  以下內容並不與原文完全一致, 尤其原文關於統計軟體部分, 已
  嫌陳舊, 故略而不提。
                                                                                
摘要:
  本文談到一些實務統計工作應知道, 但課堂上很少教到的重要事
  項, 包括: 跟上新知發展、合作及工作上人際溝通的重要性、資
  料蒐集、分析、及報告撰寫上的建議。


[跟上新知發展] (這部分對大學部同學而言, 可能是比較不適用?
                但了解一下沒有壞處。)

。要做好實務統計工作, 必須知道, 並且繼續學習新的統計方法、
  計算技巧、科學方法、及其所從事領域主題知識。

。Searl, S. R. 在其 "Linear Models" 的序中說:
  "Statistician, in their consulting capacity, are much
   like lawers.  They do not need to remember every tech-
   nique exactly, but must know where to locate it when
   needed and be able to understand it once found."
  注意除了 "must know where to locate" 之外, 還要 "be able
  to understand". 這表示就實務應用而言, 統計的基本功 (統計
  學原理) 是重要的!

。和上述問題相關的: 實務統計問題常是非標準的; 而短期統計課
  程(正規統計課程也是)完全沒有教到如何處理非標準問題。我們
  需要的是: 如何對「已解」的問題找到相當好(不一定最好)的解
  答, 以及對未曾考慮過的問題發展出合理的好方法。

。跟上新知發展的工具: (1)好書 (2)學術期刊 (3)索引
  {好書} 作者舉了 Snedcor and Cochran 的 Statistical Methods
         等 6 本。
  {期刊} JASA 等重要期刊。
  {索引} 統計文章大概都會收錄在 Current Index in Statistics。
         不過, 只有作者、篇名和出處。 Math. Sci. Citation
         Index 資料庫則有摘要。

[軟體]
  現在做統計工作大概都避免不了使用電腦, 因此對統計軟體熟悉
  是必要的。不過, 原文介紹的軟體, 在轉移到 PC 後, 多年以來
  面貌已全然不同。故此部分略。

[諮詢實務]

。實際上可說所有實務統計學者都是以諮詢或合作的角色在做事的。
  這表示其成敗有很大的比重在於是否能做有效的溝通。

。一些建議:
  -- 建立有益的、富想像力 (具創新性) 的態度。
  -- 誠懇地瞭解實際的問題並協助解決。
  -- 學習所討論之應用主題的一些知識。
  -- 不憚於詢問。
  -- 要求參觀和資料來源有關的設備、實驗室或場所。
  -- 複述(確定瞭解)你所聽到的。
  -- 寫備忘錄。
                                                                                
[資料蒐集]

。在任何計畫中, 統計人員最重要的貢獻是協助建立一個清楚的目
  標。最好將你所瞭解的目標、建議的方法及預期結果寫在備忘錄。

。設計資料蒐集計畫時要考慮的事項
  -- 明確訂定目標
  -- 量化目標
  -- 精確界定變數
  -- 指定候選模型族
  -- 描述集區因子及推論範圍
  -- 考慮揭露不確定性的不同方法
  -- 指定估計方法, 含精確度及偏誤
  -- 詳訂資料蒐集方案
  -- 詳訂資料登錄程序
  -- 描述資料電腦化過程
  -- 明訂資料檢核方法
  -- 擬訂資料探索、彙總及分析的暫行方案
  -- 替代的、暫時性的資料蒐集計畫之比較
                                                                                
[資料分析]

。好的資料分析, 就像好的設計, 是從小心描述問題開始。問題的
  描述應透過和研究主題方面的專家做持續性的互動(交談), 以實
  務的語言, 而非統計術語, 來做描述。

。資料分析流程
                                    理論
                                         ↘
  原始資料 ==> 資料檢核 ==> 較好的資料 ==> 模型識別 -----> 模型配適
                                       ↗          ↖      ╱
                                   更好的資料         ╲  ↙
                                      ↖            模型診斷
                                      更多資料╴╴╴ ╱  ↖
                                      檢核                 ╲
                                                       理論的合理差異

。應注意事項:

(A) 不確定性
    無法量化的資料相關、偏誤、系統性誤差、隱藏變數、多重分
    析(如模型選擇)等, 使估計結果有難以評估的不確定性。
    一個良好對策是採用交叉驗証(cross validation)。但要記得:
    在用分割樣本做交叉驗証時, 莫死守「隨機」平分的方法, 而
    應採某些表面隨機, 但兩子樣本可能有系統性差異的分法。
    Eg.: 樣本來自10個學校。分割時以5個學校當驗証樣本, 而非
         每個學校隨機取一半。
                                          
(B) 簡單性原則
    在能達到目的的原則下, 儘可能簡單。簡單的方法易於解釋且
    較不易出差錯。不過, 勿僅求簡單而忽略資料內涵及問題本身
    的複雜性。
    例如: 只看兩變數間的簡單關聯, 可能會受誤導! 因為有其他
      變數可能同時和你所考慮的這兩個變數有高度關聯。(想一想
      簡單迴歸和複迴歸)
                                                                                
(C) 「假設(assumption)」: 你必須做假設, 但別相信它!
    (Note: 「假說」: hypothesis, 「假設」: assumption)
                                                                                
[報告撰寫]

。結果若不適當精簡彙總, 很容易就被淡忘, 或被曲解。

。一個重要而容易被忽視的事實: 寫一份關於設計或分析
  結果的報告, 可強迫當事者彙總他已做的。在這過程中,
  常可顯露有哪裡疏忽了或做錯了, 因而可在進行進一步
  工作時予以修正。

。對於報告寫作的建議:
  -- 不要寫史詩 (don't write an odyssey).
  -- 你的報告是寫給諮詢者 (非統計專業的人) 看的。因此, 說明
     你對問題的瞭解(結果), 而比較少強調如何得到(計算細節)。
  -- 給予結果實務的描述, 用諮詢者能輕易瞭解的語言。
  -- (正如資料分析一般) 儘可能精簡, 但又不遺落重要細節。
  -- 報告中要包含重要結果的彙總表。
  -- 對研究主題學習到一些東西。
  -- 所有圖表要加標題, 使圖表本身能被看懂(而不需參考文章)。
  -- 小心「假設」, 永遠記住「假設從來都不是真的」。

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 等死的老賊 的頭像
    等死的老賊

    劉應興的部落格

    等死的老賊 發表在 痞客邦 留言(0) 人氣()