Analysis of Variance (ANOVA)

ในหัวข้อที่ผ่านมาจะเป็นการวิเคราะห์ค่าเฉลี่ย (Mean) โดยที่เราอยากรู้ว่ามีความแตกต่างกันหรือไม่ และเราก็ใช้ตัวทดสอบทางสถิติ ที่เรียกว่า T- Test

 ในหัวข้อนี้จะเป็นการพิสูจน์หาความแตกต่างของค่าเฉลี่ย (Mean) เช่นเดียวกัน เพียงแต่เราจะวิเคราะห์ความแตกต่างดังกล่าวโดยใช้ค่า ความแปรปรวน (Variance) แทนที่จะใช้ค่าเฉลี่ย และ T-Test ซึ่งการวิเคราะห์หาความแตกต่างของค่ากลางระหว่างประชากรโดยการวิเคราะห์ผ่านค่าความแปรปรวน (Variance) เราเรียกว่า “Analysis of Variance “ หรือเรียกง่ายๆว่า ANOVA

 ข้อเด่นของ ANOVA

  1. สามารถวิเคราะห์ความแตกต่างของประชากรได้พร้อมกันมากกว่า 2 ประชากร ซึ่ง ถ้าเราใช้ T-Test จะทำได้มากที่สุดแค่ 2 ประชากรเท่านั้น

  2. สามารถวิเคราะห์ได้มากกว่า 1 ปัจจัย (Factor) ซึ่ง T-Test จะทำได้เพียงปัจจัยเดียวเท่านั้น เช่น อุณหภูมิ  (Temperature) ความเร็ว (Speed) ความกด (Pressure)

  3. สามารถใช้วิเคราะห์เพื่อให้เห็นผลกระทบซึ่งกันและกันของปัจจัยต่างๆ (Interaction) ได้ด้วย

  ข้อกำหนดของ ANOVA

  1. ข้อมูลของทุกๆ ประชากร จะต้องมีการกระจายของข้อมูลแบบปกติ (Normal distribution) เท่านั้น

  2. ค่าความผันแปร (Variation) ของข้อมูล แต่ละประชากรจะต้องไม่แตกต่างกันอย่างมีนัยสำคัญ เท่านั้น

ดังนั้น ก่อนทำการวิเคราะห์ข้อมูลโดยใช้ ANOVA ผู้วิเคราะห์จำเป็นต้องทำการทดสอบความเป็นการกระจายแบบปกติของข้อมูล (Normality test) ว่าข้อมูลทุกประชากรมีการกระจายแบบปกติ และ ทดสอบความความแตกต่างของค่าความผันแปร (Homogeneities of Variance Test) เพื่อให้แน่ใจว่า ไม่มีความแตกต่างกัน ทุกประชากร

ดังนั้น ข้อกำหนดดังกล่าวจึงดูอาจจะเป็นเรื่องยุ่งยากไปซักหน่อย หากจะใช้ ANOVA ในการวิเคราะห์ แต่ก็เป็นสิ่งที่หลีกเลี่ยงไม่ได้ ถ้าหากเรามีข้อมูลมากกว่า 2 ประชากร หรือมากกว่า 1 ปัจจัย

เพื่อให้เห็นภาพ ผู้เขียนขอยกตัวอย่างตารางต่อไปนี้ เพื่อให้เข้าใจคำว่า ประชากร (Population) คำว่าปัจจัย (Factor) และคำว่า ผลกระทบซึ่งกันและกันของปัจจัยต่างๆ (Interaction)

ตัวอย่าง 1.  ผู้ทดสอบต้องการทราบว่า ถ้าขับรถด้วยความเร็วที่แตกต่างกัน เขาจะประหยัดเงินค่าน้ำมันได้จริงหรือไม่  วิธีที่เขาทำการทดลองคือ เติมน้ำมันเต็มถัง แล้วทดลองขับด้วยความเร็วแต่ละค่า จนน้ำมันหมดถัง แล้วดูว่าเขาสามารถขับรถได้รวมกันทั้งหมดกี่กิโลเมตร และแต่ละค่าความเร็วทดลองทั้งหมด 6 ครั้ง (น้ำมัน 6 ถัง) แล้วหาค่าระยะทางที่ได้เฉลี่ย ออกมาเป็น จำนวนกิโลเมตรที่ได้ ของแต่ละความเร็วที่ใช้

 

                       Factor                     Level                                                          Response

                       Speed                   60,70,80,90,100,110,120,130  Km/H     Total Kilometers

 

เมื่อทำการทดลองเสร็จแล้ว ได้ข้อมูลดังนี้

Speed (Km/Hour) Total Kilometer for 1 full fuel tank
60 584
70 609
80 605
90 654
100 588
110 524
120 489
130 460

 

ผู้ทดลองพบว่า ถ้าขับด้วยความเร็วเฉลี่ย 90 Km / H จะได้ระยะทางไกลที่สุด เมื่อใช้น้ำมัน เต็มถังเท่ากัน แน่นอนว่า สิ่งที่ผู้ทำการทดลองค้นพบ คือ ความเร็วของรถที่ขับมีผลกระทบต่ออัตราการกินน้ำมันของเครื่องยนต์

ตัวอย่างที่ 2.  ต่อจากตัวอย่างที่ 1. ผู้ทำการทดลองต้องการทราบว่า ถ้าเขาบรรทุกน้ำหนักด้วย อัตราการกินน้ำมันในช่วงแต่ละความเร็วจะเปลี่ยนแปลงเป็นอย่างไร เขาจึงกำหนดการทดลองขึ้นมาใหม่ โดยมีปัจจัย เรื่องน้ำหนักบรรทุกเข้ามาเกี่ยวข้อง

                        Factor                       Level                                  Response

                       Speed                  70,90,110 Km/H                           Total Kilometers

                       Weight                 60, 200   Kg

 

เมื่อทำการทดลองเสร็จแล้ว ได้ข้อมูลดังนี้

Speed (Km/Hr) Weight (Kg) Total Kilometer
70 60 606
200 582
90 60 640
200 598
110 60 514
200 487

 

เราจะพบว่า ที่ความเร็วต่ำ ผลกระทบของน้ำหนักบรรทุกต่ออัตราการกินน้ำมันจะยังน้อยอยู่ แต่ที่ความเร็วสูง ผลกระทบต่ออัตราการกินน้ำมันจะยิ่งสูงขึ้น

 จากตัวอย่างเราจะเห็นว่า

  1. คำว่าปัจจัย (Factor) หมายถึงตัวแปรที่เราต้องการทราบว่ามีผลกระทบต่อสิ่งที่เราสนใจหรือไม่ ในตัวอย่างที่ผ่านมาก็คือ ความเร็ว (Speed) และ น้ำหนักบรรทุก (Weight) ซึ่งบางครั้งก็ใช้คำว่า Treatment ซึ่งหมายถึงลักษณะการควบคุมตัวแปรในการทดลอง แทนคำว่า Factor และบางครั้งก็ใช้คำว่า Way แทนด้วยเหมือนกัน
  2. Response คือตัวชี้วัด ผลการทดลอง โดยส่วนมากเราจะใช้เพียง 1 Response ในตัวอย่างที่ผ่านมา ค่าจำนวนระยะทางรวม เมื่อหมดน้ำมัน เต็มถัง หนึ่งถัง คือตัวชี้วัด แต่ในความเป็นจริง เราสามารถใช้ตัวชี้วัดได้มากกว่า 1 เพื่อใช้เป็นตัวชี้วัดมุมมองอื่นๆ ก็ได้ เช่น ในตัวอย่างนี้อาจจะใช้อัตราค่าใช้จ่ายในการซ่อมบำรุง อัตราการสึกของดอกยางของล้อ เพิ่มเข้ามาอีก เป็นต้น
  3. Level หมายถึง ประชากรแต่ละประชากรที่เรากำลังทำการศึกษาผลกระทบของปัจจัย ซึ่งถ้าย้อนกลับไปเปรียบเทียบกับ 2-Sample T test ก็จะมีเพียง 2 Level เท่านั้น ซึ่งบางครั้งก็ใช้คำว่า Treatment level แทน

 การตั้งสมมติฐาน

เช่นเดียวกับการใช้ T-Test ในการทดสอบสมมติฐาน เราจำเป็นต้องเริ่มต้นด้วยการตั้งสมมติฐาน ข้อกำหนด Null hypothesis ของ ANOVA จะเป็นดังนี้

                              Ho: ค่ากลางของประชากร (กระบวนการ) ไม่แตกต่างกัน

 ในขณะที่ Alternative Hypothesis เราจะสนใจว่า ในหลายๆประชากรนั้น แค่เพียง 2-ประชากรเกิดความแตกต่าง ก็จะถือว่าสมมติฐานนั้นถูกปฎิเสธ

                              Ha: อย่างน้อยเพียง 2 ประชากรมีความแตกต่างกัน

 

หรือสามารถเขียนสมมติฐาน ได้ดังนี้

                                       Ho : m1=m2=m3=…=mk

                                       Ha : At least 2 of mi ‘s are different.

 ดังนั้น จากตัวอย่างที่ 1 เราจะสามารถตั้งสมมติฐานได้ดังนี้

                     Ho: ค่าระยะทางรวมของแต่ละความเร็วที่ใช้ไม่มีความแตกต่างกัน

                     Ha: ค่าระยะทางรวมของแต่ละความเร็วที่ใช้มีความแตกต่างกัน

 หรือ

                          Ho: m60 = m70 = m80 = m90 = m100 = m110 = m120 = m130

                                     Ha: At least 2 are different.

  

รูปต่อไปนี้จะแสดงค่าความเร็วที่ได้แต่ละครั้งแล้วนำมาเปรียบเที่ยบให้เห็นภาพ เพื่อความเข้าใจที่ง่ายขึ้น 

 

 

แต่ละจุดที่เห็นนั้นคือตัวอย่าง (Sample)

หลักการของ ANOVA คือเปรียบเทียบ Variation ที่เกิดจากการเอาค่ากลางทุกประชากร มาเป็นกลุ่มเดียวกัน (Between samples variation) กับ Variation ที่เกิดขึ้นในแต่ละกลุ่มตัวอย่าง (Within samples variation) ดังสมการต่อไปนี้

 

 

ถ้าเรานำข้อมูลของแต่ละประชากรมาหาค่าเฉลี่ย (X1,X2….X8) และในแต่ละกลุ่ม เราหา Standard deviation เราจะเรียกว่า Within-sample variation

และเมื่อเรานำค่าเฉลี่ยของแต่ละประชากรมาบวกกันและหารด้วยจำนวนค่าเฉลี่ยที่นำมาบวกกัน ก็จะได้ค่าเฉลี่ยของข้อมูลทั้งหมดจากทุกประชากร และเมื่อหาค่า Standard deviation เราก็จะเรียกว่า Between-sample variation

 


[ HOME ]             [ CONTENTS ] 

                                            

Hosted by www.Geocities.ws

1