Analysis of Variance (ANOVA) ในหัวข้อนี้จะเป็นการพิสูจน์หาความแตกต่างของค่าเฉลี่ย (Mean) เช่นเดียวกัน เพียงแต่เราจะวิเคราะห์ความแตกต่างดังกล่าวโดยใช้ค่า ความแปรปรวน (Variance) แทนที่จะใช้ค่าเฉลี่ย และ T-Test ซึ่งการวิเคราะห์หาความแตกต่างของค่ากลางระหว่างประชากรโดยการวิเคราะห์ผ่านค่าความแปรปรวน (Variance) เราเรียกว่า Analysis of Variance หรือเรียกง่ายๆว่า ANOVA ข้อเด่นของ ANOVA
ดังนั้น ก่อนทำการวิเคราะห์ข้อมูลโดยใช้ ANOVA ผู้วิเคราะห์จำเป็นต้องทำการทดสอบความเป็นการกระจายแบบปกติของข้อมูล (Normality test) ว่าข้อมูลทุกประชากรมีการกระจายแบบปกติ และ ทดสอบความความแตกต่างของค่าความผันแปร (Homogeneities of Variance Test) เพื่อให้แน่ใจว่า ไม่มีความแตกต่างกัน ทุกประชากร ดังนั้น ข้อกำหนดดังกล่าวจึงดูอาจจะเป็นเรื่องยุ่งยากไปซักหน่อย หากจะใช้ ANOVA ในการวิเคราะห์ แต่ก็เป็นสิ่งที่หลีกเลี่ยงไม่ได้ ถ้าหากเรามีข้อมูลมากกว่า 2 ประชากร หรือมากกว่า 1 ปัจจัย เพื่อให้เห็นภาพ ผู้เขียนขอยกตัวอย่างตารางต่อไปนี้ เพื่อให้เข้าใจคำว่า ประชากร (Population) คำว่าปัจจัย (Factor) และคำว่า ผลกระทบซึ่งกันและกันของปัจจัยต่างๆ (Interaction) ตัวอย่าง 1. ผู้ทดสอบต้องการทราบว่า ถ้าขับรถด้วยความเร็วที่แตกต่างกัน เขาจะประหยัดเงินค่าน้ำมันได้จริงหรือไม่ วิธีที่เขาทำการทดลองคือ เติมน้ำมันเต็มถัง แล้วทดลองขับด้วยความเร็วแต่ละค่า จนน้ำมันหมดถัง แล้วดูว่าเขาสามารถขับรถได้รวมกันทั้งหมดกี่กิโลเมตร และแต่ละค่าความเร็วทดลองทั้งหมด 6 ครั้ง (น้ำมัน 6 ถัง) แล้วหาค่าระยะทางที่ได้เฉลี่ย ออกมาเป็น จำนวนกิโลเมตรที่ได้ ของแต่ละความเร็วที่ใช้ Factor Level Response Speed 60,70,80,90,100,110,120,130 Km/H Total Kilometers
เมื่อทำการทดลองเสร็จแล้ว ได้ข้อมูลดังนี้
ผู้ทดลองพบว่า ถ้าขับด้วยความเร็วเฉลี่ย 90 Km / H จะได้ระยะทางไกลที่สุด เมื่อใช้น้ำมัน เต็มถังเท่ากัน แน่นอนว่า สิ่งที่ผู้ทำการทดลองค้นพบ คือ ความเร็วของรถที่ขับมีผลกระทบต่ออัตราการกินน้ำมันของเครื่องยนต์ ตัวอย่างที่ 2. ต่อจากตัวอย่างที่ 1. ผู้ทำการทดลองต้องการทราบว่า ถ้าเขาบรรทุกน้ำหนักด้วย อัตราการกินน้ำมันในช่วงแต่ละความเร็วจะเปลี่ยนแปลงเป็นอย่างไร เขาจึงกำหนดการทดลองขึ้นมาใหม่ โดยมีปัจจัย เรื่องน้ำหนักบรรทุกเข้ามาเกี่ยวข้อง Speed 70,90,110 Km/H Total Kilometers Weight 60, 200 Kg เมื่อทำการทดลองเสร็จแล้ว ได้ข้อมูลดังนี้
เราจะพบว่า ที่ความเร็วต่ำ ผลกระทบของน้ำหนักบรรทุกต่ออัตราการกินน้ำมันจะยังน้อยอยู่ แต่ที่ความเร็วสูง ผลกระทบต่ออัตราการกินน้ำมันจะยิ่งสูงขึ้น จากตัวอย่างเราจะเห็นว่า
การตั้งสมมติฐาน เช่นเดียวกับการใช้ T-Test ในการทดสอบสมมติฐาน เราจำเป็นต้องเริ่มต้นด้วยการตั้งสมมติฐาน ข้อกำหนด Null hypothesis ของ ANOVA จะเป็นดังนี้ Ho: ค่ากลางของประชากร (กระบวนการ) ไม่แตกต่างกัน ในขณะที่ Alternative Hypothesis เราจะสนใจว่า ในหลายๆประชากรนั้น แค่เพียง 2-ประชากรเกิดความแตกต่าง ก็จะถือว่าสมมติฐานนั้นถูกปฎิเสธ Ha: อย่างน้อยเพียง 2 ประชากรมีความแตกต่างกัน
หรือสามารถเขียนสมมติฐาน ได้ดังนี้ Ho : m1=m2=m3= =mk Ha : At least 2 of mi s are different. ดังนั้น จากตัวอย่างที่ 1 เราจะสามารถตั้งสมมติฐานได้ดังนี้ Ho: ค่าระยะทางรวมของแต่ละความเร็วที่ใช้ไม่มีความแตกต่างกัน Ha: ค่าระยะทางรวมของแต่ละความเร็วที่ใช้มีความแตกต่างกัน หรือ Ho: m60 = m70 = m80 = m90 = m100 = m110 = m120 = m130 Ha: At least 2 are different. รูปต่อไปนี้จะแสดงค่าความเร็วที่ได้แต่ละครั้งแล้วนำมาเปรียบเที่ยบให้เห็นภาพ เพื่อความเข้าใจที่ง่ายขึ้น
แต่ละจุดที่เห็นนั้นคือตัวอย่าง (Sample) หลักการของ ANOVA คือเปรียบเทียบ Variation ที่เกิดจากการเอาค่ากลางทุกประชากร มาเป็นกลุ่มเดียวกัน (Between samples variation) กับ Variation ที่เกิดขึ้นในแต่ละกลุ่มตัวอย่าง (Within samples variation) ดังสมการต่อไปนี้
และเมื่อเรานำค่าเฉลี่ยของแต่ละประชากรมาบวกกันและหารด้วยจำนวนค่าเฉลี่ยที่นำมาบวกกัน ก็จะได้ค่าเฉลี่ยของข้อมูลทั้งหมดจากทุกประชากร และเมื่อหาค่า Standard deviation เราก็จะเรียกว่า Between-sample variation
|