การทดสอบความแตกต่างระหว่างค่ากลางของสองประชากรที่มีการกระจายแบบปกติและอิสระต่อกัน (Test Concerning a Difference Between Two Means of two normal population : Independent Samples)  

โดยส่วนมากเราต้องการทดสอบสมมติฐานเกี่ยวกับความแตกต่างของสองประชากร  ซึ่งถ้าใช้คำว่าประชากร บางคนอาจจะมองไม่เห็นภาพ ถ้าจะอธิบายว่า เราต้องการพิสูจน์ ความแตกต่างของสองกระบวนการ (Processes)  หรือต้องการพิสูจน์ผลการทดลองของสองวิธีการ ( Treatments) ว่าตัวแปรหรือผลการทดลองที่เราสนใจ (Response) มีความแตกต่างกันอย่างมีนัยสำคัญหรือไม่ หรือว่าไม่แตกต่างกัน 

ตัวอย่าง ต้องการพิสูจน์ ว่าต้นกล้าของพืช A ที่เพาะชำโดยใช้ส่วนผสมของดินแบบสูตร 1 สูงเท่า น้อยกว่า หรือ มากกว่า เมื่อเพาะชำพืชแบบ A นี้โดยใช้ส่วนผสมดิน แบบสูตร 2  เป็นต้น  คำว่าประชากร ในตัวอย่างนี้คือค่าส่วนสูงของต้นกล้าของพืช A แน่นอนว่าคนที่ทำการศึกษาคงไม่ทดลองแค่ต้นเดียวแน่ๆ นั่นคือเขาจะต้องทดลองปลูกต้นกล้าพืช A ในส่วนผสมดิน แต่ละสูตร มากพอสมควร ซึ่งการที่เขาเพาะกล้าพืช โดยใช้สูตรของดินเพาะปลูกต่างกัน 2 สูตร นั่นก็คือมี 2 Treatments นั่นเอง หรืออาจจะมองว่าเป็น Process การเพาะกล้าไม้ 2 Process ก็ได้เช่นเดียวกัน คำว่า อิสระในตัวอย่างก็คือ แต่ละ Treatment ต้นกล้าซึ่งเป็นสิ่งที่ผู้ทดลองสนใจ ไม่ใช่ต้นเดียวกัน แต่ละต้นก็มีอิสระในการงอก ไม่เกี่ยวข้องกัน  แต่ถ้าดูดีๆ ผู้ทำการทดลองจะต้องกำจัดความแตกต่าง หรือปัจจัยอื่นๆ ที่อาจจะมีผลกระทบกับผลการทดลองออกไปให้มากที่สุด เช่น จะต้องเลือกดินก่อนใส่ส่วนผสมเหมือนกัน เลือกชนิดของพืชที่จะเพาะเป็นแบบเดียวกัน เมล็ดพันธ์ถูกคละกัน ก่อนแบ่งออกเป็นสองกลุ่มโดยวิธีการสุ่ม เริ่มเพาะวันเดียวกัน เวลาเดียวกัน เก็บไว้ในโรงเพาะชำเดียวกัน รดน้ำ ควบคุม อุณหภูมิ ให้เหมือนกัน พูดง่ายๆคือ ปัจจัยอื่นๆ นอกจากสูตรผสมของดินที่ใช้เพาะ  ผู้ทดลองจะต้องควบคุมให้เหมือนกันให้มากที่สุด แม้แต่สุดท้าย เมื่อถึงกำหนดวัดส่วนสูง จะต้องวัดโดยใช้เครื่องมือวัดอันเดียวกัน คนเดียวกัน เวลาวัดเดียวกัน เพื่อกำจัดความแตกต่างอื่นๆ ที่เราไม่สนใจอยากรู้ออกไปให้หมด ให้เหลือแต่ความแตกต่างที่เราต้องการเห็นผลกระทบ คือสูตรผสมของดินเพาะกล้า การกระทำดังกล่าวมาเราเรียกว่า Treatment ในวิชาสถิติ คำว่า Treatment นี้ได้มาจากการนำศาสตร์แขนงนี้ไปประยุกต์ใช้ในการทำวิจัยด้าน พืชศาสตร์ จึงเกิดคำศัพท์ Treatment ขึ้นมา แม้ภายหลังมีการวิจัยด้านวิศวกรรม หรือด้านอื่นๆ คำว่า Treatment ก็ยังถูนำมาใช้อย่างกว้างขวาง จนถึงบัดนี้

เมื่อผู้ทำการศึกษา ได้วัดค่าส่วนสูงของต้นกล้า มาแล้ว เราจะกำหนดว่า

           m1 : คือค่าเฉลี่ยของ Population 1  หรือในตัวอย่างจะเป็นค่าส่วนสูงโดยเฉลี่ยของต้นกล้าโดยใช้สูตรผสมแบบที่ 1

          m2 : คือค่าเฉลี่ยของ Population 2  หรือในตัวอย่างจะเป็นค่าส่วนสูงโดยเฉลี่ยของต้นกล้าโดยสูตรผสมแบบที่ 2

ในทางปฏิบัติ เนื่องจากผู้ทดลองได้ทำการสุ่มตัวอย่างออกมาวัดค่าส่วนสูง ซึงแน่นอนว่าเขาก็ไม่สามารถวัดต้นกล้าพืช ได้ทุกต้น เมื่อเป็นเช่นนี้จึงเท่ากับเป็นการ อนุมาน ( Inference ) ไปหาประชากรต้นกล้าพืชทั้งหมด โดยผ่านการวิเคราะห์ข้อมูลของตัวอย่าง เราจะกำหนดให้

          n1 : คือจำนวนตัวอย่างกลุ่มที่ 1 หรือในตัวอย่างนี้ก็คือจำนวนตัวอย่างต้นกล้าพืช ที่ใช้สูตรผสมแบบที่ 1

          n2 : คือจำนวนตัวอย่างกลุ่มที่ 2 หรือในตัวอย่างนี้ก็คือจำนวนตัวอย่างต้นกล้าพืช ที่ใช้สูตรผสมแบบที่ 2

         X1 : คือค่าเฉลี่ยตัวอย่างกลุ่มที่ 1 หรือในตัวอย่างนี้ก็คือส่วนสูงโดยเฉลี่ยของตัวอย่างต้นกล้าพืช ที่ใช้สูตรผสมแบบที่ 1 

          X2 : คือค่าเฉลี่ยตัวอย่างกลุ่มที่ 2 หรือในตัวอย่างนี้ก็คือส่วนสูงโดยเฉลี่ยของตัวอย่างต้นกล้าพืช ที่ใช้สูตรผสมแบบที่ 2 

         S21 : คือค่า Variance จากตัวอย่างกลุ่มที่ 1 หรือในตัวอย่างนี้ก็คือค่า Variance ของส่วนสูงของตัวอย่างต้นกล้าพืช ที่ใช้สูตรผสมแบบที่ 1

          S22 : คือค่า Variance จากตัวอย่างกลุ่มที่ 2 หรือในตัวอย่างนี้ก็คือค่า Variance ของส่วนสูงของตัวอย่างต้นกล้าพืช ที่ใช้สูตรผสมแบบที่ 2

 

การทดสอบสมมติฐาน

ในการทดสอบสมมติฐานเราจะแยกการทดสอบออกเป็นสองกรณี คือ กรณีค่า Variance ของข้อมูลทั้งสองกลุ่มเท่ากัน และกรณีค่า Variance ไม่เท่ากัน

กรณี Variance เท่ากัน ( s21=s22)

สมมติเราต้องการทดสอบสมมติฐานที่ว่าค่า  m1m2หรือไม่ แน่นอนว่าเราจะรู้ได้ว่าเท่าหรือต่างกันเราสามารถหาจากผลต่าง  m1- mถ้าผลต่างเท่ากับ 0 (ศูนย์) ก็บอกได้ว่าสมมติฐานนั้นเป็นจริง แต่แน่นอนว่า ผลต่างนั้นโอกาสจะเท่ากับ 0 เป็นไปได้ยาก แต่บางครั้งความรู้สึกของผู้ที่กำลังทดสอบสมมติฐานจะบอกว่า แม้ไม่เท่ากับ 0 แต่เขาก็ยังจะยอมรับได้ว่า m1m2 ยังเป็นจริงอยู่ นั่นก็แปลว่า เราจะยอมรับให้ ผลต่าง อยู่ในช่วงๆ หนึ่ง รอบๆ ค่า 0 ในทางบวกและลบ เท่าๆกัน ดังสมการ

เมื่อเป็นเช่นนี้ ค่า  D ก็จะเป็น Interval และค่าจะมีลักษณะเป็น  t- Distribution ดังนั้นเมื่อเราจะทดสอบสมมติฐานความแตกต่างของ m1และ m2 เราจะกระทำผ่านผลต่างดังกล่าว ว่ามีค่าไม่เท่ากับ 0 อย่างมีนัยสำคัญหรือไม่นั่นเอง 

ถ้าสมมติมีข้อมูลที่มีการกระจายแบบปกติ (Normal) อยู่สองข้อมูลที่ไม่รู้ค่าที่แท้จริงของ m1และ m2 ในขณะที่ไม่รู้ค่าที่แท้จริงของ s21และ s22 รู้แต่ว่า s21=s22  เราต้องการทดสอบสมมติฐาน

เรากำหนดตัวประมาณการค่ากลางของประชากรจากค่าเฉลี่ยของตัวอย่าง ดังนี้ 

เรากำหนดตัวประมาณการค่า Variance ของประชากรจาก Variance ของตัวอย่าง ดังนี้ 

แต่ถ้าเรารู้ว่า  s21=s22  แปลว่า S21=S22  ด้วยเช่นกัน ดังนั้น  ถ้าเรากำหนดให้ S2P  เป็น Pooled estimator ของ s2   ดังนั้น 

 

จากหัวข้อ 1-Sample t หรือการทดสอบ ค่ากลางของหนึ่งประชากร กับค่าคงที่ มีสมการว่า

เมื่อเราจะคิดแบบสองประชากรจะได้สมการเป็น

 อาจจะสงสัยว่าทำไมตัวส่วนจึงดูแปลกๆ เพราะโดยหลักแล้วค่า Standard deviation นั้นไม่สามารถจะนำมาบวกกันโดยตรงได้ และไม่สามารถจะนำมาลบกันได้ด้วย (เมื่อจำนวนข้อมูลเพิ่ม Standard deviation มีแต่เพิ่มอย่างเดียวไม่มีลดลง ) 

สมการดังข้างบนจึงไม่สามารถใช้ได้  จะต้องใช้สมการดังนี้ต่อไปนี้ถึงจะถูกต้อง

ดังนั้นการบวกกันดังต่อไปนี้จึงผิด

จะต้องเป็นดังนี้ถึงจะถูกต้อง

 เมื่อกำหนดให้ 

ดังนั้น

ซึ่ง t คือตัวทดสอบสถิติของ กรณีการทดสอบค่ากลางของสองกลุ่มตัวอย่าง (ประชากร)

ในกรณีที่เราถือว่า   D = 0   ดังนั้น จะได้ว่า 

เมื่อใช้  t-Distribution ในการทดสอบสมมติฐาน จึงจำเป็นต้องรู้ค่า Degree of freedom 

การตั้งสมมติฐาน 

การตั้งสมมติฐานมีหลักการเช่นเดียวกันกับกรณีการทดสอบค่ากลางของหนึ่งประชากรกับค่าคงที่ ดังต่อไปนี้

ในกรณีทดสอบสองด้าน ( Two-tailed )

 t- Distribution ที่จะใช้สำหรับทดสอบนี้ก็คือ ผลต่าง m1= m2 ซึ่งจริงๆ ควรจะเท่ากับ 0 เราถึงจะยอมรับสมมติฐานหลัก แต่เราใช้หลัก Confidence interval ก็จะได้ว่า ผลต่างที่ไม่เท่ากับ 0 แต่น้อยหรือมากกว่า ในระดับหนึ่งภายใน Interval นั้นเราจะยังยอมรับสมมติฐานหลักอยู่

 

เราจะยังยอมรับสมมติฐานหลัก H0:m1=m2 ถ้า

ในกรณีทดสอบด้านเดียว ( One-tailed )

ในกรณีที่เราให้สมมติฐานทางเลือก (Alternative hypothesis) เป็นมากกว่าหรือน้อยกว่า เราเรียกว่าการทดสอบสมมติฐานแบบ One tailed ซึ่งเป็นดังต่อไปนี้

               ทดสอบด้านมากกว่า

เมื่อเทียบกับ t-Distribution จะเป็นดังรูปต่อไปนี้

เราจะยังยอมรับสมมติฐานหลัก H0:m1=m2 ถ้า

            ถ้าทดสอบด้านน้อยกว่า

เมื่อเทียบกับ t-Distribution จะเป็นดังรูปต่อไปนี้

เราจะยังยอมรับสมมติฐานหลัก H0:m1=m2 ถ้า

 

จะเห็นว่า วิธีการทดสอบสมมติฐาน การทดสอบค่ากลางของสองประชากรก็จะคล้ายกับกรณีทดสอบค่ากลางประชากรเดียว แตกต่างกันในรายละเอียดบ้างนิดหน่อย  ที่สำคัญผู้ที่จะทำการทดสอบสมมติฐานจะต้องมั่นใจว่า

                1. ข้อมูลของทั้งสองกลุ่มที่จะนำมาทดสอบสมมติฐานต้องเป็นอิสระต่อกัน และแต่ละตัวข้อมูลในกลุ่มต้องถูกเก็บตัวอย่างออกมาโดยการสุ่ม

                2. ข้อมูลตัวอย่างทั้งสองกลุ่มดังกล่าว จะต้องมีการกระจายตัวเป็นแบบปกติ (Normal distribution) เท่านั้น

 การทดสอบสมมติฐานความแตกต่างของค่ากลางของสองประชากรอิสระนี้ รู้จักในชื่อง่ายๆว่า 2-Sample t test

ตัวอย่าง  จากหัวข้อที่ผ่านมา ผู้วิจัยต้องการพิสูจน์ ว่าต้นกล้าของพืช A ที่เพาะชำโดยใช้ส่วนผสมของดินแบบสูตร 1 สูงเท่า น้อยกว่า หรือ มากกว่า เมื่อเพาะชำพืชแบบ A นี้โดยใช้ส่วนผสมดิน แบบสูตร 2  โดยต้องการความเชื่อมั่นในผลการทดสอบที่ 95%  จึงทำการสุ่มกล้าไม้พืช A จากกลุ่มที่ใช้สูตรผสมดินแบบที่ 1 และ 2 ออกมากลุ่มละ 15 ตัวอย่าง(ต้น) แล้ววัดส่วนสูงของต้นกล้า โดยวัดจากโคนลำต้นส่วนที่เริ่มโผล่พ้นดิน จนถึงส่วนของใบ ที่สูงที่สุด โดยไม่มีการแตะต้องใบของต้นกล้าไม้ในขณะวัด  ปรากฏผลการวัดส่วนสูงดังนี้ (หน่วยเป็น มิลลิเมตร)  โดยที่ข้อมูล Group 1 คือส่วนสูงของต้นกล้าไม้ ที่เพาะโดยใช้สูตรผสมดินแบบที่ 1 และข้อมูล Group 2 คือส่วนสูงของต้นกล้าไม้ ที่เพาะโดยใช้สูตรผสมดินแบบที่ 2 

Group_1

Group_2

228

217

220

228

232

210

240

205

239

218

244

209

213

209

228

204

239

213

222

232

225

213

217

197

216

204

222

207

224

213

 1.   เริ่มแรกต้องทำการทดสอบ ข้อมูลทั้งสองกลุ่มเสียก่อนว่ามีการกระจายเป็นแบบ Normal distribution หรือไม่ (โปรดดูในหัวข้อการทดสอบความเป็นการกระจายแบบปกติ Normality Test)  จากข้อมูลทั้งสองกลุ่มผลการทดสอบ ได้ดังนี้

จากกราฟ Propability plot ของทั้งสองกลุ่มจะสรุปได้ว่า ข้อมูลส่วนสูงของต้นกล้าพืชทั้งสองกลุ่มที่สุ่มตัวอย่างมานั้น มีการกระจายเป็นแบบปกติ (Normal distribution) 

2. คำนวณหาค่า Sample Statistic ของข้อมูลทั้งสองกลุ่ม  ได้ดังนี้

( ใช้โปรแกรม Minitab ) จะได้ดังนี้

Descriptive Statistics: Group_1, Group_2

Variable       N          Mean       StDev

Group_1        15        227.27      9.64

Group_2        15        211.93      9.14

 

หากใช้ Microsoft Excel โดยใช้ Analysis Tools หา Summary Descriptive จะได้ดังนี้ (โปรดดูวิธีการในหัวข้อการประยุกต์ใช้ Microsoft Excel )

Group_1

Group_2

Mean

227.2666667

 

Mean

211.9333333

Median

225

Median

210

Mode

228

Mode

213

Standard Deviation

9.639699659

 

Standard Deviation

9.137572878

Sample Variance

92.92380952

Sample Variance

83.4952381

Minimum

213

Minimum

197

Maximum

244

Maximum

232

Count

15

Count

15

3. กำหนดสมมติฐาน

โดยที่ m1 คือค่าเฉลี่ยส่วนสูงของต้นกล้าที่เพาะโดยใช้สูตรผสมดินแบบที่ 1  และ m2 คือค่าเฉลี่ยส่วนสูงของต้นกล้าที่เพาะโดยใช้สูตรผสมดินแบบที่ 2

4.  เลือกตัวทดสอบสมมติฐาน 

5. คำนวณค่า  Sp  จากสมการ

6. คำนวณค่า  t  จากสมการ

 7. คำนวณหา df 

df= 28

8. สรุปผลการทดสอบสมมติฐาน 

จากตาราง t-Distribution ที่ df=28 และ a=0.025 (มาจาก 0.05/2 ) จะได้   t0.025,28= 2.048

ดังนั้น เมื่อ  t0 >t0.025,28 จึงปฏิเสธ สมมติฐาน หลัก H0:m1=m2  นั่นคือจากผลการทดลองสรุปว่า ต้นกล้าพืช A ที่ปลูกโดยส่วนผสมดินสองสูตร มีส่วนสูงต่างกันอย่างมีนัยสำคัญ 

ถ้าใช้โปรแกรม Minitab ในการคำนวณจะได้ดังนี้ 

Two-sample T for Group_1 vs Group_2

          N     Mean      StDev      SE Mean

Group_1   15   227.27      9.64       2.5

Group_2   15   211.93      9.14       2.4

Difference = mu Group_1 - mu Group_2

Estimate for difference: 15.33

95% CI for difference: (8.31, 22.36)

T-Test of difference = 0 (vs not =): T-Value = 4.47 P-Value = 0.000 DF = 28

Both use Pooled StDev = 9.39

 

เมื่อค่า P-Value น้อยกว่า a (0.05) จึงปฏิเสธ สมมติฐาน หลัก H0:m1=m2  นั่นคือจากผลการทดลองสรุปว่า ต้นกล้าพืช A ที่ปลูกโดยส่วนผสมดินสองสูตร มีส่วนสูงต่างกันอย่างมีนัยสำคัญ 

้ถ้าใช้โปรแกรม Microsoft Excel ในการคำนวณจะได้ดังนี้ 

t-Test: Two-Sample Assuming Equal Variances

Variable 1

Variable 2

Mean

227.2666667

211.9333333

Variance

92.92380952

83.4952381

Observations

15

15

Pooled Variance

88.20952381

Hypothesized Mean Difference

0

df

28

t Stat

4.471049416

P(T<=t) one-tail

5.87831E-05

t Critical one-tail

1.701130259

P(T<=t) two-tail

0.000117566

t Critical two-tail

2.048409442

จาก Microsoft Excel ผลการวิเคราะห์จะให้ค่า P-value และ  t - Critical ( ta/2,df) ออกมาทั้ง การทดสอบแบบ Two-tailed และ One - tailed ด้วย ค่าที่เราใช้ในการสรุปผลการทดสอบ สามารถใช้ 

         1. P-Value :  โดย ถ้า P-Value น้อยกว่า a ก็ปฏิเสธสมมติฐานหลัก H0:m1=m2

         2. เปรียบเทียบ ค่า t (Statistic) ถ้ามากกว่า t Critical ก็ปฏิเสธสมมติฐานหลัก H0:m1=m2

   ทั้งสองวิธีนี้จะสรุปผลไปในแนวทางเดียวกันเสมอ ทั้งเราสามารถเลือกใช้เพียงวิธีใดวิธีหนึ่งในการสรุปผลการทดสอบสมมติฐาน

 

ถ้าผู้ทำการทดลองอยากสรุปว่า แล้วสูตรผสมดินเพาะชำนี้ สูตรไหนดีกว่า ก็ให้ย้อนกลับไปดูค่าส่วนสูงโดยเฉลี่ย จากข้อมูลจะพบว่า Group 1 จะมีส่วนสูงเฉลี่ยของต้นกล้าพืช A สูงกว่า จึงสรุปว่าสูตรผสมดินสูตร 1 ทำให้ต้นกล้าไม้โตเร็วกว่า สูตรที่ 2  แต่จะไม่สรุปว่าดีกว่าหรือไม่ เพราะคำว่าดีกว่าอาจจะต้องรวมถึง ใช้น้อยกว่าแต่ให้ผลผลิตมากกว่า ต้นกล้าไม้ทนต่อโรคพืชมากกว่า และอื่นๆ อีกหลายปัจจัย ซึ่งจะต้องเก็บข้อมูล ตามวัตถุประสงค์ที่ต้องการทราบ  ทั้งนี้ส่วนสูงของต้นกล้าถือเป็นเพียงปัจจัยหลักอันหนึ่งเท่านั้นที่ใช้เป็นตัวชี้วัด

 เกร็ดน่ารู้และน่าคิด

จากวิธีการทดสอบสมมติฐานที่ผ่านมาพอจะบอกได้ว่า เราตัดสินใช้ด้วยตัวเลข คือดูค่า P-value หรือไม่ก็เปรียบเทียบค่า t (statistic) กับค่า t- critical ซึ่งเราเรียกว่าการตัดสินใจเชิงปริมาณ ( Quantitative)   จากข้อมูลดังตัวอย่างที่ผ่านมา หากเรานำข้อมูล Group 1 และ Group 2 มาแสดงโดยใช้ Box plot จะได้ดังนี้

 

เมื่อท่านดูกราฟนี้แล้วท่านบอกได้ทันทีที่เห็นเลยว่า ส่วนสูงของต้นกล้าพืช A Group 1 สูงกว่า Group 2 แน่ๆ โดยไม่ต้องมีการคำนวณหาค่า t หรือ P-Value เลย นอกจากนั้นท่านยังเห็นลักษณะการกระจายของข้อมูล ค่าเฉลี่ยอยู่ตรงไหน สองกลุ่มนี้แตกต่างกันมากน้อยแค่ไหน ลักษณะเช่นนี้เราเรียกว่าการตัดสินใจโดยใช้ข้อมูลเชิงคุณภาพ (Qualitative)  

ผมเชื่อว่าผู้อ่านหลายท่านเห็นด้วยกับผมที่ว่า คนส่วนใหญ่จะจมอยู่กับตัวเลข จะต้องใช้ตัวเลขเพื่อเป็นหลักฐานในการสรุปผล โดยหารู้ไม่ว่า เป็นความเข้าใจที่ผิดพลาดอย่างมาก เพราะตามหลักแล้วจะต้องใช้ข้อมูลเชิง Qualitative ก่อน เมื่อให้ผลคลุมเครือ จึงใช้ข้อมูลแบบ Quantitative มาสนับสนุนทีหลัง 

มีกราฟหลายประเภท ที่ใช้ในการนำเสนอข้อมูล ในเชิงคุณภาพ ได้ดี  แล้วท่านละจะเลือกแบบไหน 

กรณี Variance ไม่เท่ากัน ( s21 ไม่เท่ากับ s22)

ในบางสถานะการณ์เราไม่สามารถประมาณให้ค่า variance ของข้อมูลของทั้งสองกลุ่มเท่ากันได้ เพราะค่าแตกต่างกันอย่างชัดเจน ตัวทดสอบสถิติจึงไม่สามารถใช้ได้กับ กรณีค่า Variance เท่ากัน แต่เราจะใช้

ถ้ากำหนดให้   D = 0

เมื่อเป็น t-Distribution ก็จำเป็นต้องหา Degree of freedom จาก

ตัวอย่าง  ในระหว่างการผลิตวงจรแผงวงจรไฟฟ้าสองแบบ วิศวกรต้องการทดสอบว่า แผงวงจรไฟฟ้าทั้งสองแบบ ต้องการกระแสไฟฟ้าเท่ากันหรือแตกต่างกัน  โดยได้ทำการสุ่มเก็บตัวอย่างแผงวงจรไฟฟ้าแบบที่ 1 มาจำนวน 15 ตัวอย่าง และแบบที่ 2 จำนวน 10 ตัวอย่าง ดังรายละเอียดต่อไปนี้  ให้ทดสอบสมมติฐาน โดยกำหนดให้ ระดับความเชื่อมั่นของการทดสอบที่ 90 %

                                  Design 1:       n1 = 15                    X1 =  24.2  mA             S21   = 10

                                  Design 2:       n2 = 10                    X2 =  23.9  mA             S22   = 20

1.  Parameter ที่ต้องการทดสอบ คือ ค่ากลางของปริมาณกระแสไฟฟ้า ที่แผงวงจรไฟฟ้าต้องการ (m1 , m2)

2. ตั้งสมมติฐาน 

3. ระบุค่านัยสำคัญ จากโจทย์ กำหนดความเชื่อมั่นที่ 90% ดังนั้น a=0.10 

4. เลือกตัวทดสอบสถิติ คือ

5.  หาค่า Degree of freedom  จาก

นั่นคือ ถ้า a=0.10 เราจะปฏิเสธสมมติฐานหลัก H0 : m1=m2 ถ้า t0 > ta/2,df  หรือถ้า    t 0< - ta/2,df

จากตาราง t  จะได้   t0.05,16=1.746

6. คำนวณหาค่า  t0  จาก

 

7.สรุปผลการทดสอบสมมติฐาน  เมื่อ  t0 = 0.18 ซึ่งมากกว่า  -1.746 และน้อยกว่า 1.746 จึงยอมรับสมมติฐานหลักที่ว่า H0 : m1=m2

นั่นคือ สรุปว่า แผงวงจรทั้งสองแบบ ต้องการกระแสไฟฟ้า ไม่แตกต่างกันนั่นเอง

ตัวอย่างโจทย์  หัวหน้าฝ่ายผลิตได้ทำการเก็บค่าน้ำหนักบรรจุของผงซักผ้า ในสายการผลิตขนาด 1500 กรัมต่อกล่อง มาจากสายการบรรจุสองสาย และต้องการพิสูจน์ทราบว่า เครื่องบรรจุผงซักผ้าทั้งสองเครื่องนั้นบรรจุปริมาณผงซักผ้าลงกล่องบรรจุ ในปริมาณเท่ากันหรือแตกต่างกันอย่างไร จึงสุ่มจำนวนตัวอย่างจาก เครื่องบรรจุที่หนึ่งมา 12 กล่อง และจากเครื่องบรรจุที่สองมา 15 กล่อง โดยมีข้อมูลดังนี้

Machine_1

Machine_2

1476.5

1502.1

1542.1

1518.1

1462.1

1483.6

1506.9

1494.9

1532.1

1540.7

1556.4

1454.8

1482.7

1546.3

1425.9

1464.7

1495.0

1512.0

1413.7

1524.5

1554.8

1475.8

1438.8

1482.4

1458.2

1492.8

1460.3

จงทำการวิเคราะห์ และสรุปผลสมมติฐาน โดยกำหนดค่าความเชื่อมั่นของการทดสอบ 90%

 เริ่มแรกต้องทำการ Qualify ข้อมูลก่อน โดยเริ่มจากการทดสอบ Normality Test  โปรดดูหัวข้อ การทดสอบความเป็นการกระจายแบบปกติ (Normality Test)   ซึ่งได้ผลดังนี้

จากกราฟของการทดสอบ Normality test ของข้อมูลทั้งสอง บอกได้ว่าข้อมูลมีการกระจายแบบปกติ (Normal Distribution)  จึงสามารถจะเริ่มทำการทดสอบต่อไปได้

ต่อไปก็หาค่าสถิติต่างๆ ของข้อมูล ( Descriptive Summary)

Machine_1

Machine_2

Mean

1490.5808

1494.0761

Standard Error

14.2944

7.6247

Median

1488.8507

1492.7718

Mode

#N/A

#N/A

Standard Deviation

49.5173

29.5304

Sample Variance

2451.9631

872.0435

Kurtosis

-1.2498

-0.9223

Skewness

-0.1150

0.3604

Range

142.6929

91.5649

Minimum

1413.6602

1454.7710

Maximum

1556.3530

1546.3359

Sum

17886.9701

22411.1422

Count

12

15

 การพิสูจน์โดยการคำนวณและเปิดตาราง

เริมจากการคำนวณหาค่า t0 

 

ต่อไปก็คำนวณหาค่า Degree of freedom ( df ) 

 

 นั่นคือ ถ้า a=0.10 เราจะปฏิเสธสมมติฐานหลัก H0 : m1=m2 ถ้า t0 > ta/2,df  หรือถ้า    t 0< - ta/2,df

็เปิดตาราง t -Table    t0  ที่  df=17 , a=0.05 ได้  t0.05,17 = 1.74

เนื่องจาก ค่า t ที่คำนวณได้ -0.2157 ซึ่งมีค่าอยู่ภายใต้ Interval  -1.74 ถึง 1.74 ดังนั้นเราจึงยอมรับ สมมติฐานที่ว่า H0 : m1=m2 ซึ่งแปลว่า เครื่องบรรจุผงซักผ้าลงกล่องทั้งสองเครื่องนี้ ให้ขนาดบรรจุในกล่องไม่แตกต่างกัน

 

หากใช้ Analysis Tools ของ MS-Excel โดยต้องเลือก  t-Test: Two-Sample Assuming Unequal Variances  จะให้ผลดังนี้

t-Test: Two-Sample Assuming Unequal Variances

Variable 1

Variable 2

Mean

1490.58084

1494.076147

Variance

2451.96309

872.0435403

Observations

12

15

Hypothesized Mean Difference

0

df

17

t Stat

-0.21574853

P(T<=t) one-tail

0.41587558

t Critical one-tail

1.33337949

P(T<=t) two-tail

0.83175116

t Critical two-tail

1.73960643

การสรุปผลมีสองวิธีคือ

1. เปรียบเทียบ P-Value กับ a ถ้า P-Value มากกว่า a เราก็ยอมรับสมมติฐานหลัก H0 : m1=m2   ในข้อนี้ ค่า P-Value = 0.8317 ซึ่งมากกว่า 0.10 เราจึงยอมรับสมมติฐานหลัก

2. เปรียบเทียบค่า t-Stat กับค่า t - Critical ถ้าค่า t-Stat มากกว่าค่า t- Critical หรือน้อยกว่าค่าลบ (-) t Critical เราจะปฏิเธสมมติฐานหลัก  H0 : m1=m2  แต่ถ้าค่าอยู่ระหว่าง ค่า -t Critical ไปจนถึง +t Critical ก็ยอมรับสมมติฐานหลัก  จากผลลัพธ์ของ MS-Excel ได้ค่า t Stat เท่ากับ -0.2157 ซึ่งอยู่ภายใต้ Interval -1.7396 ถึง + 1.7396 เราจึงยอมรับสมมติฐานหลัก

ทั้งเราสามารถเลือกใช้เพียงวิธีใดวิธีหนึ่ง ซึ่งจะให้คำตอบที่ถูกต้องและแม้ว่าจะใช้ทั้งสองวิธี ก็จะได้คำตอบออกมาแนวเดียวกันเสมอ

 

หากใช้โปรแกรม Minitab จะให้ผลดังนี้

Two-sample T for Machine_1 vs Machine_2

               N       Mean     StDev      SE Mean

Machine_1     12      1490.6    49.5        14

Machine_2     15      1494.1    29.5        7.6

Difference = mu Machine_1 - mu Machine_2

Estimate for difference: -3.5

90% CI for difference: (-31.7, 24.7)

T-Test of difference = 0(vs not =): T-Value = -0.22 P-Value =0.832 DF=17

 

จากผลลัพธ์เมื่อใช้ Minitab ค่า P-Value มากกว่า a (0.10) เราจึงยอมรับสมมติฐานหลัก  H0 : m1=m2

่ทั้งนี้เมื่อเราทำการแสดงค่าของข้อมูลทั้งสองกลุ่มออกมาในรูป Box plot เราจะเห็นว่า ค่าเฉลี่ยใกล้เคียงกันมาก แต่ การกระจายของข้อมูลกลับแตกต่างกัน

 

แต่เนื่องจากว่า t Test  ไม่สามารถใช้พิสูจน์ความแตกต่างกันของค่าการกระจายของข้อมูลได้ ผู้ทำการวิเคราะห์ข้อมูลจึงจำเป็นต้องพิจารณาผลที่ได้ อย่างกรณีตัวอย่างนี้ แม้ผลจะสรุปว่าค่าเฉลี่ยไม่แตกต่างกัน แต่ภาพที่เรามองเห็นนั้นกำลังบอกว่า Machine 1 น่าจะได้รับการแก้ไขในบางอย่าง 

 

กรณีที่เรากำหนดให้ D > 0    

ในบางครั้งผลต่างในการทดสอบสมมติฐาน ของสองประชากรอาจจะไม่เท่ากับ 0 ก็ได้  ยกตัวอย่างต่อไปนี้

ตัวอย่าง ณ โรงงานผลิตชิ้นส่วนประกอบของรถยนต์แห่งหนึ่ง หัวหน้าฝ่ายวิศวกรรมต้องการปรับปรุงการทำงานของเครื่องตัดโลหะขนาดเส้นผ่าศูนย์กลาง 3 นิ้ว จำนวนทั้งหมด 6เครื่อง จะต้องใช้เงินลงทุนประมาณ 300,000 บาท ต่อเครื่อง แต่ผู้บริหารได้กำหนดไว้ว่าให้ปรับปรุงเพียงหนึ่งเครื่องก่อน และ ความสามารถของเครื่องในการตัดโลหะหลังจากปรับปรุงแล้วจะต้องเพิ่มขึ้นอย่างต่ำ 10 % ถึงจะถือว่าคุ้มทุนในการปรับปรุง และจะอนุมัติงบประมาณในการปรับปรุงเครื่องที่เหลือ วิศวกรที่รับผิดชอบจึงทำการเก็บข้อมูลความสามารถของเครื่อง โดยนับจำนวนชิ้นงานที่เครื่องตัดได้ภายในเวลา 1 ชั่วโมง( Unit per hour ) จำนวน 24 ชั่วโมง ( ตัวอย่าง ) ทั้งก่อนและหลังทำการปรับปรุงเครื่องตัดโลหะ ได้ข้อมูลดังต่อไปนี้  

Before

After

530

590

559

629

569

622

545

619

549

591

521

607

567

599

547

597

533

590

551

572

577

584

545

627

546

621

559

577

594

592

555

592

551

616

602

603

554

608

549

602

538

598

576

594

593

613

567

578

จากข้อมูลดังกล่าว พบว่าก่อนทำการปรับปรุงเครื่อง ความสามารถในการตัดโลหะของเครื่องโดยเฉลี่ย อยู่ที่ 557.4 ชิ้นต่อชั่วโมง ดังนั้นถ้าเพิ่มขึ้น 10% เท่ากับเพิ่มขึ้นประมาณ 55.74  ชิ้นต่อชั่วโมงโดยเฉลี่ย  ให้ทำการทดสอบสมมติฐานว่า ความสามารถของเครื่องหลังทำการปรับปรุงแล้วเพิ่มขึ้น ตามข้อกำหนดของฝ่ายบริหารหรือไม่ ถ้าสมมติให้ขอ้มูลทั้งสองกลุ่มมีการกระจายเป็นแบบปกติ (Normal distribution ) และการกระจายของข้อมูลไม่มีความแตกต่างกัน และกำหนดระดับความเชื่อมั่นที่ 95% 

1. หา Descriptive Statistics ของข้อมูลทั้งสองกลุ่ม ได้ดังนี้

Before

After

Mean

557.375

600.875

Standard Error

4.144934266

3.269485899

Median

552.5

598.5

Mode

559

590

Standard Deviation

20.30594794

16.01714435

Sample Variance

412.3315217

256.548913

Kurtosis

0.076896314

-0.802990093

Skewness

0.578195633

0.111384029

Range

81

57

Minimum

521

572

Maximum

602

629

Sum

13377

14421

Count

24

24

 

2. กำหนดสมมติฐาน

หมายเหตุ : กำหนดให้ m1 คือ After และ m2 คือ Before เพราะ After มีค่าสูงกว่า

3. เลือกตัวทดสอบสมมติฐาน 

 

4. หาค่า Sp จาก 

Sp = 18.29

5. หาค่า Test statistic ( t0 )   เมื่อกำหนดให้  D > 0

6. หา df จาก

                   df = n1+n2-2 

                   df= 24+24-2 =46

 7.  คำนวณหาค่า T-Critical ที่  a=0.05 , df=46 

               โดยใช้ MS Excel ได้ค่าเท่ากับ 1.678 

(เนื่องจาก MS Excel จะมอง Probability เป็น a/2 เสมอ ดังนั้นเมื่อเราทดสอบด้านเดียว หรือ One-tailed test ค่า a ที่ใส่ต้องเอา 2 คูณก่อน)

 โดยใช้ Minitab ได้ค่าเท่ากับ -1.678 หรือ 1.678 แล้วแต่กรณีของ Alternative hypothesis

Inverse Cumulative Distribution Function

Student's t distribution with 46 DF

       P( X <= x )       x

         0.0500        -1.6787

 

(เนื่องจาก Minitab จะให้ด้านซ้ายมือออกมา กรณีที่ Alternative hypothesis เป็นมากกว่า ก็ให้คิดค่าด้านบวก ของตัวเลขที่ คำนวณได้)

8. สรุปผลการทดสอบสมมุติฐานดังนี้   

จะยอมรับสมมติฐาน    Ho : m1 - m2 = D    เมื่อ   t0<ta,df

  ผลการทดสอบสมมติ  t0= -2.32  , ta,df= 1.678  เราจึงยอมรับสมมติฐานหลัก  หรือยอมรับว่า หลังจากทำการปรับปรุงเครื่องตัดโลหะแล้วความสามารถของเครื่องเพิ่มขึ้นไม่มากกว่า 10% ตามที่ฝ่ายบริหารกำหนดไว้ 

หากเราทดสอบสมมติฐานโดยใช้ MS Excel จะเป็นดังนี้  (โปรดอ่านวิธีใช้ Analysis tools สำหรับการทดสอบ 2 Mean )

t-Test: Two-Sample Assuming Equal Variances

Variable 1

Variable 2

Mean

600.875

557.375

Variance

256.548913

412.3315217

Observations

24

24

Pooled Variance

334.4402174

Hypothesized Mean Difference

55.74

df

46

t Stat

-2.318530388

P(T<=t) one-tail

0.012459212

t Critical one-tail

1.678658919

P(T<=t) two-tail

0.024918424

t Critical two-tail

2.012893674

เนื่องจากใน MS Excel จะกำหนด Alternative hypothesis เป็น  น้อยกว่า เพียงอย่างเดียวในกรณีทดสอบด้านเดียว ดังนั้นเมื่อโจทย์ข้อนี้กำหนดให้ Alternative hypothesis เป็น มากกว่า เราจึงต้องคำนวณจาก

              P(T>t) = 1-P(T<=t)   =  1-0.01246    =   0.97854

          เมื่อ    P(T>t) > a  เราจึงยอมรับสมมติฐาน หลักที่ว่า  Ho : m1 - m2 = D

หมายความว่า หลังจากทำการปรับปรุงเครื่องตัดโลหะแล้วความสามารถของเครื่องเพิ่มขึ้นไม่มากกว่า 10% ตามที่ฝ่ายบริหารกำหนดไว้

หากเราทดสอบสมมติฐานโดยใช้ Minitab จะเป็นดังนี้

Two-sample T for After vs Before

              N          Mean           StDev         SE Mean

      After   24         600.9          16.0           3.3

      Before  24         557.4          20.3           4.1

  Difference = mu After - mu Before

  Estimate for difference: 43.50

  95% lower bound for difference: 34.64

T-Test of difference=55.74 (vs >):T-Value =-2.32 P-Value=0.988 DF=46

Both use Pooled StDev = 18.3

 

Minitab สามารถระบุการทดสอบเป็น มากกว่า ได้ ผลสรุปก็เหมือนกับการใช้ MS Excel คือ เมื่อ P-Value มากกว่า a เราจึงยอมรับสมมติฐานหลัก

 จากโจทย์ข้อนี้จะเห็นได้ว่า เมื่อเราระบุค่าความแตกต่างขึ้นมา ผลการทดสอบสมมติฐานก็จะแตกต่างออกไปจาก ที่เรากำหนดให้ความแตกต่างเท่ากับ 0 

 


[ HOME ]             [ CONTENTS ]  

                                            

Hosted by www.Geocities.ws

1