วันจันทร์ที่ 2 กุมภาพันธ์ พ.ศ. 2558

เปอร์เซ็นต์ไทล์

หมีกระดิกหูเปอร์เซ็นต์ไทล์ หมีกระดิกหู

เปอร์เซ็นต์ไทล์ (Percentile) เป็นตำแหน่งที่เทียบจากร้อย ตำแหน่งเปอร์เซ็นต์ไทล์ คือ ตำแหน่งที่บอกว่า
เมื่อเทียบจากร้อยจะมีผู้ได้น้อยกว่าหรือเท่ากับตำแหน่งนี้กี่คน

การคำนวณหาตำแหน่งเปอร์เซ็นต์ไทล์ มี 2 วิธี คือ
คำนวณจากสูตร
โดย
P
คือ
ตำแหน่งเปอร์เซ็นต์ไทล์ที่ต้องการหา
cf
คือ
ความถี่สะสมในชั้นที่ต่ำกว่าชั้นที่คะแนน x ตกอยู่
f
คือ
ความถี่ของข้อมูลในชั้น x
N
คือ
จำนวนข้อมูลทั้งหมด
 ผลการสอบวิชาวงจรไฟฟ้าของนักศึกษา 30 คน จากคะแนนเต็ม 30 คะแนน
         มีนักเรียนสอบได้คะแนนด้านล่าง จงคำนวณเปอร์เซ็นต์ไทล์ของคะแนน 12
15
18
16
12
11
9
8
10
9
12
18
17
16
9
7
12
13
11
10
10
15
14
13
10
9
8
8
9
9
9
วิธิทำ
จากข้อมูล
นำมาจัดในรูปแบบตาราง
คะแนน (x)
ความถี่ (f)
cf
18
17
16
15
14
13
12
11
10
9
8
7
2
1
2
2
1
2
3
2
4
7
3
1
30
28
27
25
23
22
20
17
15
11
4
1
รวม
N = 30
-
จากสูตร การคำนวณหาตำแหน่งเปอร์เซ็นต์ไทล์
              เมื่อไม่จัดกลุ่มคะแนน

                     
ดังนั้น คะแนน 12 ตรงกับตำแหน่งเปอร์เซ็นต์ไทล์ที่
                            
 เด็กปีศาจเด็กปีศาจเด็กปีศาจ


แผนภาพต้น - ใบ

น้องหมูมีความรัก แผนภาพต้น - ใบ น้องหมูมีความรัก             
          ใน การจัดข้อมูลที่มีอยู่ให้เป็นกลุ่ม ๆ เพื่อความสะดวกในการนำไปวิเคราะห์ข้อมูลอาจทำได้โดยใช้ตารางแจกแจงความถี่ และใช้กราฟ เช่น การสร้างฮิสโทแกรม
          จะเห็นได้ว่า การสร้างตารางแจกแจงความถี่ และฮิสโทแกรมอาจทำให้ไม่สามารถบอกได้ว่าข้อมูลที่มีอยู่มีค่าใดบ้าง เนื่องจากได้จัดแบ่งข้อมูลที่มีอยู่เป็นช่วง ๆ ซึ่งแต่ละช่วงแทนค่าที่เป็นไปได้ชุดใหม่ที่ให้ภาพคร่าว ๆ ว่า ข้อมูลในแต่กลุ่มมีมากหรือน้อยเพียงใด เมื่อเปรียบเทียบกับข้อมูลกลุ่มอื่น ๆ
          การจัดข้อมูลเป็นกลุ่ม นอกจากจะใช้ตารางแจกแจงความถี่ หรือฮิสโทแกรมแล้ว อาจจะใช้วิธีการสร้างแผนภาพเพื่อแจกแจงความถี่และวิเคราะห์ข้อมูลเบื้องต้น ไปพร้อมกัน ที่เรียกว่าแผนภาพ ต้น - ใบ (stem - and - leaf plot หรือ stem plot) ซึ่งทำได้ดังตัวอย่างต่อไปนี้

 ตัวอย่างที่ 1จากการเลือกชั่งน้ำหนัก (กิโลกรัม) ของตัวแทนนักเรียนในห้องจำนวน 20 คน มีผลดังนี้
น้ำหนักนักเรียนคนที่ 1ถึง 10
39
43
45
42
52
51
42
40
40
41
น้ำหนักนักเรียนคนที่ 11ถึง 120
35
39
46
44
50
48
47
43
48
38
          แบ่งกลุ่มข้อมูลเป็น 3 กลุ่ม ดังนี้
          กลุ่มที่ 1                   น้ำหนักตั้งแต่ 30 ถึง 39 กิโลกรัม
          กลุ่มที่ 2                   น้ำหนักตั้งแต่ 40 ถึง 49 กิโลกรัม
          กลุ่มที่ 3                   น้ำหนักตั้งแต่ 50 ถึง 59 กิโลกรัม
          จากกลุ่มข้อมูล 3 กลุ่ม นำมาสร้างเป็นลำต้น (stem) โดยใช้เลขโดดจากหลักสิบของแต่ละกลุ่มได้ดังนี้


75
34
80
95
62
75
98
93
84
87
94
85
70
39
84
78
98
78
90
68
75
82
76
85




            จงใช้แผนภาพต้น - ใบในการแจกแจงความถี่ของข้อมูลข้างต้น
วิธีทำ 1) แบ่งคะแนนสอบออกเป็นช่วง ๆ ในที่นี้จะให้แต่ละช่วงมีคะแนนต่างกัน 10 คะแนน โดยเริ่ม             ตั้งแต่ 0 - 9, 10 - 19, ... 80 - 89, 90 - 99
                          2) จากข้อมูลพบว่า คะแนนต่ำสุด และสูงสุดคือ 34 และ 98 คะแนน ตามลำดับ ดังนั้น จะเริ่มช่วงคะแนนตั้งแต่ 30 - 39 เรื่อยไปจนถึง 90 - 99 และเขียนเป็นแผนภาพต้น - ใบได้ดังนี้

          จากแผนภาพจะพบว่า
·        คะแนนที่มีความถี่สูงสุดคือ 75 มีความถี่ 3
·        ช่วงคะแนนที่มีความถี่มากที่สุดคือ ช่วง 70 - 79 และ 80 - 89 คะแนนโดยแต่ละช่วงมีความถี่ 7
·        ไม่มีผู้สอบได้คะแนนในช่วงคะแนน 40 - 49 และ 50 - 59
·        คะแนนส่วนใหญ่จะอยู่ในช่วง 70 - 89
นอกจากจะใช้แผนภาพต้น - ใบ นำเสนอข้อมูล 1 ชุด ดังตัวอย่างที่เสนอแล้วยังสามารถใช้นำเสนอข้อมูล 2 ชุดพร้อมกันและสามารถเปรียบเทียบข้อมูล 2 ชุดนั้นได้ โดยดูจากแผนภาพดังกล่างตามตัวอย่างต่อไปนี้
00 คะแนน เป็นดังนี้

 จากแผนภาพพบว่า
·        คะแนนสอบต่ำสุดของวิชาที่ 1 และ 2 คือ 40 และ 32 คะแนนตามลำดับ
·        คะแนน สูงสุดของวิชาที่ 1 และ 2 คือ 100 และ 98 คะแนนตามลำดับและวิชาที่ 1 มีผู้สอบได้ 100 คะแนน 3 คน วิชาที่ 2 มีผู้สอบได้ 98 คะแนน 1 คน
·        ความแตกต่างของคะแนนสูงสุดและต่ำสุดของคะแนนสอบวิชาที่ 1 คือ 100 - 40 หรือ 60 คะแนน และวิชาที่ 2 คือ 98 - 32 หรือ 66 คะแนน
·        คะแนนส่วนใหญ่ของวิชาที่ 1 จะอยู่ในช่วง 60 - 79 คะแนน
        คะแนนส่วนใหญ่ของวิชาที่ 2 จะอยู่ในช่วง 80 - 89 คะแนน
·        เมื่อ พิจารณาจากแผนภาพ คะแนนเฉลี่ยของวิชาที่ 2 น่าจะสูงกว่าวิชาที่ 1 เนื่องจากคะแนนส่วนใหญ่ของวิชาที่ 2 สูงกว่าคะแนนส่วนใหญ่ของวิชาที่  1 

 น้องหมูหัวเราะน้องหมูหัวเราะน้องหมูหัวเราะ

ฮิสโทแกรม

เหมียว ๆ มีความรักฮิสโทแกรมเหมียว ๆ มีความรัก

          ฮิสโทแกรมมีลักษณะเป็นรูปสี่เหลี่ยมมุมฉากวางเรียงติดต่อกันบนแกนนอนโดยมีแกน นอนแทนค่าของตัวแปร ความกว้างของรูปสี่เหลี่ยมมุมฉากแทนความกว้างของอันตรภาคชั้น และพื้นที่ของรูปสี่เหลี่ยมมุฉากแต่ละรูปแทนความถี่ของแต่ละอันตรภาคชั้น ดังนั้น ถ้าความกว้างของอัตรภาคชั้นเท่ากันตลอด ความสูงของรูปสี่เหลี่ยมมุมฉากจะแสดงความถี่

          การสร้างฮิสโทแกรมจากตารางแจกแจงความถี่ทำได้ดังตัวอย่างต่อไปนี้


          จากฮิสโทแกรมจะเห็นว่า คนงานที่ทำงานตั้งแต่ 40 ชั่วโมง แต่ไม่ถถึง 45 ชั่วโมง มีจำนวนมากที่สุด
          ในตัวอย่างที่กล่าวมาข้างต้น ค่าจากการสังเกตเป็นค่าต่อเนื่อง การสร้างฮิสโทแกรมทำได้โดยสร้างรูปสี่เหลี่ยมมุมฉากให้ความกว้างของแต่ละรูป เท่ากับความกว้างของแต่ละอันตรภาคชั้นซึ่งในกรณีนี้กว้างเท่ากันหมดทุก อันตรภาคชั้น
          ในกรณีที่ค่าจากการสังเกตไม่เป็นค่าต่อเนื่อง  เช่น  คะแนนสอบ  ในตารางแจกแจงความถี่หน้า  40 ในการสร้างอิสโทแกรม เพื่อให้รูปสี่เหลี่ยมมุมฉากแต่ละรูปเรียงติดกันจึงจะหาขอบล่างและขอบบนของ แต่ละอัตรภาคชั้นก่อน  แล้วจึงสรุปรูปสี่เหลี่ยมมุมฉากให้ความกว้างของแต่ละรูปเท่ากับผลต่างของขอบล่างและขอบบน
และอัตรภาคชั้นนั้นดังนี้
คะแนนสอบ
ขอบล่าง-ขอบบน
จำนวนนักเรียน
701 - 800
601 - 700
501 - 600
401- 600
301-400
201-300
700.5 - 800.5
600.5-700.5
500.5-600.5
400.5-500.5
300.5-400.5
200.5-300.5
4
10
15
18
11
2

หมายเหตุ ขอบล่าง( lower boundary) คือค่ากึ่งกลางระหว่างค่าที่มากที่สุดในอัตรภาคชั้นก่อนหน้านั้นกับค่าที่ น้อยที่สุดของอัตรภาคชั้นนั้น  ถ้าเป็นขอบล่างของอัตรภาคชั้นต่ำที่สุดให้ถืเสมือนว่ามีอัตรภาคที่ต่ำกว่า อัตรภาคชั้นนั้นอีกหนึ่งชั้น
          ขอบบน ( upper bondary) คือค่ากึ่งกลางระหว่างค่าที่มากที่สุดในอัตรภาคชั้นนั้น  กับค่าที่น้อยที่สุดของอัตรภาคชั้นถัดไปชั้นหนึ่งถ้าเป็นขอบบนของอัตรภาคสูง สุดให้ถือเสมือนว่ามีอัตรภาคที่สูงสุดกว่าอัตรชั้นนั้นอีกหนึ่งชั้น 
          ในกรณีที่ค่าจากการสังเกตเป็นจำนวนเต็มบวกอาจสร้างฮิสโทแกรมได้ดังตัวอย่างต่อไปนี้

 ตัวอย่างที่ 2จากการตารางแจกแจงความถี่ของขนาดครอบครัว  11  ครอบครัวในหมู่บ้านแห่งหนึ่ง
สร้างฮิสโทแกรมแสดงจำนวนคนในครอบครัวจากข้อมูในตารางได้ดังนี้

ขนาดครอบครัว ( คน)
จำนวนครอบครัว
2
3
4
5
1
5
3
2
รวม
11


จากอิสโทแกรม
1)              จำนวนครอบครัวทั้งหมดที่ทำการสำรวจคือ
300 +  400 + 600 + 400 + 200 + 100 = 2000 ครอบครัว
        2) ครอบครัวจำนวนมากที่สุดมีเด็กอายุต่ำกว่า 15 ปี อยู่ครอบครัวละ 2 คน
ตัวอย่างที่เสนอมาแล้วเป็นการแจกแจงความถี่โดยใช้ฮิสโทแกรมของข้อมูลที่เป็นข้อมูลเชิงปริมาณ ในกรณีที่เป็น
ข้อมูลเชิงคุณภาพ สามารถ้แผนภูมิแท่ง ( bar chart ) แสดงข้อมูล ดังตัวดย่างต่อไปนี้

ตัวอย่างที่4 ตารางแสดงรายได้กรมสรรพสามิตรวมทุกประเภท ประจำเดือนตุลาคม ธันวาคม 2546

ประเภทรายได้
รายได้ (ล้านบาท)
1.ภาษีน้ำมันและผลิตภัณฑ์น้ำมัน
2.ภาษียาสูบ
3.ภาษีสุรา
4.ภาษีเบียร์
5.ภาษีรถยนต์
18,340.26
8,405.58
7,621.58
12,354.59
15,106.88
 love



การแจกแจงความถี่สัมพันธ์

   การแจกแจงความถี่สัมพันธ์

          ความถี่สัมพันธ์ (relative frequency) ของ ค่าที่เป็นไปได้ค่าใดหรือของอันตรภาคชั้นใด คืออัตราส่วนระหว่างความถี่ของค่านั้นหรือของอันตรภาคชั้นนั้นกับผลรวมของ ความถี่ทั้งหมด ความถี่สัมพันธ์อาจแสดงในรูปเศษส่วนหรือทศนิยมหรือร้อยละก็ได้


หมายเหตุ เนื่อง จากความถี่สัมพันธ์เป็นความถี่ที่ได้จากการเปรียบเทียบความถี่ของแต่ละค่า หรือแต่ละอันตรภาคชั้นกับผลรวมของความถี่ทั้งหมด ดังนั้น ผลรวมของความถี่สัมพันธ์ของทุก ๆ ค่าที่เป็นไปได้หรือของทุกอันตรภาคชั้นจะต้องมีค่าเท่ากับ 1 หรือ 100% เสมอ แต่ในตัวอย่างที่ 6 มีการปัดเศษทิ้งมากกว่าปัดขึ้นทำให้ผลรวมขาดไปเล็กน้อย

 การแจกแจงความถี่สะสมสัมพันธ์

          ความถี่สะสมสัมพันธ์ (relative cumulative frequency) ของค่าที่เป็นไปได้ค่าใดหรืออันตรภาคชั้นใด คือ อัตราส่วนระหว่างความถี่สะสมของค่านั้นหรือของอันตรภาคชั้นนั้นกับผลรวมของ ความถี่ทั้งหมด ซึ่งอาจแสดงในรูปเศษส่วน ทศนิยมหรือร้อยละ
          จากตารางแจกแจงความถี่สัมพันธ์ของคะแนนสอบวิชาคณิตศาสตร์ของนักเรียน 60 คน ในตัวอย่างข้างต้นสร้างตารางแจกแจงความถี่สะสมสัมพัทธ์ได้ดังนี้

การแจกแจงความถี่สะสมสัมพัทธ์

เราสามารถหาความถี่สะสมสัมพัทธ์(Relative Cumulative Frequency)ของแต่ละอันตรภาคชั้นโดยที่


 ความถี่สะสมสัมพัทธ์ของแต่ละอันตรภาคชั้น = ความถี่สะสมของอันตรภาคชั้นนั้น / จำนวนข้อมูลทั้งหมด


ความหมาย
        ความถี่สะสมสัมพัทธ์ของอันตรภาคชั้นใด เป็นการบอกให้ทราบว่า อัตราส่วนของความถี่สะสมของอันตรภาคชั้นนั้น กับผลรวมของความถี่ทั้งหมด ซึ่งนิยมคิดเป็นร้อยละ เรียกว่า ร้อยละของความถี่สะสมสัมพัทธ์
        เช่น   อันตรภาคชั้น 15 - 19 มีร้อยละของความถี่สะสมสัมพัทธ์ 26.67
                แสดงว่า มีข้อมูลที่มีค่าน้อยกว่า 19.5 คิดเป็นร้อยละ 26.67 ของจำนวนข้อมูลทั้งหมด
                อันตรภาคชั้น 20 - 24 มีร้อยละของความถี่สะสมสัมพัทธ์ 66.67
                แสดงว่า มีข้อมูลที่มีค่าน้อยกว่า 24.5 คิดเป็นร้อยละ 66.67 ของจำนวนข้อมูลทั้งหมด



 การแจกแจงความถี่สัมพัทธ์และความถี่สะสมสัมพัทธ์
   ความถี่สะสมสัมพัทธ์ของอันตรภาคชั้นใด คือ    อัตราส่วนระหว่างความถี่สะสมของ

   อันตรภาคชั้นนั้นกับทั้งหมด ซึ่งอาจแสดงในรูปเศษส่วน ทศนิยม หรือร้อยละ


อันตรภาคชั้น
ความถี่
ความถี่สัมพัทธ์
ร้อยละของความถี่สัมพัทธ์
ความถี่สะสม
ความถี่สะสมสัมพัทธ์
50 59
2
http://www.thaigoodview.com/library/teachershow/bangkok/pisamorn_s/pictures/10.JPG
4
2
http://www.thaigoodview.com/library/teachershow/bangkok/pisamorn_s/pictures/15.JPG
60 69
11
http://www.thaigoodview.com/library/teachershow/bangkok/pisamorn_s/pictures/11.JPG
22
13
http://www.thaigoodview.com/library/teachershow/bangkok/pisamorn_s/pictures/16.JPG
70 79
20
http://www.thaigoodview.com/library/teachershow/bangkok/pisamorn_s/pictures/12.JPG
40
33
http://www.thaigoodview.com/library/teachershow/bangkok/pisamorn_s/pictures/17.JPG
80 89
14
http://www.thaigoodview.com/library/teachershow/bangkok/pisamorn_s/pictures/13.JPG
28
47
http://www.thaigoodview.com/library/teachershow/bangkok/pisamorn_s/pictures/18.JPG
90 - 99
3
http://www.thaigoodview.com/library/teachershow/bangkok/pisamorn_s/pictures/14.JPG
6
50
http://www.thaigoodview.com/library/teachershow/bangkok/pisamorn_s/pictures/19.JPG

 หมายเหตุ  กรณีที่ข้อมูลไม่จัดเป็นอันตรภาคชั้นสามารถใช้วิธีเดียวกันนี้ได้