บทที่ 2

การแจกแจงความถี่

( Frequency  Distributions )

ในการเก็บรวบรวมคะแนนหรือข้อมูลต่าง ๆที่ได้จากการวัด  การทดสอบหรือ  โดยวิธีการใด ๆ  ก็ตามยังมิได้มีการจัดแนวหมวดหมู่  มีลักษณะกระจัดกระจายประปนกันอยู่อย่างไม่เป็นระเบียบ  จึงต้องมีการจัดระเบียบเตรียมข้อมูลจัดให้เป็นหมวดหมู่  โดยการทำให้แปลความหรือนำไปใช้ได้ง่าย  ซึ่งการเตรียมข้อมูลง่าย ๆ  ก็คือ การเรียงข้อมูลจากมากไปหาน้อยหรือน้อยไปหามาก  ข้อมูลที่ยังไม่มีการจัดหมวดหมู่เรียกว่า  Ungrouped  Data  ซึ่งเป็นค่าจริงข้อมูลนั้นเช่น  น้ำหนักของนักศึกษาระดับ  ปวสจำนวน  15  คน  มีน้ำหนักดังนี้  44, 50, 48, 55, 60, 45, 48, 47, 63, 65, 70, 71, 64, 65, 46  เราสามารถจัดเรียงข้อมูลจากน้อยไปหามากได้  ดังนี้  44, 45, 46, 47, 48, 48, 50, 55, 60, 63, 64, 65, 65, 70, 71  ซึ่งข้อมูลยังไม่มีการจัดหมวดหมู่  เมื่อไรก็ตามข้อมูลมีมากจำนวนมาก ( มีข้อมูลมากกว่า  30  จำนวน จะต้องทำการจัดหมวดหมู่ หรือแจกแจงความถี่  ซึ่งเรียกข้อมูลที่จัดหมวดหมู่ว่า  Grouped  Data

ความถี่  ( Frequency )  คือจำนวนของคะแนนดิบที่มีอยู่ในค่าหนึ่ง ๆ  หรือจำนวนคะแนนที่เกิดซ้ำกันในกลุ่มหนึ่ง ๆ ใช้สัญลักษณ์ f

การแจกแจงความถี่ ( Frequency  Distributions)  คือการทำข้อมูลดิบที่รวบรวมได้มาจัดหมวดหมู่ให้เป็นระเบียบ  โดยเรียงข้อมูลจากมากไปหาน้อยหรือจากน้อยไปมาก  เพื่อหาคะแนนที่เกิดซ้ำกันในแต่ละกลุ่มหรือช่วงคะแนนว่ามีจำนวนเท่าไร

วิธีการแจกแจงความถี่

1.       การจัดกระทำกับข้อมูลที่ไม่ได้จัดหมวดหมู่  ( Ungrouped  Data )

ซึ่งจะเป็นการเรียงคะแนนจากมากไปน้อยหรือจากน้อยไปมาก  ไม่ได้แสดงจำนวนที่ซ้ำกันของข้อมูลในแต่ละค่า  แต่จะเรียงข้อมูลที่ซ้ำกันไปด้วย  ด้วย  ดังตัวอย่าง

ตัวอย่างที่  3.1  ในการวัดส่วนสูงของนักศึกษาระดับประกาศนียบัตรวิชาชีพ  ( ปวช. ) จำนวน  50  คน  ปรากฏผลดังนี้

150         150         151         152         153         153         153         154

154         155         157         157         157         157         157         158

158         159         159         160         160         160         160         161

162         163         163         164         165         165         165         166

167         167         167         168         168         168         169         170

2.       การแจกแจงความถี่หรือการจัดหมวดหมู่  ( Grouped  Data )

ในการแจกแจงความถี่หรือการจัดหมวดหมู่ให้เป็นระเบียบนั้นจะใช้ตารางแจกแจงความถี่  ซึ่งประกอบด้วยคะแนน  รอยขีดคะแนน ( Tally )  และความถี่หรือจำนวนขีดคะแนน ( จำนวนคะแนนแต่ละค่า )

ตัวอย่างที่  3.2  การจัดส่วนสูงนักศึกษาในตัวอย่างที่  2.1  ให้นำมาจัดหมวดหมู่ในตารางแจกแจงความถี่

วิธีทำ   1. พิจารณาคะแนนสูงสุดและคะแนนต่ำสุด  คะแนนต่ำสุด คือ 150  คะแนน สูงสุดคือ  170

     2. จัดทำตารางบรรจุคะแนนจากต่ำสุดไปสูงสุด  แล้วหาค่าความถี่

คะแนน

รอยคะแนน

ความถี่ ( f )

คะแนน

รอยคะแนน

ความถี่ (f )

150

151

152

153

154

155

156

157

158

159

160

//

/

/

///

//

/

-

/////

//

/

////

2

1

1

3

2

1

0

5

2

2

4

161

162

163

164

165

166

167

168

169

170

/

/

//

/

///

/

///

///

/

/

1

1

2

1

3

1

3

3

1

1

 

 

 

 

 

 N = 50

                ในการจัดหมวดหมู่ของข้อมูลชุดใดมีจำนวนมากในการทำตารางที่กล่าวมาอาจจะไม่สะดวก  จึงต้องมีการจัดคะแนนที่ใกล้เคียงกันเข้าด้วยกันเป็นหมู่หรือชั้น ( Group  Or  Class )  แต่ละชั้นคะแนนจะประกอบด้วยกลุ่มของคะแนน

                วิธีทำ

1.       หาค่าพิสัยของคะแนน

ค่าพิสัย  คะแนนสูงสุด คะแนนต่ำสุด

2.       จำนวนชั้น  ถ้าพิสัยมากก็กำหนดจำนวนชั้นมาก  ถ้าพิสัยน้อยก็กำหนดจำนวนชั้นน้อย  ซึ่งควรไม่เกิน  20  ชั้น

3.       หาช่องกว้างของคะแนนในแต่ละชั้น  หรือแต่ละชั้นควรมีคะแนนกี่จำนวนนั้น  คือหาอันตรภาคชั้น    ( Class  Interval )

อันตรภาคชั้น  =   พิสัย / จำนวนชั้น

แทนด้วย  i  ซึ่งเป็นจำนวนเต็ม

4.       เขียนขีดจำกัดชั้นของคะแนนแต่ละชั้นลงในช่องคะแนน  โดยเริ่มจากคะแนนต่ำสุดหรือสูงสุด  จัดทำตาราง

                5.  ขีดรอยคะแนน ( Tally )  ในแต่ละชั้น  และหาความถี่  f

** ค่าต่างๆ ของตารางแจกแจงความถี่**

  • ความถี่ ( Frequency ) คือตัวเลขที่ใช้แทนจำนวนคะแนนที่ตกอยู่แต่ละอันตรภาคชั้นใช้ f แทน
  • ขีดจำกัดบน ( Upper Limit ) คือคะแนนสูงสุดของคะแนนแต่ละชั้น
  • ขีดจำกัดล่าง ( Lower Limit ) คือคะแนนต่ำสุดของคะแนนแต่ละชั้น
  • จุดกึ่งกลาง ( Mid Point ) คือคะแนนที่อยู่กึ่งกลารงระหว่างขีดจำกัดบนและขีดจำกัดล่าง
  • สูตร จุดกึ่งกลาง = ขีดจำกัดบน + ขีดจำกัดล่าง / 2

    การแจกแจงความถี่ด้วยกราฟแท่งหรือกราฟฮิสโตแกรม

    ตัวอย่าง 3.7 จากข้อมูลในตารางแจกแจงความถี่จงสร้างฮิสโตแกรม ( Histogram )

    ชั้นคะแนน

    ความถี่

    ขีดจำกัดชั้นที่แท้จริง

    10 19

    20 29

    30 39

    40 49

    50 59

    60 69

    70 79

    80 89

    4

    10

    15

    15

    25

    30

    20

    5

    10.5 19.5

    19.5 29.5

    29.5 39.5

    39.5 49.5

    49.5 59.5

    59.5 69.5

    69.5 79.5

    79.5 89.5

     

    N = 124

     

    วิธีทำ

      1. หาขีดจำกัดชั้นที่แท้จริง
      2. สร้างกราฟ ลากแกนนอนแกนตั้ง
        1. แกนตั้งแบ่งสเกลให้เท่าจำนวนความถี่
        2. แกนนอนแบ่งโดยใช้ขีดจำกัดที่แท้จริงให้เท่ากับจำนวนชั้น
        3. สร้างกราฟแท่งบนสเกลที่แบ่งตามขีดจำกัดชั้นที่แท้จริงโดยสูงเท่ากับความถี่ของแต่ละชั้น

    การแจกแจงความถี่ด้วยรูปหลายเหลี่ยมความถี่ ( Frequency Polygon )

    คือรูปกราฟหลายเหลี่ยมที่เกิดจากการโยงจุดกึ่งกลางของยอดแท่งของสี่เหลี่ยมของฮิตโทแกรมด้วยเส้นตรง หรือแผนภูมเส้นที่แสดงความถี่ของคะแนนแต่ละชั้น

    ตัวอย่าง 3.8 จากข้อมูลในตารางจงแจกแจงความถี่ด้วยรูแหลายเหลี่ยมแห่งความถี่

    ช่วงคะแนน

    ความถี่

    ขีดจำกัดที่แท้จริง

    จุดกึ่งกลาง

    10 19

    20 29

    30 39

    40 49

    50 59

    60 69

    70 79

    80 89

    4

    10

    15

    15

    25

    30

    20

    5

    10.5 19.5

    19.5 29.5

    29.5 39.5

    39.5 49.5

    49.5 59.5

    59.5 69.5

    69.5 79.5

    79.5 89.5

    14.5

    24.5

    34.5

    44.5

    54.5

    64.5

    74.5

    84.5

     

    N = 124

       

    วิธีทำ

      1. หาขีดจำกัดที่แท้จริง
      2. สร้างฮิสโตแกรม หรือ สร้างกราฟแกนตั้งแทนความถี่ แกนนอนแทนคะแนน
      3. หาจุดกึ่งกลางของแต่ละชั้น
      4. ลากเส้นผ่านจุดกึ่งกลางของกราฟ

    ภาพการแจกแจงความถี่ด้วยรูปหลายเหลี่ยมความถี่

    โค้งความถี่สะสม ( Cumulative Frequency Polygon )

    โค้งความถี่สะสม คือ แผนภูมิเส้นที่แสดงความถี่สะสมของคะแนนตั้งแต่คะแนนต่ำสุดไปจนถึงคะแนนสูงสุด ใช้หาตำแหน่งของคะแนนและการเปรียบเทียบต่างๆ

    วิธีทำ

      1. สร้างความถี่สะสม
      2. สร้างฮิตโทแกรมของความถี่สะสม
      3. ลากเส้นผ่านปลายของแต่ละช่อง

    ตัวอย่างที่ 3.9 จากตารางให้แจกแจงความถี่ด้วยโค้งความถี่สะสม

    ชั้นคะแนน

    ความถี่ (f)

    ความถี่สะสม (cf)

    ขีดจำกัดชั้นที่แท้จริง

    10 19

    20 29

    30 39

    40 49

    50 59

    60 69

    70 79

    80 89

    4

    10

    15

    15

    25

    30

    20

    5

    4

    14

    29

    44

    69

    99

    119

    124

    10.5 19.5

    19.5 29.5

    29.5 39.5

    39.5 49.5

    49.5 59.5

    59.5 69.5

    69.5 79.5

    79.5 89.5

     

    N = 124

       

    วิธีทำ

    1. สร้างตารางแจกแจงความถี่
    2. หาขีดจำกัดชั้นที่แท้จริง
    3. สร้างฮิทโตแกรมของความถี่สะสมแล้วลากเส้นโค้งผ่าจุดปลายของแต่ละแท่ง

    ภาพแสดงการแจกแจงโค้งความถี่

    ลักษณะโค้งต่างๆ ที่เกิดจากการแจกแจงความถี่

    ในการแจกแจงความถี่ของกราฟข้อมูลจะมีลักษณะเป็นรูปโค้งอย่างไรนั้นขึ้นอยู่กับขนาดและจำนวนของข้อมูล ซึ่งลักษณะของการแจกแจงความถี่โดยกราฟดังนี้

    1. รูปสี่เหลี่ยมผืนผ้า ( Rectangular ) ความถี่ของชั้นคะแนนในแต่ละชั้นเท่ากันทุกชั้นคะแนน
    2. โค้งปกติ ( Normal Curve ) จะมีรูปโค้งคล้ายระฆังคว่ำ โดยที่คนส่วนมากจะได้คะแนนสูงและคะแนนต่ำมีจำนวนพอ ๆ กัน
    3. โค้งเบ้ขวา ( Positive Skew ness ) ลักษณะของข้อมูลที่แจกแจงโค้งลักษณะนี้ คนส่วนใหญ่จะได้คะแนนน้อย และมีคนส่วนน้อยที่ได้คะแนนมาก

         4. โค้งเบ้ซ้าย ( Nagative Skew ness ) ลักษณะของข้อมูลที่แจกแจงโค้งลักษณะ  นี้คนส่วนน้อยจะได้คะแนนน้อย และคนส่วนมากจะได้คะแนนมาก

         5.โค้งรูปตัวยู ( U Skewness ) ลักษณะการแจกแจงข้อมูลโค้งนี้ คนส่วนมากได้คะแนนมาก และคนส่วนน้อยได้คะแนนน้อย

    ***********************************

    การหาตำแหน่งของข้อมูล     ( Percentile Decile Quartile )

    ในการวัดหรือหาตำแหน่งของจ้อมูลชุดหนึ่ง ๆ เพื่อให้ทราบว่าข้อมูลแต่ละข้อมูลนั้นจะอยู่ในตำแหน่งใดและเป็นอำดับที่เท่าไรของกลุ่มข้อมูลนั้น ๆ ซึ่งในการหาตำแหน่งของข้อมูลต่าง ๆ นั้น เราสามารถทำได้โดยแบแงข้อมูลออกเป็นส่วน ๆ ใช้ในการเปรียบเทียบข้อมูลดังนี้

    1. เปอร์เซ็นต์ไทล์ ( Percentile )

      เป็นตำแหน่งของข้อมูลที่มีการแบ่งข้อมูลทั้งหมดออกเป็น 100 ส่วนเท่า ๆ กัน หรือตำแหน่งที่แสดงให้ทราบว่าเป็นอันดับที่เท่าไร หรือมีจำนวนร้อยละเท่าไรของจำนวนคะแนนที่อยู่ต่ำกว่าตำแหน่งนั้น

      1. การคำนวณคะแนน ณ ตำแหน่ง ที่ไม่ได้จัดหมวดหมู่ ( Ungrouped Data ) เรียงคะแนนจากน้อยไปมาก แล้วหาตำแหน่งเปอร์เซ็นต์ไทล์ที่กำหนดให้

        p = ตำแหน่งเปอร์เซ็นต์ไทล์

        n = จำนวนข้อมูล

      2. การคำนวณหาคะแนน ณ เปอร์เซ็นต์ไทล์ที่กำหนดให้ของข้อมูลที่จัดหมวดหมู่ ( Grouped Data ) วิธีการคำนวณหาคะแนน ณ ตำแหน่ง เปอร์เซ็นต์ไทล์ที่กำหนดให้ จะมีลักษณะคล้าย ๆ กับการหามัธยฐาน โดยใช้สูตรคือ

                 

                             p คือ คะแนน ณ ตำแหน่งเปอร์เซ็นต์ไทล์ที่ต้องการ

                             L คือ ขีดจำกัดล่างที่แท้จริงของชั้นที่ต้องการหาเปอร์เซ็นต์ไทล์

                             I คือ อันตรภาคชั้น

                     คือ ความถี่ของชั้นที่เป็นตำแหน่งที่ต้องการ

    ตัวอย่างที่ 4.2  ในการสอบวิชาสถิติ ของนักศึกษาปริญญาตรีสาขาบัญชี จำนวน 50 คน ดังข้อมูลในตาราง ถ้าจิตราสอบได้ในตำแหน่งเปอร์เซ็นต์ไทล์ที่ 35 จงหาว่าจิตราสอบได้คะแนนเท่าไร

    คะแนน

    ความถี่ (f)

    ความถี่สะสม (F)

    10 19

    20 - 29

    6

    8

    6

    14

    30 - 39

    10

    24

    40 49

    50 59

    60 69

    70 - 79

    12

    4

    8

    2

    36

    40

    48

    50

     

    N = 50

     

    วิธีทำ

    P35 อยู่ตำแหน่งที่                

                                                            =

                                                      

                                                     P35 =

                                                           =

                                                            =

    คะแนนในตำแหน่ง P35 ของคะแนนชุดนี้คือ 33 ฉะนั้นแสดงว่าจิตราสอบวิชาสถิติได้คะแนน 33 คะแนน

    1. เดไซล์ ( Deciles )

    เดไซล์ (D) คือการแบ่งข้อมูลออกเป็น 10 ส่วนเท่า ๆ กัน แต่ละข้อมูลนี้มีตำแหน่งเป็นเท่าไร หรือ ตำแหน่งที่แสดงให้ทราบว่ามีจำนวนเท่าใดใน 10 ส่วน ของจำนวนข้อมูลทั้งหมดที่ได้คะแนนต่ำกว่าคะแนน ณ ตำแหน่งนั้น ลักษณะการคำนวณหาก็จะเป็นลักษณะเดียวกับเปอร์เซ็นต์ไทล์ แต่ว่าไดไซล์แบ่งข้อมูลเป็น 10 ส่วน

    ตัวอย่างที่ 4.3 จากข้อมูลคะแนนของนักศึกษาในตาราง จงคำนวณหา เดไซล์ที่ 4 และเดไซล์ที่ 8

    คะแนน

    ความถี่ (f)

    ความถี่สะสม (F)

    10 19

    20 29

    30 39

    40 49

    50 59

    60 69

    70 79

    6

    8

    10

    12

    4

    8

    2

    6

    14

                   24  =  D4

    36

                   40   =   D8

    48

    50

    วิธีทำ

    ตำแหน่งเดไซล์ที่ (D4) คือ     =

    =

                                  D8 คือ       

    สูตร                                              

                                                         

                                                                 =

                                                          

                                                                  =

    ดังนั้นคะแนนในตำแหน่ง D4 ของข้อมูลชุดนี้คือ 35.5 และคะแนนในตำแหน่ง D8 ของข้อมูลชุดนี้คือ 59.5

    3. ควอร์ไทล์ ( Quartiles )

    ควอร์ไทล์ (Q) คือการแบ่งข้อมูลออกเป็น 4 ส่วนเท่า ๆ กัน ใช้บอกตำแหน่งของข้อมูลเพื่อให้ทราบว่าข้อมูลนั้นมีตำแหน่งเป็นอันดับที่เท่าไร หรือ ตำแหน่งที่แสดงให้ทราบว่ามีจำนวนเท่าใดใน 4 ส่วนของจำนวนที่มีค่าต่ำกว่าคะแนน ณ ตำแหน่งนั้น ตำแหน่งควอร์ไทล์ที่ 3 (Q3) ก็คือ 3 ใน 4 ของข้อมูล การคำนวณก็จะเป็นลักษณะเดียวกับเดไซล์และเปอร์เซ็นต์ไทล์ แต่ ควอร์ไทล์แบ่งหมู่ออกเป็น 4 ส่วน

    ตัวอย่างที่ 4.4 จากข้อมูลคะแนนนักศึกษาในตาราง จงคำนวณหา ควอร์ไทล์ที่ 2 และควอร์ไทล์ที่3

    คะแนน

    ความถี่ (f)

    ความถี่สะสม (F)

    10 19

    20 29

    30 39

    40 49

    50 59

    60 69

    70 79

    6

    8

    10

    12

    4

    8

    2

    6

    14

    24

    36 Q2

    40 Q3

    48

    50

     

    N = 50

     

    วิธีทำ   ตำแหน่งควอร์ไทล์ที่ 2 (Q2)

    (Q2) ของคะแนนชุดนี้ตรงกับตำแหน่ง

    (Q3) ของคะแนนชุดนี้ตรงกับตำแหน่ง

    สูตร            

                     

                            =

                    

                           =

    ดังนั้นคะแนนในตำแหน่ง Q2 ของข้อมูลชุดนี้คือ 40.33 และคะแนนในตำแหน่ง Q3 ของข้อมูลชุดนี้คือ 53.25