Data Analytics | Insights & Research

PUAY101

หาความน่าจะเป็นจาก Contingency table

ความน่าจะเป็นเบื้องต้น

ความน่าจะเป็นของเหตุการณ์ = เหตุการณ์ที่สนใจ/โอกาศที่เกิดขึ้นทั้งหมด

Probability formula.
Using Contingency Tables to Calculate Probabilities – Statistics By Jim

ทำตารางความถี่ -> แสดงจำนวนผู้โดยสารทั้งหมด -> แสดงเป็นสัดส่วน -> วิเคราะห์ความน่าจะเป็นร่วม ทั้งหมดนี้สามารถทำได้ใน R โดยไม่ต้องโหลด Package อะไรมาเลย! มาลองทำกัน

# สร้าง contingency table
tab <- xtabs(Freq ~ Sex + Survived, data = titanic_df)
tab
# [1]
addmargins(ctab)
# [2]
prop.table(tab, margin = 1)
# [3]
prob.table(tab)

ตาราง 1 แสดงจำนวนผู้โดยสารตามกลุ่ม Sex และ Survived

  • ผู้ชายเสียชีวิต 1,364 คน และรอด 367 คน
  • ผู้หญิงเสียชีวิต 126 คน และรอด 344 คน

ตาราง 2 แสดงเป็นสัดส่วน (proportion) เพื่อให้เห็นชัดขึ้นว่าในแต่ละเพศมี “โอกาสรอด” เท่าไร เราสามารถใช้

  • ผู้ชายรอดประมาณ 21%
  • ผู้หญิงรอดประมาณ 73%

ตาราง 3 ความน่าจะเป็นร่วม (Joint Probability)

Joint probability คือ ความน่าจะเป็นที่เหตุการณ์สองอย่างเกิดพร้อมกัน เช่น “เป็นผู้หญิงและรอดชีวิต” (ก็คือเราเอาตัวเลขผู้หญิงที่รอดชีวิต(344)ไปหารกับรวมคนบนเรือทั้งหมด(2,201) จะได้ ประมาณ 15.6% เป็นต้น)

สามารถสรุปออกมาได้ว่า:

  • ความน่าจะเป็นที่ “เป็นผู้หญิงและรอดชีวิต” = 0.156 หรือ 15.6%
  • ความน่าจะเป็นที่ “เป็นผู้ชายและเสียชีวิต” = 0.648 หรือ 64.8%

References

Using Contingency Tables to Calculate Probabilities – Statistics By Jim

Joint Probability: Definition, Formula & Examples – Statistics By Jim

Comments

Leave a Reply

Discover more from PUAY101

Subscribe now to keep reading and get access to the full archive.

Continue reading