วันพุธที่ 1 สิงหาคม พ.ศ. 2555

วิธีหา Missing Data และแก้ไขแบบง่าย ๆ ด้วยชุดคำสั่ง STATA

วิธีหา Missing Data และแก้ไขแบบง่าย ๆ ด้วยชุดคำสั่ง STATA


บางครั้งที่เราทำงานใน Stata ในระยะเริ่มแรก เมื่อเราทำการ Cleaning และ Check ข้อมูลเรามักมีปัญหา Missing ที่ซ่อนอยู่ เมื่อเราตรวจสอบและ Verify แล้วต้องการแก้ แต่เอ ไม่คุ้นเคยคำสั่ง วันนี้ผมจะมาแนะนำคำสั่งอย่างง่ายในการเข้าไปหา id ของ missing data กันนะครับเพื่อที่เราจะสามารถ ค้นหาและแทนที่ข้อมูลที่ผิดพลาด ได้อย่างรวดเร็วโดยไม่ต้องผ่าน Stata Data Editors ครับ

1. Check ดู Missing ในชุดข้อมูล โดยใช้คำสั่ง Codebook ข้อมูลแต่ละตัวแปรจะขึ้นมาทั้งหมด

2. หากต้องการแก้เฉพาะจุดเช่น
เราให้ลำดับของ Job หรืออาชีพเป็นลำดับ 1-7 แต่เผอิญมีผู้ลงข้อมูลผิดมาเป็น "73" เราสามารถเข้าไปหาและแก้ไขได้ง่าย ๆ ดังนี้ครับ

2.1 หา id หรือ order ลำดับข้อมูลที่ผิดพลาด
list order job if job=="73" หรือ list job if job=="73"



2.2 แทนที่ด้วยคำสั่ง replace

replace job = "7" in 231
(1 real change made)



3. ในกรณีที่ต้องการดู Missing data ในตารางก็สามารถเรียกดูได้ด้วยคำสั่งแบบเดียวกัน
list job if job==" "
. note : no missing present (ไม่พบ Missing แล้วหลังจากแก้ไขให้ถูกต้อง)
list job if job=="7"





อาจารย์นายแพทย์ ศักดา อาจองค์ วัลลิภากร, พบ, บธบ.

SAKDA ARJ-ONG, MD, BBA, MS.ICT, MA.(Information Science)
PHD program of clinical epidemiology,
Pediatrist, Pediatric Cardiologist, Intervention Pediatric Cardiology
Family physicians, Emergency physicians, Cert Pediatric Emergency Medicine
Emergency Medicine, Ramathibodi Hospital, Mahidol University
"หมอหนึ่ง"พิธีกรรายการ พบหมอรามา Dr.Tech ทาง True Vision 80



1 ความคิดเห็น: