Solution Center Minitab

ผู้เขียน : Solution Center Minitab

อัพเดท: 30 ส.ค. 2016 08.10 น. บทความนี้มีผู้ชม: 3552 ครั้ง

ถ้ามีทางเลือกให้เพิ่มขึ้น ยิ่งต้องทำให้ตัดสินใจมากขึ้น ใน Minitab17 มีการเพิ่มการทดสอบความเท่ากัน (equivalence testing)คุณมีเครื่องมือทางสถิติในการทดสอบค่าเฉลี่ยสิ่งตัวอย่างกับค่าเป้าหมายหรือค่าเฉลี่ยสิ่งตัวอย่างตัวอื่นๆ การทดสอบความเท่ากัน (equivalence testing) มีการใช้งานอย่างแพร่หลายในงานวิทยาศาสตร์ชีวการแพทย์ (Biomedical) ผู้ผลิตในงานเภสัชกรรม (Pharmaceutical) มักจะต้องทำการทดสอบด้านชีววิทยา เรื่องของยาสามัญ (Generic drug) ว่ามีความเทียบเท่ากับยาที่มีตราผลิตภัณฑ์ (brand name) ซึ่งเป็นงานที่ต้องทำในขั้นตอนการขึ้นทะเบียนยาตามกฎหมาย (regulatory approval process)


การทดสอบความเท่ากันในการวิเคราะห์คุณภาพ (ส่วนที่ 1) คุณกำลังพยายามจะพิสูจน์สิ่งใดอยู่

ถ้ามีทางเลือกให้เพิ่มขึ้น ยิ่งต้องทำให้ตัดสินใจมากขึ้น ใน Minitab17 มีการเพิ่มการทดสอบความเท่ากัน (equivalence testing)คุณมีเครื่องมือทางสถิติในการทดสอบค่าเฉลี่ยสิ่งตัวอย่างกับค่าเป้าหมายหรือค่าเฉลี่ยสิ่งตัวอย่างตัวอื่นๆ การทดสอบความเท่ากัน (equivalence testing) มีการใช้งานอย่างแพร่หลายในงานวิทยาศาสตร์ชีวการแพทย์ (Biomedical) ผู้ผลิตในงานเภสัชกรรม (Pharmaceutical) มักจะต้องทำการทดสอบด้านชีววิทยา เรื่องของยาสามัญ (Generic drug) ว่ามีความเทียบเท่ากับยาที่มีตราผลิตภัณฑ์ (brand name) ซึ่งเป็นงานที่ต้องทำในขั้นตอนการขึ้นทะเบียนยาตามกฎหมาย (regulatory approval process)

การแปลผลการทดสอบสมมติฐาน : ความบกพร่องที่เกิดขึ้นเป็นปกติ
สมมติว่าผู้ผลิตพบว่าผู้ผลิตรายใหม่เสนอวัตถุดิบที่มีต้นทุนถูกกว่าและสามารถนำมาใช้ทดแทนในกระบวนการผลิตได้ วัตถุดิบใหม่นี้จะถูกนำมาทดแทนกับวัตถุดิบที่ใช้อยู่ในปัจจุบันซึ่งมีราคาแพงกว่า และถ้าวัตถุดิบตัวใหม่นี้มีคุณภาพเทียบเท่ากับวัตถุดิบเดิม มันไม่ควรจะทำให้การผลิตไม่ยืดหยุ่นเกินไป หรือ ไม่มีข้อจำกัดเกินไป
ในการทวนสอบเพื่อให้แน่ใจว่าการทดแทนวัตถุดิบนั้นจะไม่ส่งผลกระทบต่อคุณภาพ นักวิเคราะห์จะทำการเก็บสิ่งตัวอย่างจากกระบวนการที่ใช้วัตถุดิบทั้งสองชนิด (ซึ่งกระบวนการผลิตต้องเสถียร) นักวิเคราะห์จะใช้การทดสอบ 2-sample t-test (โดยเลือก Stat> Basic Statics > 2-Sample t ในโปรแกรม Minitab) เพื่อช่วยประเมินว่าค่าเฉลี่ยของผลิตภัณฑ์ที่ใช้วัตถุดิบทั้งสองชนิดนั้นมีค่าเหมือนกันหรือไม่

เนื่องจากว่าค่า P-Value มีค่ามากกว่าค่าระดับนัยสำคัญ (0.05) นักวิเคราะห์จึงสรุปว่าค่าเฉลี่ยทั้งสองไม่แตกต่างกัน และจากผลการวิเคราะห์นี้ บริษัทจึงทำการเปลี่ยนวัตถุดิบ เพราะผลจากการวิเคราะห์ทางสถิติพบว่าบริษัทจะสามารถประหยัดต้นทุนได้ด้วยการใช้วัตถุดิบชนิดใหม่และคุณภาพผลิตภัณฑ์ไม่เปลี่ยนแปลง ผลการการทดสอบทำให้ทุกคนมีความสุข และฉลองกับผลที่ทดสอบได้ แต่ยังมีปัญหาหนึ่งรออยู่ การวิเคราะห์ทางสถิติไม่ได้พิสูจน์ว่าค่าเฉลี่ยนั้นเหมือน (same) กันหรือไม่

ถ้า P-Value น้อยกว่าค่าระดับนัยสำคัญ คุณสามารถสรุปได้ว่ามีความแตกต่างอย่างมีนัยสำคัญ แต่ถ้า P-Value มีค่ามากกว่าระดับนัยสำคัญหมายความว่าค่าเฉลี่ยนั้นเท่ากัน และคุณยังไม่มีหลักฐานเพียงพอที่จะพิสูจน์ได้ว่าค่าเฉลี่ยทั้งสองไม่เท่ากัน การไม่ปรากฏหลักฐานไม่ได้เป็นการพิสูจน์ข้อความที่ตรงกันข้ามกับสิ่งที่ปรากฏ ซึ่งนั่นหมายความว่าถ้าคุณมีหลักฐานไม่เพียงพอที่จะบอกว่า A เป็นจริง ซึ่งเท่ากับว่าคุณไม่ได้พิสูจน์ว่า A เป็นเท็จ การทดสอบความเท่ากัน (Equivalence test) เป็นอีกประเด็นหนึ่งของข้อความนี้ ในการทดสอบความเท่าเทียมกันของสิ่งตัวอย่าง 2 กลุ่ม สมมติฐานหลัก จะเป็นสิ่งตรงกันข้ามกับการทดสอบ 2-sample t-test

ซึ่งทำให้ภาระการพิสูจน์ถูกสลับกันในการทดสอบ และยังทำให้การทำให้การตั้งสมมติฐานหลักในการทดสอบในรูปแบบต่างๆกลับทางกันอีกด้วย

กรณีศึกษา : สมมติฐานของความถูกต้อง (Innocence) และ ความผิด (Guilt)
แนวคิดในการเปรียบเทียบนี้อาจจะทำให้คุณสามารถนึกภาพตามได้ง่ายขึ้น ในขั้นตอนของศาลการพิจารณาความตามกฎหมาย ภาระการพิสูจน์ คือ การพิสูจน์ว่ามีความผิดหรือไม่ ผู้ต้องสงสัยจะถูกเชื่อว่าเป็นผู้บริสุทธิ์ หรือ เป็นผู้ทำถูกต้อง (H0) จนกระทั่งพิสูจน์ได้ว่ามีความผิดจริง (H1) แต่ในงานข่าวสาร ภาระการพิสูจน์จะเป็นตรงกันข้าม คือ ผู้ต้องสงสัยจะถูกเชื่อว่าเป็นมีความผิด (H0) จนกว่าจะพิสูจน์ได้ว่ามีความบริสุทธิ์ การเปลี่ยนภาระการพิสูจน์ ทำให้ผลการสรุปแตกต่างกัน นั้นจึงเป็นเหตุที่ทำไมในงานข่าวสารจึงมักจะแสดงถึงความโหดร้ายของผู้ต้องสงสัยที่ถูกกว่าหาว่ามีความผิด ได้รับการปล่อยตัวเพราะไม่มีหลักฐานเพียงพอที่จะพิสูจน์ได้ว่าผู้ต้องสงสัยกระทำผิดจริงในชั้นศาล และตราบใดที่งานข่าวสาร และ งานในการพิจาณาชั้นศาล ยังมีสมมติฐานหลักและสมมติฐานทางเลือกที่ตรงข้ามกัน ผลสรุปของทั้งสองฝ่ายก็จะแตกต่างกันต่อให้พิจารณาบนหลักฐานเดียวกันก็ตาม ทำไมถึงมีการสร้างสมมติฐานแตกต่างกัน เพราะว่าความคิดที่ต่างกันในเรื่องการมองข้อผิดพลาดที่จะเกิดขึ้นอะไรจะส่งผลที่แย่กว่ากัน ในกระบวนการยุติธรรมความเชื่อเรื่องความผิดพลาดที่ส่งผลแย่กว่าคือการตัดสินกล่าวหาผู้บริสุทธิ์และดีกว่าคือปล่อยตัวผู้ทำผิดไป ส่วนงานข่าวสารมีความเชื่อในทางตรงกันข้าม (อาจเพราะว่าการว่าความผิดนั้นขายได้มากว่าการเชื่อว่าถูกต้อง) เมื่อภาระการพิสูจน์เปลี่ยนไป คำสรุปอาจจะเปลี่ยนแปลงด้วย

จากตัวอย่างแรกในการวิเคราะห์คุณภาพ เพื่อหลีกเลี่ยงที่จะเสียลูกค้าไป บริษัทเลี่ยงที่จะสรุปว่าคุณภาพจะไม่เปลี่ยนแปลงต่อให้ใช้วัตถุดิบที่มีราคาถูกกว่า ทั้งที่จริงมันใช้ได้ และความผิดพลาดจะยังคงเหมือนเดิม เมื่อในที่จริงวัตถุดิบนั้นไม่สามารถใช้ทดแทนได้ เพื่อให้ผลในการแสดงให้เห็นว่าค่าเฉลี่ยมีความเหมือนกัน การวิเคราะห์จะใช้วิธี 2 sample equivalence test (Stat > Equivalence Tests > Two Sample)

ใช้ข้อมูลเดิมในการทดสอบความเท่าเทียมกัน ผลลัพธ์ที่ได้ชี้ให้เห็นว่า ไม่มีหลักฐานเพียงพอที่จะบอกว่าค่าเฉลี่ยทั้งสองค่าเหมือนกัน ดังนั้นบริษัทจึงไม่มั่นใจว่าคุณภาพของผลิตภัณฑ์นั้นจะมีปัญหาหรือไม่ ซึ่งถ้าทำการเปลี่ยนวัตถุดิบเป็นตัวที่มีราคาถูกกว่า ในการทดสอบด้วยวิธีการทดสอบความเท่าเทียมกัน บริษัทพบว่ามีโอกาสที่ค่าเฉลี่ยกระบวนการจะมีการเปลี่ยนแปลงได้

หมายเหตุ ถ้าดูจากผลลัพธ์ด้านบน คุณจะเห็นว่าวิธีการทดสอบความเท่าเทียมกันนั้นแตกต่างจากการทดสอบ t-test การทดสอบ two one-sided t-test ใช้เพื่อทดสอบสมมติฐานหลัก และวิธีทดสอบใช้พื้นที่ของความเท่าเทียมกันในการบอกว่าขนาดความแตกต่างคือระหว่างค่าเฉลี่ยที่พิจารณาในทางปฏิบัตินั้นไม่มีนัยสำคัญ รายละเอียดเพิ่มเติมสามารถหาได้ที่บทความต่อไป
http://blog.minitab.com/blog/statistics‐and‐quality‐data‐analysis/equivalencetesting‐for‐quality‐analysis‐part‐ii‐what‐difference‐does‐the‐difference‐make

บทสรุป (Quick Summary)
ในการเลือกระหว่างวิธีการทดสอบความเท่าเทียมกัน และ วิธี t ต้องพิจารณาสิ่งที่คุณต้องการจะพิสูจน์ สิ่งใดก็ตามที่คุณต้องการพิสูจน์ความจริงควรจะนำมาไว้ที่สมมติฐานทางเลือก (alternative hypothesis)เพื่อทดสอบและเป็นภาระที่ต้องการการพิสูจน์ (Burden of proof) และสิ่งใดก็ตามแต่ที่เป็นสิ่งที่ก่อให้เกิดความเสียหายที่น้อยกว่าถ้าไม่ถูกต้องตามที่ตั้งสมมติฐานไว้ ให้นำไปไว้ที่สมมติฐานหลัก (null hypothesis) ถ้าคุณต้องการที่จะพิสูจน์ว่าค่าเฉลี่ยทั้งสองนี้มีค่าเหมือนกัน หรือ ค่าเฉลี่ยนั้นมีค่าเท่ากับค่าเป้าหมายหรือไม่ คุณควรเลือกใช้วิธีการทดสอบความเท่าเทียมกัน (equivalence test) แทนการใช้วิธีการทดสอบ t – test

Comment

Name: Stan Alekman; อังคารที่ 8 เมษายน 2557
ในตัวอย่างนี้ ในวิธีการ 2 –sample t-test บอกว่าไม่มีหลักฐานเพียงพอที่จะพิสูจน์ว่า Ha เป็นเท็จ แต่ถ้าเราใช้สิ่งตัวอย่างจำนวนมากขึ้นจนสามารถตรวจจับความแตกต่างที่เราต้องการได้ ซึ่งอาจจะเป็นความแตกต่างที่น้อยที่สุดที่เราต้องการเห็นด้วยอำนาจการทดสอบ 90% ซึ่งหมายความว่ายังมี 10% ที่จะมีโอกาสที่จะไม่สามารถตรวจจับความแตกต่างด้วยจำนวนสิ่งตัวอย่างนี้ และถ้าเราทำการยอมรับ H0 ด้วยความเข้าใจว่าค่าความแตกต่างนั้นต่ำกว่าค่าที่ควรจะแตกต่างน้อยที่สุดที่การทดสอบจะถือว่ามีความเท่าเทียมกัน ทำไมเราจะไม่สามารถใช้วิธีการทดสอบ 2-sample t-test แบบทั่วไปได้ ในกรณีนี้เราน่าจะสามารถใช้วิธีนี้ได้ใช่หรือไม่ ซึ่งเราจะสรุปว่า H0 เป็นจริง

Name: Patrick (ผู้เขียนบทความ); พฤหัสบดีที่ 10 เมษายน 2557
ประเด็นเยี่ยม ผมหวังไว้ว่าจะมีคนยกประเด็นเรื่องอำนาจการทดสอบของวิธีการ t-test
ประเด็นที่คุณพูดนั้นถูกต้องแล้ว ถ้าอำนาจในการทดสอบของวิธี 2-sample t-test คือ 90% และคุณไม่ทำการปฏิเสธ H0 หมายความว่าคุณมีโอกาส 10% ที่การทดสอบนี้ตรวจจับความแตกต่างที่มีนัยสำคัญของค่าเฉลี่ยทั้งสองนี้ไม่ได้ ทั้งๆที่ค่าเฉลี่ยทั้งสองนี้มีความแตกต่างกันอยู่จริง ถ้าในกรณีที่คุณประยุกต์ใช้ คุณให้อำนาจในการทดสอบมีค่าสูง และคุณรู้สึกสบายใจกับค่าโอกาส 10% ที่ยังให้การทดสอบนั้นเกิดข้อผิดพลาดได้ ในการตรวจจับความแตกต่างที่มีนัยสำคัญของประชากร และเนื่องด้วยความผิดพลาดเชิงสุ่ม คุณอาจจะรู้สึกพึงพอใจที่จะใช้การทดสอบมาตรฐาน t-test ซึ่งรู้สึกว่ามีเหตุการณ์ที่เชื่อถือได้ว่า H0 เป็นจริง (ค่าเฉลี่ยประชากรมีค่าเหมือนกัน) ถ้าการทดสอบไม่ได้ตรวจจับความแตกต่างที่มีนัยสำคัญ
อย่างไรก็ตาม ที่ระดับนัยสำคัญ 0.05 และในจุดนี้ถ้าคุณมีโอกาสมากกว่า 5% ที่จะเกิดความผิดพลาดแบบ Type 2 ซึ่งมากกว่าโอกาสในการเกิดความผิดพลาดแบบ Type 1 ซึ่งแม้จะมีอำนาจในการทดสอบที่มีค่ามากก็ตาม ถ้าความผิดพลาดแบบ Type 2 เป็นสิ่งที่ให้ความสนใจมากกว่าความผิดพลาดแบบ Type 1 คุณควรที่จะใช้วิธีการทดสอบความเท่าเทียมกัน ซึ่งมีการสลับสมมติฐานในการทดสอบ และจะทำให้ความผิดพลาดที่เกิดขึ้นนั้นลดลง
ประเด็นที่น่าสนใจคือ ในทางปฏิบัติ อำนาจในการทดสอบที่ค่า 90% เป็นไปได้ยากที่จะทำให้เกิดขึ้นได้จริง ในความเป็นจริง 80% เป็นตัวเลขที่ถือเป็นค่าเปรียบเทียบที่นำมาพิจารณา และในความเป็นจริงค่าอำนาจการทดสอบมากๆเป็นไปได้ยากที่จะทำได้จริง เนื่องจากข้อจำกัดเรื่องงบประมาณ หลายๆครั้งนักวิจัยผู้ที่ทำการทดสอบมักจะประสบปัญหาว่าไม่มีทรัพยากรเพียงพอที่จะนำมาทดสอบเพื่อให้ได้ค่าอำนาจการทดสอบตามที่ต้องการ ดังนั้นในโลกความเป็นจริงที่ไม่สมบูรณ์แบบ ค่าอำนาจการทดสอบที่ทำได้จริงมักจะมีค่า 70% 60% หรือ น้อยกว่านั้น และค่าโอกาสของความผิดพลาดแบบ Type 2 ในโลกแห่งความเป็นจริงที่ใช้วิธีทดสอบสมมติฐานแบบมาตรฐานอาจจะสูงถึง 30%
ด้วยจากเหตุผลที่กล่าวมาทั้งหมด การทดสอบความเท่าเทียมกันที่มีการพัฒนามาใช้ครั้งแรกในการทดสอบชีวสมมูล (Bioequivalence trials) เพื่อทำให้การศึกษานั้นมีผลที่เพียงพอที่จะทำให้ค่าอำนาจแห่งการทดสอบนั้นเพียงพอที่จะลดค่าความผิดพลาดแบบ Type 2 ลงได้จากการทดสอบสมมติฐานด้วยวิธีมาตรฐาน ( ความผิดพลาดแบบ type 2 ในกรณีนี้อาจจะหมายถึงการอ้างของยาสามัญที่บอกว่ามีความเท่าเทียมกับยาที่ถูกนำมาทดสอบเปรียบเทียบ ซึ่งจริงมันไม่เท่าเทียมกัน ความผิดพลาดที่วิกฤติคือคนที่ใช้ยาสามัญนี้ไม่ได้รับผลที่เท่าเทียมกันกับตัวยาที่กล่าวอ้างไว้) ดังนั้น ความจำเป็นในการสลับสมมติฐานหลักและสมมติฐานทางเลือกจึงมีประโยชน์มากกว่าในการลดค่าความผิดพลาดแบบ type1 ให้น้อยกว่า 0.05 คือการแสดงความเท่าเทียมกัน ซึ่งให้โอกาส 5% ในการปฏิเสธสมมติฐานหลัก และสรุปว่ามีความเท่าเทียมกัน แต่ในความเป็นจริงนั้นค่าเฉลี่ยประชากรทั้งสองนั้นแตกต่างกันอย่างมีนัยสำคัญ
สามารถหารายละเอียดเพิ่มเติมในหัวข้อนี้จากบทความที่จะมีต่อไป
ขอบคุณสำหรับข้อคิดเห็นดีๆ ผมรู้สึกยินดีอย่างมาก

Name: Wayne G. Fischer, PhD. อังคารที่ 22 เมษายน 2557
ผมรู้สึกสงสัยว่าถ้าเราให้ความสำคัญในการสลับวัตถุดิบและยังคงความพึงพอใจของลูกค้าไว้ด้วย วิธีที่ดีกว่าใช้การทดสอบความเท่าเทียมกันคือการทำ DOE เพื่อดูว่าวัตถุดิบนั้นมีสมรรถนะที่เท่าเทียมกับของเดิมจริงหรือไม่ ซึ่งเป็นการศึกษาให้ครอบคลุมพื้นที่ที่เป็นไปได้ทั้งหมดไม่ใช่เพียงแค่เงื่อนไขใดเพียงชุดเดียว
หลังจากที่ทำการปรับเปลี่ยนเงื่อนไขแบบต่างๆ โดยเฉพาะในการผลิต และการปรับเปลี่ยนต่างๆเพื่อทำให้ชดเชยจนเกิดความเสถียร (Robustness) ซึ่งผมต้องการการประเมินที่เสถียรของความเท่าเทียมกัน

Name: Patrick (ผู้เขียนบทความ); พฤหัสบดีที่ 23 เมษายน 2557
ผมเห็นด้วยกับข้อคิดเห็นของคุณ และดีใจที่คุณยกประเด็นนี้ขึ้นมา ในกรณีที่ความผิดพลาดแบบ Type 2 มีความสำคัญมากกว่าความผิดพลาดแบบ type 1 และผมขออธิบายประเด็นของบทความนี้ให้ชัดเจน ในบทความนี้ไม่ได้มีเจตนาว่า การใช้วิธีการทดสอบความเท่าเทียมกันนั้นเพื่อจะมาหาว่าควรจะเปลี่ยนผู้ส่งมอบวัตถุดิบหรือไม่ แต่ถ้าคุณใช้การทดสอบมาตรฐาน t-test เพื่อทำการพิสูจน์ว่าค่าเฉลี่ยกระบวนการนั้นมีค่าเท่ากันหรือเท่ากับค่าเป้าหมาย และผลที่เกิดขึ้นของความผิดพลาดแบบ type 2 นั้นมีความสำคัญมากกว่า ความผิดพลาดแบบ type 1 ก็ให้พิจารณาวิธีการทดสอบความเท่าเทียมกันทดแทนดีกว่า
และจากคำแนะนำของคุณว่า การทดสอบด้วยวิธี t-test อย่างเดียว หรือ วิธีทดสอบความเท่าเทียมกันอาจจะไม่ให้หลักฐานที่เพียงพอที่ทำให้สลับวัตถุดิบได้ในหลายๆครั้งของการทดสอบ ซึ่งต้องขึ้นกับกระบวนการ ผลิตภัณฑ์ ทรัพยากรที่มีอยู่ และปัจจัยที่สามารถเปลี่ยนแปลงได้ในเงื่อนไขการทำงาน และอื่นๆ จากประเด็นที่คุณกล่าวมา กระบวนการต่างๆนั้นต่างกัน ทำให้เราต้องทำการทดสอบหลายครั้งๆก่อนที่จะบอกได้ว่ากระบวนการนั้นมีความเปลี่ยนแปลงที่มีนัยสำคัญจริงๆ การศึกษาระบบการวัดเป็นระบบหนึ่งที่ต้องทำการศึกษาเพื่อดูว่าระบบการวัดนั้นให้ค่าที่ถูกต้องและเที่ยงตรง แผนภูมิควบคุมถูกนำมาใช้เพื่อดูว่าค่าเฉลี่ยและความผันแปรของกระบวนการนั้นมีความเสถียรจริง การศึกษาความสามารถกระบวนการเพื่อประเมินว่ากระบนการนั้นยังอยู่ภายใต้ข้อกำหนดเฉพาะหรือไม่ DOE นำมาประเมินค่าตอบสนองว่าอยู่ในเงื่อนไขการทำงานหรือไม่
ขอบคุณสำหรับความคิดเห็น

Sean:
ผมจะต้องใช้จำนวนสิ่งตัวอย่างจำนวนเท่าไหร่ เพื่อชี้ให้ความเป็นเนื้อเดียวกันของส่วนบนสุด ส่วนกลางและส่วนล่างว่ามีค่าเท่ากับหรือน้อยกว่า 3% วิธีการทางสถิติใดที่ผมสามารถนำมาใช้อธิบายว่าการใช้จำนวนสิ่งตัวอย่าง 15 ตัวอย่างนั้นมาจากส่วนบนสุด ส่วนกลาง และส่วนล่างของหลอดเลือด (vessel) และค่าอำนาจการทดสอบควรเป็น0.8 หรือ 0.9 โดยทั่วไปแล้วข้อมูลใดบ้างที่จำเป็นต้องใช้ในการกำหนดจำนวนสิ่งตัวอย่างเพื่อตรวจจับความแตกต่าง ผลที่เปลี่ยนแปลง และความเป็นเนื้อเดียวกันในหลอดเลือด ข้อมูลใดบ้างที่จำเป็นต้องมีเพื่อใช้ในการทดสอบเพื่อดูว่าความแตกต่างที่มากกที่สุดที่ยอมรับได้ว่าวิธีทั้งสองนั้นตามการทดสอบด้วยวิธีความเท่าเทียมกัน

Prunkel
ในการหาจำนวนสิ่งตัวอย่างที่จะใช้ในการทดสอบด้วยวิธีความเท่าเทียมกัน ใน Minitab เลือก Stat>Power and Sample Size> Equivalence Tests > [type of test] คุณจะต้องทำการเลือกรูปแบบความเท่าเทียมกัน (เช่น สมมติฐาน) ที่คุณต้องการทดสอบ ขีดจำกัดของความเท่าเทียมกัน ค่าความเบี่ยงเบนมาตรฐาน (ซึ่งเป็นค่าประมาณค่าของค่าเบี่ยงเบนมาตรฐานของประชากร ซึ่งอาจจะมาจากการประมาณค่าจากความรู้ในอดีต หรือสิ่งตัวอย่างก่อนหน้านี้) ซึ่งคุณต้องทำการใส่ค่า 2 ค่าในค่าต่อไปนี้ ซึ่งค่าจำนวนสิ่งตัวอย่าง(ซึ่งคุณจะปล่อยว่างไว้ เพราะว่าเป็นค่าที่ต้องการจะได้จากโปรแกรม) ขนาดความแตกต่าง (หรือ อัตราส่วนความแตกต่าง) ที่ต้องการตรวจจับ และค่าอำนาจในการทดสอบ (เช่น 0.80, 0.90 ) วิธีที่ง่ายที่สุดคือ เลือกคำสั่ง the power and sample size ใน Minitab เลือก Help และ เลือก Example จากนั้นคุณก็สามารถทำตามขั้นตอนต่างๆ
ในการกำหนดค่าความแตกต่างที่มากที่สุดที่ยอมรับได้ จากในกรณีของคุณ (ความเป็นเนื้อเดียวกันในหลอดเลือด – ซึ่งเป็นเรื่องที่ผมไม่มีความถนัด) คุณควรจะเริ่มต้นจากงานวิจัยที่เคยทำซึ่งไม่ได้เกี่ยวข้องกับคำถามในเรื่องสถิติ คุณสามารถหาเนื้อหาเพิ่มเติมในการตั้งค่าขีดจำกัดความเท่าเทียมได้ที่
http://blog.minitab.com/blog/statistics-and-quality-data-analysis/equivalence-testing-for-quality-analysis-part-ii-what-difference-does-the-difference-make
ขอบคุณสำหรับข้อคิดเห็น

Stan Alekman
ความคิดเห็นของ Wayne ดีมาก มันมีความแตกต่างระหว่างการใช้วิธีทดสอบ t-test และequivalence test สำหรับการศึกษาบางอย่าง (R&D) ที่ไม่ใช่งานทวนสอบหรือตรวจสอบความถูกต้อง ในสายงานอุตสาหกรรมยา ซึ่งผมทำงานอยู่ การเรียนรู้จะเกิดจากงานคุณภาพ และงานออกแบบ ซึ่งเป็นสิ่งที่ Wayne ได้ย้ำความสำคัญไว้ แต่อย่างไรก็ตามผมเชื่อว่าในงานควบคุมเราจะทำการทวนสอบด้วยวิธี t-test และ equivalence test หรือ ANOVA

MissGooseberry
ฉันสงสัยว่า วิธี equivalence test ของประชากรหนึ่งกลุ่มหรือประชากรสองกลุ่ม มีใน Minitab 17 หรือไม่ และมันเหมือนกับวิธีการ t test แบบด้านเดียวของ 2 ประชากร (two one –side t-test , TOST)หรือไม่ และในการคำนวณนั้นแตกต่างกันหรือไม่ หรือเพียงแค่ชื่อที่แตกต่างกัน
Prunkel

ขอบคุณที่อ่านบทความและแสดงความคิดเห็น

ผมได้นำคำถามของคุณไปถามกับนักวิจัยด้านสถิติใน Minitab ได้รับคำตอบว่า วิธี equivalence test ที่ใช้ใน Minitab 17 นั้นไม่เหมือนกับ วิธีการทดสอบแบบ two one-sided-t-test (TOST) และคุณสามารถหาอ่านเพิ่มเติมได้จาก Hsu, Hwang, Liu, Ruberg. Confidence intervals associated with tests for bioequivalence. Biometrika (1994), 81,1, 103-14. Berger, Hsu. Bioequivalence trials, intersection-union tests, and equivalence confidence sets. Statistical Science 1996, 11, 4, 283-319.

คุณยังสามารถอ่านความคิดเห็นในบทความส่วนที่ 2 ของเรืองนี้ ตาม http://blog.minitab.com/blog/statistics-and-quality-data-analysis/equivalence-testing-for-quality-analysis-part-ii-what-difference-does-the-difference-make ถ้าคุณต้องการใช้ TOST เพื่อทำการทดสอบความเท่าเทียมใน Minitab เลือก Options และ ทำเครื่องหมายเลือก “Use ( 1-2 alpha) x 100% CI” Minitab จะทำการคำนวณผลลัพธ์ด้วยวิธี TOST ให้กับคุณ สำหรับข้อมูลวิธีการและสูตรที่ใช้คำนวณในส่วน Equivalence test ใน Minitab คุณดูรายละเอียดได้ที่ Help>Method and Formulas ซึ่งอยู่ภายใต้ส่วน General Statistics และเลือก Equivalence testing

Nandakishore • 7 months ago
ผมมีกรณีที่จะต้องทำการตรวจสอบเรื่องความเท่าเทียม
1. สิ่งตัวอย่าง A จำนวน 50 ข้อมูล และ สิ่งตัวอย่างB จำนวน 3 ข้อมูล มันเพียงพอหรือไม่ที่จะทำการทดสอบ equivalence test และในการคำนวณค่าอำนาจการทดสอบ ผมสามารถใช้ค่าจำนวนข้อมูลทั้งหมด 53 ได้หรือไม่
2. สิ่งตัวอย่างต้องมีการแจกแจงที่จำเพาะเลยหรือไม่ ในการที่จะนำมาใช้กับวิธีการทดสอบนี้

prunkel Nandakishore •
application. That said, let me try to shed some general light on both points you raise.
ในส่วนของการให้ความคิดเห็นนี้ ผมไม่สามารถแนะนำได้มากนัก ทั้งนี้ในการประยุกต์ใช้งานจะต้องมีการพิจารณาปัจจัยในการทำงานอีกหลายด้าน แต่ผมจะชี้ประเด็นตามที่คุณถามมาดังนี้

วิธีการทดสอบ Equivalence สำหรับ 2 ประชากร ค่าอำนาจการทดสอบและจำนวนสิ่งตัวอย่างที่ Minitab ทำการคำนวณนั้นจะเป็นค่าสำหรับแต่ละประชากร (ไม่ใช่ผลรวมของจำนวนประชากรทั้ง 2 กลุ่ม) และด้วยจำนวน 3 ข้อมูลในหนึ่งตัวอย่าง การได้ค่าอำนาจการทดสอบที่ดีย่อมเป็นไปได้ยาก แต่ขึ้นกับว่าคุณได้มีการควบคุมความแปรปรวนและการให้คำนิยามสำหรับความเท่ากันไว้อย่างไร

ในการทดสอบ equivalence ด้วยการใช้ t-test ซึ่งจะกำหนดว่าการแจกแจงจะต้องเป็นการแจกแจงแบบปกติ อย่างไรก็ตามจำนวนสิ่งตัวอย่างต้องมีอย่างน้อย 15 หรือ มากกว่านั้น และต้องไม่มีค่า outliers ซึ่งจะทำให้ t-test (หรือ Equivalence test) นี้ไม่อ่อนไหวต่อคุณสมบัติเรื่องการแจกแจงที่เป็นแบบปกติหรือไม่

และถ้าจำนวนสิ่งตัวอย่างน้อยกว่า 15 แบบในกรณีของคุณ ( 3 ตัวอย่าง) ผลลัพธ์อาจมีผลกระทบจากคุณสมบัติที่มีการแจกแจงไม่ใช่แบบปกติ ซึ่งปัญหาคือ ด้วยจำนวนตัวอย่างที่มีน้อยการประเมินคุณสมบัติว่ามีการแจกแจงแบบปกติหรือไม่อาจทำได้ยาก


บทความต้นฉบับ : http://blog.minitab.com/blog/statistics-and-quality-data-analysis/equivalence-testing-for-quality-analysis-part-i-what-are-you-trying-to-prove

เนื้อหาบทความโดยบริษัท Minitab Inc. ประเทศสหรัฐอเมริกา
แปลและเรียบเรียงโดยสุวดี นําพาเจริญ และ ชลทิขา จํารัสพร, บริษัท โซลูชั่น เซ็นเตอร์ จํากัด webadmin@solutioncenterminitab.com

 


บทความนี้เกิดจากการเขียนและส่งขึ้นมาสู่ระบบแบบอัตโนมัติ สมาคมฯไม่รับผิดชอบต่อบทความหรือข้อความใดๆ ทั้งสิ้น เพราะไม่สามารถระบุได้ว่าเป็นความจริงหรือไม่ ผู้อ่านจึงควรใช้วิจารณญาณในการกลั่นกรอง และหากท่านพบเห็นข้อความใดที่ขัดต่อกฎหมายและศีลธรรม หรือทำให้เกิดความเสียหาย หรือละเมิดสิทธิใดๆ กรุณาแจ้งมาที่ ht.ro.apt@ecivres-bew เพื่อทีมงานจะได้ดำเนินการลบออกจากระบบในทันที