การโฆษณา

บ้าน - บริการ
สเปียร์แมน, เคนดัลล์จัดอันดับสัมประสิทธิ์สหสัมพันธ์, สัมประสิทธิ์เฟชเนอร์ Kendall และ Spearman จัดอันดับสัมประสิทธิ์สหสัมพันธ์ Kendall rank ตัวอย่างสัมประสิทธิ์สหสัมพันธ์

การนำเสนอและการประมวลผลล่วงหน้าของการประเมินผู้เชี่ยวชาญ

ในทางปฏิบัติมีการใช้การประเมินหลายประเภท:

- เชิงคุณภาพ (บ่อยครั้ง - หายาก, แย่ลง - ดีกว่า, ใช่ - ไม่ใช่)

- การให้คะแนนระดับ (ช่วงค่า 50-75, 76-90, 91-120 ฯลฯ )

คะแนนจากช่วงเวลาที่กำหนด (จาก 2 ถึง 5, 1 -10) เป็นอิสระร่วมกัน

จัดอันดับ (วัตถุจะถูกจัดเรียงโดยผู้เชี่ยวชาญตามลำดับที่แน่นอน และแต่ละรายการจะได้รับหมายเลขประจำเครื่อง - อันดับ),

เปรียบเทียบได้มาจากวิธีเปรียบเทียบวิธีใดวิธีหนึ่ง

วิธีการเปรียบเทียบตามลำดับ

วิธีการเปรียบเทียบปัจจัยแบบคู่

ในขั้นตอนต่อไปของการประมวลผลความคิดเห็นของผู้เชี่ยวชาญ จำเป็นต้องประเมิน ระดับของข้อตกลงระหว่างความคิดเห็นเหล่านี้

การให้คะแนนที่ได้รับจากผู้เชี่ยวชาญถือได้ว่าเป็นตัวแปรสุ่ม ซึ่งการกระจายดังกล่าวสะท้อนถึงความคิดเห็นของผู้เชี่ยวชาญเกี่ยวกับความน่าจะเป็นของการเลือกเหตุการณ์ (ปัจจัย) โดยเฉพาะ ดังนั้น เพื่อวิเคราะห์การแพร่กระจายและความสม่ำเสมอของการประเมินโดยผู้เชี่ยวชาญ จึงมีการใช้คุณลักษณะทางสถิติทั่วไป - ค่าเฉลี่ยและการวัดค่าของการแพร่กระจาย:

ค่าคลาดเคลื่อนกำลังสองเฉลี่ย

ช่วงการเปลี่ยนแปลงต่ำสุด – สูงสุด

- ค่าสัมประสิทธิ์การเปลี่ยนแปลง V = ค่าเบี่ยงเบนกำลังสองเฉลี่ย / ค่าเฉลี่ยเลขคณิต (เหมาะสำหรับการประเมินทุกประเภท)

V i = σ i / x i เฉลี่ย

สำหรับการประเมินผล มาตรการความคล้ายคลึงกันและความคิดเห็น ผู้เชี่ยวชาญแต่ละคู่สามารถใช้วิธีการได้หลากหลาย:

ค่าสัมประสิทธิ์การเชื่อมโยงด้วยความช่วยเหลือในการพิจารณาจำนวนคำตอบที่ตรงกันและไม่ตรงกัน

ค่าสัมประสิทธิ์ความไม่สอดคล้องกันความคิดเห็นของผู้เชี่ยวชาญ

มาตรการทั้งหมดนี้สามารถใช้เพื่อเปรียบเทียบความคิดเห็นของผู้เชี่ยวชาญสองคน หรือเพื่อวิเคราะห์ความสัมพันธ์ระหว่างชุดของการประเมินในสองคุณลักษณะ

ค่าสัมประสิทธิ์สหสัมพันธ์อันดับคู่ของสเปียร์แมน:

โดยที่ n คือจำนวนผู้เชี่ยวชาญ

c k – ความแตกต่างระหว่างการประมาณค่าของผู้เชี่ยวชาญ i-th และ j-th สำหรับปัจจัย T ทั้งหมด

ค่าสัมประสิทธิ์สหสัมพันธ์อันดับของ Kendall (ค่าสัมประสิทธิ์ความสอดคล้อง) ให้การประเมินโดยรวมของความสอดคล้องของความคิดเห็นของผู้เชี่ยวชาญทุกคนในทุกปัจจัย แต่เฉพาะในกรณีที่มีการใช้การประมาณอันดับเท่านั้น

ได้รับการพิสูจน์แล้วว่าค่าของ S เมื่อผู้เชี่ยวชาญทุกคนประเมินปัจจัยทั้งหมดเหมือนกัน จะมีค่าสูงสุดเท่ากับ

โดยที่ n คือจำนวนปัจจัย

ม. – จำนวนผู้เชี่ยวชาญ

ค่าสัมประสิทธิ์ความสอดคล้องเท่ากับอัตราส่วน

ยิ่งไปกว่านั้น หาก W ใกล้ 1 ผู้เชี่ยวชาญทุกคนก็ให้ค่าประมาณที่ค่อนข้างสม่ำเสมอ มิฉะนั้น ความคิดเห็นของพวกเขาจะไม่สอดคล้องกัน

สูตรการคำนวณ S แสดงไว้ด้านล่าง:

โดยที่ rij คือค่าประมาณการจัดอันดับของปัจจัย i-th โดยผู้เชี่ยวชาญ j-th

r avg คืออันดับเฉลี่ยของเมทริกซ์การประเมินทั้งหมด และมีค่าเท่ากับ

ดังนั้นสูตรคำนวณ S จึงอยู่ในรูปแบบ:

หากการประเมินรายบุคคลจากผู้เชี่ยวชาญคนหนึ่งตรงกัน และได้มาตรฐานในระหว่างการประมวลผล จะมีการใช้สูตรอื่นในการคำนวณค่าสัมประสิทธิ์ความสอดคล้อง:



โดยที่ T j ถูกคำนวณสำหรับผู้เชี่ยวชาญแต่ละคน (หากการประเมินของเขาถูกทำซ้ำสำหรับวัตถุที่แตกต่างกัน) โดยคำนึงถึงการทำซ้ำตามกฎต่อไปนี้:

โดยที่ t j คือจำนวนกลุ่มที่มีอันดับเท่ากันสำหรับผู้เชี่ยวชาญ j-th และ

h k คือจำนวนอันดับเท่ากันในกลุ่ม k-th ของอันดับที่เกี่ยวข้องของผู้เชี่ยวชาญ j-th

ตัวอย่าง. ให้ผู้เชี่ยวชาญ 5 คนใน 6 ปัจจัยตอบการจัดอันดับดังแสดงในตารางที่ 3:

ตารางที่ 3 - คำตอบของผู้เชี่ยวชาญ

ผู้เชี่ยวชาญ O1 O2 O3 O4 O5 O6 ผลรวมอันดับโดยผู้เชี่ยวชาญ
E1
E2
E3
E4
E5

เนื่องจากเราไม่ได้รับการจัดอันดับที่เข้มงวด (การประเมินของผู้เชี่ยวชาญซ้ำแล้วซ้ำอีก และผลรวมของอันดับไม่เท่ากัน) เราจะเปลี่ยนแปลงการประเมินและรับอันดับที่เกี่ยวข้อง (ตารางที่ 4):

ตารางที่ 4 – อันดับที่เกี่ยวข้องของการประเมินผู้เชี่ยวชาญ

ผู้เชี่ยวชาญ O1 O2 O3 O4 O5 O6 ผลรวมอันดับโดยผู้เชี่ยวชาญ
E1 2,5 2,5
E2
E3 1,5 1,5 4,5 4,5
E4 2,5 2,5 4,5 4,5
E5 5,5 5,5
ผลรวมของอันดับของวัตถุ 7,5 9,5 23,5 29,5

ตอนนี้เรามากำหนดระดับข้อตกลงระหว่างความคิดเห็นของผู้เชี่ยวชาญโดยใช้ค่าสัมประสิทธิ์ความสอดคล้องกัน เนื่องจากอันดับมีความสัมพันธ์กัน เราจะคำนวณ W โดยใช้สูตร (**)

จากนั้น r av =7*5/2=17.5

ส = 10 2 +8 2 +4.5 2 +4.5 2 +6 2 +12 2 = 384.5

มาดูการคำนวณของ W กันดีกว่า ในการทำเช่นนี้เราจะคำนวณค่าของ T j แยกกัน ในตัวอย่าง การให้คะแนนจะถูกเลือกเป็นพิเศษในลักษณะที่ผู้เชี่ยวชาญแต่ละคนมีการให้คะแนนซ้ำ: ที่ 1 มี 2 อันดับ อันดับสองมี 3 อันดับ อันดับสามมี 2 กลุ่มที่มี 2 อันดับ และอันดับที่ 4 และ 5 มีคะแนนที่เหมือนกัน 2 อันดับ จากที่นี่:

ต 1 = 2 3 – 2 = 6 T 5 = 6

ต 2 = 3 3 – 3 = 24

ต 3 = 2 3 –2+ 2 3 –2 = 12 ต 4 = 12

เราเห็นว่าความคิดเห็นของผู้เชี่ยวชาญมีความสอดคล้องกันค่อนข้างสูง และเราสามารถไปยังขั้นตอนต่อไปของการศึกษาได้ - การให้เหตุผลและการยอมรับทางเลือกในการแก้ปัญหาที่แนะนำโดยผู้เชี่ยวชาญ

มิฉะนั้นคุณจะต้องกลับไปยังขั้นตอนที่ 4-8

ค่าสัมประสิทธิ์สหสัมพันธ์ของเคนดัลล์จะใช้เมื่อมีการแสดงตัวแปรบนสเกลลำดับสองระดับ โดยมีเงื่อนไขว่าไม่มีอันดับที่เกี่ยวข้องกัน การคำนวณค่าสัมประสิทธิ์เคนดัลล์เกี่ยวข้องกับการนับจำนวนการแข่งขันและการผกผัน ลองพิจารณาขั้นตอนนี้โดยใช้ตัวอย่างปัญหาก่อนหน้านี้

อัลกอริทึมสำหรับการแก้ปัญหามีดังนี้:

    เราจัดเรียงข้อมูลในตารางใหม่ 8.5 เพื่อให้มีแถวใดแถวหนึ่ง (ในกรณีนี้คือแถว x i) กลายเป็นอันดับ กล่าวอีกนัยหนึ่ง เราจัดเรียงคู่ใหม่ xและ ในลำดับที่ถูกต้องและ เราป้อนข้อมูลในคอลัมน์ 1 และ 2 ของตาราง 8.6.

ตารางที่ 8.6

x ฉัน

ฉัน

2. กำหนด “ระดับการจัดอันดับ” ของแถวที่ 2 ( ฉัน). ขั้นตอนนี้ดำเนินการตามลำดับต่อไปนี้:

a) รับค่าแรกของซีรีย์ที่ไม่มีการจัดอันดับ “3” การนับจำนวนยศ ด้านล่างจำนวนที่กำหนดซึ่ง มากกว่ามูลค่าเปรียบเทียบ มีค่าดังกล่าวอยู่ 9 ค่า (หมายเลข 6, 7, 4, 9, 5, 11, 8, 12 และ 10) ป้อนหมายเลข 9 ลงในคอลัมน์ "การแข่งขัน" จากนั้นเราจะนับจำนวนค่านั้น น้อยสาม. มี 2 ​​ค่าดังกล่าว (อันดับ 1 และ 2); เราป้อนหมายเลข 2 ลงในคอลัมน์ "การผกผัน"

b) ทิ้งหมายเลข 3 (เราได้ดำเนินการไปแล้ว) และทำซ้ำขั้นตอนสำหรับค่าถัดไป "6": จำนวนการแข่งขันคือ 6 (อันดับ 7, 9, 11, 8, 12 และ 10) จำนวน การผกผันคือ 4 (อันดับ 1, 2 , 4 และ 5) เราป้อนหมายเลข 6 ลงในคอลัมน์ "บังเอิญ" และหมายเลข 4 ลงในคอลัมน์ "ผกผัน"

c) ทำซ้ำขั้นตอนในลักษณะเดียวกันจนกระทั่งสิ้นสุดแถว ควรจำไว้ว่าค่า "ได้ผล" แต่ละค่าจะไม่รวมอยู่ในการพิจารณาเพิ่มเติม (คำนวณเฉพาะอันดับที่อยู่ต่ำกว่าตัวเลขนี้)

บันทึก

เพื่อไม่ให้เกิดข้อผิดพลาดในการคำนวณควรระลึกไว้ว่าในแต่ละ "ขั้นตอน" ผลรวมของความบังเอิญและการผกผันจะลดลงทีละขั้นตอน เป็นเรื่องที่เข้าใจได้เนื่องจากแต่ละครั้งจะมีการแยกค่าหนึ่งค่าออกจากการพิจารณา

3. คำนวณผลรวมของการแข่งขัน (ป)และผลรวมของการผกผัน (ถาม)- ข้อมูลจะถูกป้อนลงในสูตรหนึ่งและสามสูตรที่ใช้แทนกันได้สำหรับค่าสัมประสิทธิ์เคนดัลล์ (8.10) มีการคำนวณที่เกี่ยวข้อง

ที (8.10)

ในกรณีของเรา:

ในตาราง XIV ภาคผนวกมีค่าวิกฤตของสัมประสิทธิ์สำหรับตัวอย่างนี้: τ cr = 0.45; 0.59. ค่าที่ได้รับเชิงประจักษ์จะถูกเปรียบเทียบกับค่าที่ทำตาราง

บทสรุป

τ = 0.55 > τ cr. = 0.45. ความสัมพันธ์มีนัยสำคัญทางสถิติที่ระดับ 1

บันทึก:

หากจำเป็น (เช่น ถ้าไม่มีตารางค่าวิกฤต) นัยสำคัญทางสถิติ ทีเคนดัลล์สามารถกำหนดได้จากสูตรต่อไปนี้:

(8.11)

ที่ไหน ส* = พี – คิว+1 ถ้า ป< Q , และ ส* = ป – ถาม – 1 ถ้า ป>ถาม

ค่านิยม zสำหรับระดับนัยสำคัญที่สอดคล้องกันนั้นสอดคล้องกับการวัดของ Pearson และพบได้ในตารางที่เกี่ยวข้อง (ไม่รวมอยู่ในภาคผนวก สำหรับระดับนัยสำคัญมาตรฐาน z kr = 1.96 (สำหรับ β 1 = 0.95) และ 2.58 (สำหรับ β 2 = 0.99) ค่าสัมประสิทธิ์สหสัมพันธ์ของเคนดัลล์มีนัยสำคัญทางสถิติหาก z > z cr

ในกรณีของเรา ส* = พี – คิว– 1 = 35 และ z= 2.40 คือ ข้อสรุปเบื้องต้นได้รับการยืนยันแล้ว: ความสัมพันธ์ระหว่างคุณลักษณะมีนัยสำคัญทางสถิติสำหรับนัยสำคัญระดับที่ 1

ปัจจัยหนึ่งที่จำกัดการใช้การทดสอบโดยยึดตามสมมติฐานของภาวะปกติคือขนาดของกลุ่มตัวอย่าง ตราบใดที่ตัวอย่างมีขนาดใหญ่เพียงพอ (เช่น การสังเกต 100 ครั้งขึ้นไป) คุณสามารถสรุปได้ว่าการกระจายตัวอย่างเป็นเรื่องปกติ แม้ว่าคุณจะไม่แน่ใจว่าการกระจายตัวของตัวแปรในประชากรเป็นเรื่องปกติก็ตาม อย่างไรก็ตาม หากตัวอย่างมีขนาดเล็ก ควรใช้การทดสอบเหล่านี้เฉพาะในกรณีที่คุณมั่นใจว่าตัวแปรมีการแจกแจงแบบปกติเท่านั้น อย่างไรก็ตาม ไม่มีวิธีใดที่จะทดสอบสมมติฐานนี้ในกลุ่มตัวอย่างเล็กๆ ได้

การใช้เกณฑ์ตามสมมติฐานของภาวะปกติยังถูกจำกัดด้วยมาตราส่วนการวัด (ดูบท แนวคิดเบื้องต้นของการวิเคราะห์ข้อมูล) วิธีการทางสถิติ เช่น การทดสอบที การถดถอย ฯลฯ ถือว่าข้อมูลต้นฉบับมีความต่อเนื่อง อย่างไรก็ตาม มีบางสถานการณ์ที่ข้อมูลถูกจัดอันดับเพียงอย่างเดียว (วัดตามมาตราส่วน) แทนที่จะวัดอย่างแม่นยำ

ตัวอย่างทั่วไปได้รับจากการให้คะแนนของไซต์บนอินเทอร์เน็ต: ตำแหน่งแรกถูกครอบครองโดยไซต์ที่มีจำนวนผู้เข้าชมสูงสุด ตำแหน่งที่สองถูกครอบครองโดยไซต์โดยมีจำนวนผู้เข้าชมสูงสุดจากไซต์ที่เหลือ (ในบรรดาไซต์ จากการที่ไซต์แรกถูกลบ) ฯลฯ เมื่อทราบการให้คะแนนเราสามารถพูดได้ว่าจำนวนผู้เยี่ยมชมไซต์หนึ่งมากกว่าจำนวนผู้เยี่ยมชมไปยังอีกไซต์หนึ่ง แต่ไม่สามารถพูดได้มากไปกว่านั้นอีก ลองนึกภาพคุณมี 5 ไซต์: A, B, C, D, E ซึ่งอยู่ในอันดับที่ 5 แรก สมมติว่าในเดือนปัจจุบันเรามีการจัดการดังต่อไปนี้: A, B, C, D, E และในเดือนก่อนหน้า: D, E, A, B, C คำถามคือ มีการเปลี่ยนแปลงที่สำคัญในการจัดอันดับหรือไม่ ของไซต์หรือไม่? เห็นได้ชัดว่าในสถานการณ์เช่นนี้ เราไม่สามารถใช้การทดสอบทีเพื่อเปรียบเทียบข้อมูลทั้งสองกลุ่มได้ และเราจะเข้าสู่ขอบเขตของการคำนวณความน่าจะเป็นเฉพาะเจาะจง (และการทดสอบทางสถิติใดๆ ก็ตามจะมีการคำนวณความน่าจะเป็นด้วย!) เราให้เหตุผลโดยประมาณดังนี้: มีความเป็นไปได้เพียงใดที่ความแตกต่างในการจัดเตรียมสถานที่ทั้งสองนั้นเกิดจากการสุ่มล้วนๆ หรือความแตกต่างนี้ใหญ่เกินไปและไม่สามารถอธิบายด้วยความบังเอิญล้วนๆ ได้หรือไม่ ในการสนทนาเหล่านี้ เราใช้เฉพาะอันดับหรือการเรียงสับเปลี่ยนของเว็บไซต์ และไม่ได้ใช้การกระจายจำนวนผู้เข้าชมเว็บไซต์ในรูปแบบใดประเภทหนึ่งโดยเฉพาะ

วิธีการแบบไม่อิงพารามิเตอร์ใช้ในการวิเคราะห์ตัวอย่างขนาดเล็กและสำหรับข้อมูลที่วัดในระดับต่ำ

ภาพรวมโดยย่อของขั้นตอนแบบไม่ใช้พารามิเตอร์

โดยพื้นฐานแล้ว สำหรับเกณฑ์พาราเมตริกทุกเกณฑ์ จะมีทางเลือกที่ไม่ใช่พารามิเตอร์อย่างน้อยหนึ่งรายการ

โดยทั่วไป ขั้นตอนเหล่านี้จัดอยู่ในประเภทใดประเภทหนึ่งต่อไปนี้:

  • การทดสอบความแตกต่างสำหรับตัวอย่างอิสระ
  • การทดสอบความแตกต่างสำหรับตัวอย่างที่ต้องพึ่งพา
  • การประเมินระดับการพึ่งพาระหว่างตัวแปร

โดยทั่วไป แนวทางการใช้เกณฑ์ทางสถิติในการวิเคราะห์ข้อมูลควรเป็นแบบเชิงปฏิบัติและไม่เป็นภาระกับการให้เหตุผลทางทฤษฎีที่ไม่จำเป็น ด้วยคอมพิวเตอร์ที่ใช้ STATISTICA คุณจะสามารถใช้เกณฑ์ต่างๆ กับข้อมูลของคุณได้อย่างง่ายดาย เมื่อทราบถึงข้อผิดพลาดบางประการของวิธีการต่างๆ คุณจะเลือกวิธีแก้ปัญหาที่เหมาะสมผ่านการทดลอง การพัฒนาโครงเรื่องค่อนข้างเป็นธรรมชาติ: หากคุณต้องการเปรียบเทียบค่าของตัวแปรสองตัว คุณจะต้องใช้การทดสอบที อย่างไรก็ตาม ควรจำไว้ว่ามันขึ้นอยู่กับสมมติฐานของความปกติและความเท่าเทียมกันของความแปรปรวนในแต่ละกลุ่ม การนำสมมติฐานเหล่านี้ออกไปจะนำไปสู่การทดสอบแบบไม่ใช้พารามิเตอร์ ซึ่งมีประโยชน์อย่างยิ่งสำหรับตัวอย่างขนาดเล็ก

การพัฒนาการทดสอบทีนำไปสู่การวิเคราะห์ความแปรปรวน ซึ่งใช้เมื่อจำนวนกลุ่มที่เปรียบเทียบมากกว่าสองกลุ่ม การพัฒนาขั้นตอนแบบไม่อิงพารามิเตอร์ที่สอดคล้องกันนำไปสู่การวิเคราะห์ความแปรปรวนแบบไม่มีพารามิเตอร์ แม้ว่าจะด้อยกว่าการวิเคราะห์ความแปรปรวนแบบคลาสสิกอย่างมีนัยสำคัญก็ตาม

เพื่อประเมินการพึ่งพาหรือพูดอย่างโอ่อ่าถึงระดับความใกล้ชิดของการเชื่อมต่อ ค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สันจะถูกคำนวณ พูดอย่างเคร่งครัด การใช้งานมีข้อจำกัดที่เกี่ยวข้อง เช่น ประเภทของมาตราส่วนในการวัดข้อมูลและความไม่เป็นเชิงเส้นของความสัมพันธ์ ดังนั้นค่าสัมประสิทธิ์สหสัมพันธ์แบบไม่มีพารามิเตอร์หรือที่เรียกว่าอันดับ ที่ใช้ เป็นต้น สำหรับข้อมูลที่จัดอันดับก็ใช้เป็นทางเลือกเช่นกัน หากข้อมูลถูกวัดในระดับที่กำหนด ก็เป็นเรื่องปกติที่จะนำเสนอข้อมูลเหล่านั้นในตารางฉุกเฉิน ซึ่งใช้การทดสอบไคสแควร์ของ Pearson ซึ่งมีรูปแบบต่างๆ และการปรับเปลี่ยนเพื่อความแม่นยำ

ดังนั้นโดยพื้นฐานแล้ว มีเกณฑ์และขั้นตอนเพียงไม่กี่ประเภทเท่านั้นที่คุณต้องรู้และนำไปใช้ได้ ขึ้นอยู่กับข้อมูลเฉพาะเจาะจง คุณต้องพิจารณาว่าควรใช้เกณฑ์ใดในสถานการณ์เฉพาะ

วิธีการแบบไม่ใช้พารามิเตอร์จะเหมาะสมที่สุดเมื่อขนาดตัวอย่างมีขนาดเล็ก หากมีข้อมูลจำนวนมาก (เช่น n >100) มักจะไม่สมเหตุสมผลที่จะใช้สถิติแบบไม่อิงพารามิเตอร์

หากขนาดตัวอย่างมีขนาดเล็กมาก (เช่น n = 10 หรือน้อยกว่า) ระดับนัยสำคัญสำหรับการทดสอบแบบไม่อิงพารามิเตอร์ที่ใช้การประมาณปกติจะถือเป็นการประมาณค่าคร่าวๆ เท่านั้น

ความแตกต่างระหว่างกลุ่มอิสระ- หากคุณมีสองตัวอย่าง (เช่น ชายและหญิง) ที่คุณต้องการเปรียบเทียบเกี่ยวกับค่าเฉลี่ยบางอย่าง เช่น ความดันโลหิตเฉลี่ยหรือจำนวนเม็ดเลือดขาว คุณสามารถใช้ตัวอย่างอิสระ t test ได้

ทางเลือกที่ไม่ใช่พารามิเตอร์สำหรับการทดสอบนี้คือการทดสอบซีรีส์ Wald-Wolfowitz, Mann-Whitney)/n โดยที่ x i คือค่า i-th, n คือจำนวนการสังเกต หากตัวแปรมีค่าลบหรือศูนย์ (0) จะไม่สามารถคำนวณค่าเฉลี่ยทางเรขาคณิตได้

ค่าเฉลี่ยฮาร์มอนิก

ค่าเฉลี่ยฮาร์มอนิกบางครั้งใช้กับความถี่เฉลี่ย ค่าเฉลี่ยฮาร์มอนิกคำนวณโดยสูตร: GS = n/S(1/x i) โดยที่ GS คือค่าเฉลี่ยฮาร์มอนิก n คือจำนวนการสังเกต x i คือค่าของตัวเลขการสังเกต i หากตัวแปรมีศูนย์ (0) จะไม่สามารถคำนวณค่าเฉลี่ยฮาร์มอนิกได้

ความแปรปรวนและส่วนเบี่ยงเบนมาตรฐาน

ความแปรปรวนตัวอย่างและส่วนเบี่ยงเบนมาตรฐานเป็นการวัดความแปรปรวน (ความแปรปรวน) ของข้อมูลที่ใช้บ่อยที่สุด การกระจายตัวคำนวณจากผลรวมของการเบี่ยงเบนกำลังสองของค่าตัวแปรจากค่าเฉลี่ยตัวอย่าง หารด้วย n-1 (แต่ไม่ใช่ด้วย n) ค่าเบี่ยงเบนมาตรฐานจะคำนวณเป็นรากที่สองของค่าประมาณความแปรปรวน

ขอบเขต

ช่วงของตัวแปรเป็นตัวบ่งชี้ความแปรปรวน โดยคำนวณจากค่าสูงสุดลบค่าต่ำสุด

ช่วงควอไทล์

ตามคำจำกัดความ ช่วงรายไตรมาสคือควอไทล์บนลบด้วยควอไทล์ล่าง (เปอร์เซ็นไทล์ 75% ลบเปอร์เซ็นไทล์ 25%) เนื่องจากเปอร์เซ็นไทล์ 75% (ควอไทล์บน) คือค่าทางด้านซ้ายซึ่งมี 75% ของการสังเกตอยู่ และเปอร์เซ็นไทล์ 25% (ควอไทล์ล่าง) คือค่าทางด้านซ้ายซึ่ง 25% ของการสังเกตเป็นควอไทล์ range คือช่วงเวลารอบค่ามัธยฐานซึ่งมี 50% ของการสังเกต (ค่าตัวแปร)

ความไม่สมมาตร

ความเบ้เป็นลักษณะของรูปร่างของการแจกแจง การกระจายจะเบ้ไปทางซ้ายหากค่าความเบ้เป็นลบ การกระจายจะเบ้ไปทางขวาหากความเบ้เป็นบวก ความเบ้ของการแจกแจงแบบปกติมาตรฐานคือ 0 ความเบ้สัมพันธ์กับโมเมนต์ที่สาม และถูกกำหนดเป็น: ความเบ้ = n × M 3 /[(n-1) × (n-2) × s 3 ] โดยที่ M 3 คือ เท่ากับ: (x i -xaverage x) 3, s 3 - ส่วนเบี่ยงเบนมาตรฐานยกกำลังสาม, n - จำนวนการสังเกต

ส่วนเกิน

Kurtosis เป็นลักษณะของรูปร่างของการแจกแจง กล่าวคือการวัดความคมของจุดสูงสุด (สัมพันธ์กับการแจกแจงแบบปกติ โดยค่า Kurtosis จะเป็น 0) โดยทั่วไปแล้ว การแจกแจงที่มีจุดสูงสุดที่คมชัดกว่าปกติจะมีความโด่งเป็นบวก การแจกแจงที่มีจุดสูงสุดคมชัดน้อยกว่าจุดสูงสุดของการแจกแจงแบบปกติจะมีความโด่งเป็นลบ Kurtosis มีความเกี่ยวข้องกับช่วงเวลาที่สี่และถูกกำหนดโดยสูตร:

ความโด่ง = /[(n-1) × (n-2) × (n-3) × s 4 ] โดยที่ M j เท่ากับ: (x-mean x, s 4 - ส่วนเบี่ยงเบนมาตรฐานยกกำลังสี่, n - จำนวนการสังเกต

ค่าสัมประสิทธิ์สหสัมพันธ์อันดับเคนดัลล์

หนึ่งในการวัดตัวอย่างการพึ่งพาตัวแปรสุ่มสองตัว (คุณสมบัติ) Xi ใช่ขึ้นอยู่กับการจัดอันดับองค์ประกอบตัวอย่าง (X 1, ใช่), .. ., (Xn, Yn). เคเคอาร์ จึงหมายถึง นักสถิติอันดับและถูกกำหนดโดยสูตร

ที่ไหน ร ฉัน- คุณเป็นของคู่นั้น ( เอ็กซ์, ย), สำหรับการตัด Xequal ผม, ส = 2N-(n-1)/2, N คือจำนวนองค์ประกอบตัวอย่าง ซึ่งมีทั้ง j>i และ อาร์ เจ > อาร์ ฉัน- เสมอ เป็นมาตรการคัดเลือกของการพึ่งพาอาศัยกันของ K. k.r. K. ถูกใช้กันอย่างแพร่หลายโดย M. Kendall (M. Kendall, ดู)

เคเคอาร์ k ใช้เพื่อทดสอบสมมติฐานความเป็นอิสระของตัวแปรสุ่ม หากสมมติฐานความเป็นอิสระเป็นจริง ดังนั้น E t =0 และ D t =2(2n+5)/9n(n-1) ด้วยขนาดตัวอย่างที่เล็กตรวจสอบทางสถิติ สมมติฐานความเป็นอิสระถูกสร้างขึ้นโดยใช้ตารางพิเศษ (ดู) สำหรับ n>10 ให้ใช้การประมาณปกติสำหรับการแจกแจง m: if

สมมติฐานเรื่องความเป็นอิสระก็ถูกปฏิเสธ ไม่เช่นนั้นก็เป็นที่ยอมรับ ที่นี่ก . - ระดับนัยสำคัญ u a /2 คือจุดเปอร์เซ็นต์ของการแจกแจงแบบปกติ เคเคอาร์ k. สามารถใช้ตรวจจับการขึ้นต่อกันของคุณลักษณะเชิงคุณภาพสองประการได้เช่นเดียวกัน หากสามารถเรียงลำดับองค์ประกอบตัวอย่างโดยสัมพันธ์กับคุณลักษณะเหล่านี้ได้ ถ้า เอ็กซ์, ยมีเส้นปกติร่วมกับค่าสัมประสิทธิ์สหสัมพันธ์ p แล้วความสัมพันธ์ระหว่างเคเคอาร์ k และมีรูปแบบ:

ดูเพิ่มเติม ความสัมพันธ์อันดับสเปียร์แมน การทดสอบอันดับ

สว่าง: Kendal M., ความสัมพันธ์อันดับ, ทรานส์ จากภาษาอังกฤษ ม. 2518; Van der Waerden B.L., คณิตศาสตร์, ทรานส์ จากภาษาเยอรมัน ม. 2503; Bolshev L. N. , Smirnov N. V. , ตารางสถิติทางคณิตศาสตร์, M. , 1965

อ.วี. โปรโครอฟ


สารานุกรมทางคณิตศาสตร์. - ม.: สารานุกรมโซเวียต- ไอ. เอ็ม. วิโนกราดอฟ

พ.ศ. 2520-2528.

    ดูว่า "ค่าสัมประสิทธิ์ความสัมพันธ์อันดับของเคนดัลล์" ในพจนานุกรมอื่นๆ คืออะไร: ภาษาอังกฤษ ด้วยความสัมพันธ์อันดับที่มีประสิทธิภาพ Kendall; เยอรมัน Kendalls Rangkorrelationskoeffizient. ค่าสัมประสิทธิ์สหสัมพันธ์ที่กำหนดระดับข้อตกลงระหว่างการจัดลำดับของคู่ของวัตถุทั้งหมดตามตัวแปรสองตัว อันตินาซี. สารานุกรมสังคมวิทยา พ.ศ. 2552 ...

    สารานุกรมสังคมวิทยาค่าสัมประสิทธิ์สหสัมพันธ์อันดับเคนดัลล์ - ภาษาอังกฤษ สัมประสิทธิ์, สหสัมพันธ์อันดับเคนดัลล์; เยอรมัน Kendalls Rangkorrelationskoeffizient. ค่าสัมประสิทธิ์สหสัมพันธ์ ซึ่งกำหนดระดับความสอดคล้องของการเรียงลำดับของคู่ของวัตถุทั้งหมดตามตัวแปรสองตัว...

    พจนานุกรมอธิบายสังคมวิทยา การวัดการขึ้นต่อกันของตัวแปรสุ่มสองตัว (คุณลักษณะ) X และ Y ขึ้นอยู่กับการจัดอันดับผลลัพธ์การสังเกตอิสระ (X1, Y1) - ., (Xn,Yn). หากอันดับของค่า X อยู่ในลำดับธรรมชาติ i=1, . - ., n,a Ri อันดับ Y ตรงกับ... ...

    สารานุกรมคณิตศาสตร์ค่าสัมประสิทธิ์สหสัมพันธ์ - (ค่าสัมประสิทธิ์สหสัมพันธ์) ค่าสัมประสิทธิ์สหสัมพันธ์เป็นตัวบ่งชี้ทางสถิติของการพึ่งพาตัวแปรสุ่มสองตัว คำจำกัดความของค่าสัมประสิทธิ์สหสัมพันธ์ ประเภทของค่าสัมประสิทธิ์สหสัมพันธ์ คุณสมบัติของค่าสัมประสิทธิ์สหสัมพันธ์ การคำนวณ และการประยุกต์... ...

    การพึ่งพาระหว่างตัวแปรสุ่มซึ่งโดยทั่วไปแล้วไม่มีลักษณะการทำงานที่เข้มงวด ตรงกันข้ามกับการพึ่งพาฟังก์ชัน K. ตามกฎแล้วจะถูกพิจารณาเมื่อปริมาณหนึ่งไม่เพียงขึ้นอยู่กับปริมาณอื่นเท่านั้น แต่ยัง... ... การวัดการขึ้นต่อกันของตัวแปรสุ่มสองตัว (คุณลักษณะ) X และ Y ขึ้นอยู่กับการจัดอันดับผลลัพธ์การสังเกตอิสระ (X1, Y1) - ., (Xn,Yn). หากอันดับของค่า X อยู่ในลำดับธรรมชาติ i=1, . - ., n,a Ri อันดับ Y ตรงกับ... ...

    สหสัมพันธ์ (การพึ่งพาสหสัมพันธ์) คือความสัมพันธ์ทางสถิติระหว่างตัวแปรสุ่มตั้งแต่สองตัวขึ้นไป (หรือตัวแปรที่ถือได้ว่าเป็นเช่นนั้นด้วยระดับความแม่นยำที่ยอมรับได้) ในกรณีนี้การเปลี่ยนแปลงค่าหนึ่งหรือ ... ... Wikipedia

    ความสัมพันธ์- (Correlation) สหสัมพันธ์เป็นความสัมพันธ์ทางสถิติระหว่างตัวแปรสุ่มตั้งแต่สองตัวขึ้นไป แนวคิดของความสัมพันธ์ ประเภทของความสัมพันธ์ สัมประสิทธิ์สหสัมพันธ์ การวิเคราะห์สหสัมพันธ์ ความสัมพันธ์ของราคา ความสัมพันธ์ของคู่สกุลเงินในเนื้อหา Forex... ... - (ค่าสัมประสิทธิ์สหสัมพันธ์) ค่าสัมประสิทธิ์สหสัมพันธ์เป็นตัวบ่งชี้ทางสถิติของการพึ่งพาตัวแปรสุ่มสองตัว คำจำกัดความของค่าสัมประสิทธิ์สหสัมพันธ์ ประเภทของค่าสัมประสิทธิ์สหสัมพันธ์ คุณสมบัติของค่าสัมประสิทธิ์สหสัมพันธ์ การคำนวณ และการประยุกต์... ...

    เป็นที่ยอมรับกันโดยทั่วไปว่าจุดเริ่มต้นของ S. m.v. หรือที่มักเรียกกันว่าสถิติของ "small n" ก่อตั้งขึ้นในทศวรรษแรกของศตวรรษที่ 20 โดยมีการตีพิมพ์ผลงานของ W. Gosset ซึ่งเขาวางการแจกแจงแบบ t ซึ่งตั้งสมมติฐานโดยผู้ที่ได้รับ อีกไม่นานทั่วโลก...... สารานุกรมจิตวิทยา

    Maurice Kendall Sir Maurice George Kendall วันเกิด: 6 กันยายน 1907 (1907 09 06) สถานที่เกิด: Kettering, UK วันแห่งความตาย ... Wikipedia

    พยากรณ์- (พยากรณ์) ความหมายของการพยากรณ์ งาน และหลักการของการพยากรณ์ ความหมายของการพยากรณ์ งาน และหลักการของการพยากรณ์ วิธีการพยากรณ์ สารบัญ เนื้อหา คำจำกัดความ แนวคิดพื้นฐานของการพยากรณ์ งานและหลักการพยากรณ์... ... - (ค่าสัมประสิทธิ์สหสัมพันธ์) ค่าสัมประสิทธิ์สหสัมพันธ์เป็นตัวบ่งชี้ทางสถิติของการพึ่งพาตัวแปรสุ่มสองตัว คำจำกัดความของค่าสัมประสิทธิ์สหสัมพันธ์ ประเภทของค่าสัมประสิทธิ์สหสัมพันธ์ คุณสมบัติของค่าสัมประสิทธิ์สหสัมพันธ์ การคำนวณ และการประยุกต์... ...

เพื่อคำนวณ สัมประสิทธิ์เคนดัลล์ค่าของลักษณะปัจจัยจะได้รับการจัดอันดับล่วงหน้า นั่นคือการจัดอันดับโดย X จะถูกเขียนอย่างเคร่งครัดโดยเรียงลำดับจากน้อยไปมากของค่าเชิงปริมาณ

1) สำหรับแต่ละอันดับใน Y ให้หาจำนวนรวมของอันดับต่อมาที่มีมูลค่ามากกว่าอันดับที่กำหนด จำนวนกรณีดังกล่าวทั้งหมดจะถูกนำมาพิจารณาด้วยเครื่องหมาย "+" และเขียนแทนด้วย P

2) สำหรับแต่ละอันดับใน Y ให้กำหนดจำนวนอันดับต่อมาที่มีมูลค่าน้อยกว่าอันดับที่กำหนด จำนวนกรณีดังกล่าวทั้งหมดถูกนำมาพิจารณาด้วยเครื่องหมาย "-" และเขียนแทนด้วย Q

3) คำนวณ S=P+Q=9+(-1)=8

4) ค่าสัมประสิทธิ์ Kendell คำนวณโดยใช้สูตร:

ค่าสัมประสิทธิ์ Kendell สามารถรับค่าได้ตั้งแต่ -1 ถึง +1 และยิ่งใกล้กับ ความสัมพันธ์ระหว่างคุณลักษณะก็จะยิ่งแข็งแกร่งขึ้นเท่านั้น

ในบางกรณี พวกเขาจะคำนวณเพื่อกำหนดทิศทางของความสัมพันธ์ระหว่างสองลักษณะ สัมประสิทธิ์เฟชเนอร์- ค่าสัมประสิทธิ์นี้ขึ้นอยู่กับการเปรียบเทียบพฤติกรรมการเบี่ยงเบนของแต่ละค่าของปัจจัยและลักษณะผลลัพธ์จากค่าเฉลี่ย ค่าสัมประสิทธิ์ Fechner คำนวณโดยใช้สูตร:

- โดยที่ผลรวม C คือจำนวนความบังเอิญทั้งหมดของสัญญาณของการเบี่ยงเบน ผลรวม H คือจำนวนรวมของสัญญาณของการเบี่ยงเบนที่ไม่ตรงกัน

1) คำนวณค่าเฉลี่ยของลักษณะปัจจัย:

2) กำหนดสัญญาณของการเบี่ยงเบนของแต่ละค่าของลักษณะปัจจัยจากค่าเฉลี่ย

3) คำนวณค่าเฉลี่ยของลักษณะผลลัพธ์: .

4) ค้นหาสัญญาณของการเบี่ยงเบนของแต่ละค่าของลักษณะผลลัพธ์จากค่าเฉลี่ย:

บทสรุป: การเชื่อมต่อเป็นแบบตรง ค่าสัมประสิทธิ์ไม่ได้บ่งบอกถึงความใกล้ชิดของการเชื่อมต่อ

เพื่อกำหนดระดับความใกล้ชิดของการเชื่อมต่อระหว่างคุณลักษณะอันดับสาม ให้คำนวณค่าสัมประสิทธิ์ ความสอดคล้องคำนวณโดยสูตร:

โดยที่ m คือจำนวนคุณลักษณะที่ได้รับการจัดอันดับ n คือจำนวนหน่วยการสังเกตอันดับ

อุตสาหกรรม X1 X2 X3 R1 R2 R3
อุตสาหกรรมพลังงานไฟฟ้า 7,49
เชื้อเพลิง 12,70
เชอร์นายา เอ็ม. 5,92
ซเวตนายา เอ็ม. 9,48
วิศวกรรมเครื่องกล 4,18
ผลลัพธ์:

X1- จำนวนพนักงาน (พันคน) X2- ปริมาณการขายภาคอุตสาหกรรม (พันล้านรูเบิล) X3- เงินเดือนเฉลี่ยต่อเดือน

1) เราจัดอันดับค่าของฟีเจอร์ทั้งหมดและกำหนดอันดับอย่างเคร่งครัดเพื่อเพิ่มค่าเชิงปริมาณ

2) สำหรับแต่ละบรรทัด ให้กำหนดผลรวมของอันดับ แถวทั้งหมดคำนวณจากคอลัมน์นี้

3) คำนวณ .

4) สำหรับแต่ละแถวให้ค้นหาค่าเบี่ยงเบนกำลังสองของผลรวมของอันดับและค่า T โดยใช้คอลัมน์เดียวกันเราคำนวณแถวสุดท้ายซึ่งเราแสดงด้วย S ค่าสัมประสิทธิ์ความสอดคล้องสามารถรับค่าได้ตั้งแต่ 0 ถึง 1 และยิ่งเข้าใกล้ 1 ความสัมพันธ์ระหว่างคุณลักษณะก็จะยิ่งแข็งแกร่งขึ้นเท่านั้น



 


อ่าน:



แฟลชไดรฟ์ USB ตัวใดที่น่าเชื่อถือและเร็วที่สุด?

แฟลชไดรฟ์ USB ตัวใดที่น่าเชื่อถือและเร็วที่สุด?

บ่อยครั้งในฟอรัมหลายคนถามเกี่ยวกับวิธีการเลือกแฟลชไดรฟ์และพารามิเตอร์ใดที่คุณควรใส่ใจเพื่อที่จะซื้อ...

วิธียกเลิกการสมัครสมาชิก Megogo บนทีวี: คำแนะนำโดยละเอียด วิธียกเลิกการสมัครสมาชิก Megogo

วิธียกเลิกการสมัครสมาชิก Megogo บนทีวี: คำแนะนำโดยละเอียด วิธียกเลิกการสมัครสมาชิก Megogo

ลักษณะและข้อดีของบริการ Megogo หนึ่งในบริการวิดีโอที่ใหญ่ที่สุดในยุโรปตะวันออกและ CIS คือ Megogo แค็ตตาล็อกประกอบด้วยมากกว่า 80,000...

วิธีแบ่งพาร์ติชันดิสก์โดยติดตั้ง Windows โดยไม่สูญเสียข้อมูล แบ่งพาร์ติชันดิสก์ 7

วิธีแบ่งพาร์ติชันดิสก์โดยติดตั้ง Windows โดยไม่สูญเสียข้อมูล แบ่งพาร์ติชันดิสก์ 7

การแบ่งฮาร์ดไดรฟ์ออกเป็นพาร์ติชั่นโดยใช้ Windows7 การแบ่งพาร์ติชั่นไดรฟ์ C:\ ใน Win7 เมื่อซื้อคอมพิวเตอร์หรือแล็ปท็อปเครื่องใหม่ที่มี...

เหตุใดผู้จัดพิมพ์จึงไม่สามารถแก้ไขทุกหน้าได้

เหตุใดผู้จัดพิมพ์จึงไม่สามารถแก้ไขทุกหน้าได้

ผู้ใช้ที่ทำงานใน Microsoft Word บ่อยครั้งอาจประสบปัญหาบางอย่างเป็นครั้งคราว เราได้หารือเกี่ยวกับวิธีแก้ปัญหากับหลายๆ คนแล้ว...

ฟีดรูปภาพ อาร์เอสเอส