लेखक:
Robert Simon
निर्माण की तारीख:
21 जून 2021
डेट अपडेट करें:
1 जुलाई 2024
![History of the 2,000-Calorie Diet](https://i.ytimg.com/vi/YvZAWszQP6A/hqdefault.jpg)
विषय
भिन्न डेटा सेट के फैलाव को मापता है। यह सांख्यिकीय मॉडल बनाने में बहुत उपयोगी है: कम विचरण एक संकेत हो सकता है कि आप डेटा में अंतर्निहित संबंध के बजाय यादृच्छिक त्रुटि या शोर का वर्णन कर रहे हैं। इस लेख के साथ, wikiHow आपको सिखाता है कि विचरण की गणना कैसे करें।
कदम
विधि 1 की 2: एक नमूने के विचरण की गणना करें
अपना नमूना डेटा सेट लिखें। ज्यादातर मामलों में, सांख्यिकीविदों के पास केवल एक नमूना, या उस आबादी के सबसेट की जानकारी होती है जो वे पढ़ रहे हैं। उदाहरण के लिए, "जर्मनी में सभी कारों की लागत" के एक सामान्य विश्लेषण के बजाय, एक सांख्यिकीविद् कुछ हजार कारों के यादृच्छिक नमूने की लागत का पता लगा सकता है। जर्मनी में कारों की लागत का अच्छा अनुमान प्राप्त करने के लिए सांख्यिकीविद् इस नमूने का उपयोग कर सकते हैं। हालांकि, यह अधिक संभावना है कि यह वास्तविक संख्याओं से बिल्कुल मेल नहीं खाएगा।- उदाहरण के लिए: जब एक कॉफी शॉप में प्रति दिन बेचे जाने वाले मफिन की संख्या का विश्लेषण करते हैं, तो आपने एक यादृच्छिक छह-दिन का नमूना लिया और निम्नलिखित परिणाम प्राप्त किए: 38, 37, 36, 28, 18, 14, 12, 11, 10.7, 9.9। यह एक नमूना है, जनसंख्या नहीं है, क्योंकि आपके पास हर दिन स्टोर खुला नहीं है।
- अगर हर एक मास्टर में डेटा बिंदु, कृपया नीचे दी गई विधि पर जाएं।
नमूना प्रसरण सूत्र लिखें। डेटा सेट का विचरण डेटा बिंदुओं के फैलाव को इंगित करता है। निकटता शून्य के करीब है, डेटा बिंदुओं को करीब से समूहीकृत किया गया है। नमूना डेटा सेट के साथ काम करते समय, विचरण की गणना के लिए निम्न सूत्र का उपयोग करें:- = /(n - 1)
- विचरण है। हमेशा वर्ग इकाइयों में भिन्नता की गणना की जाती है।
- आपके डेटा सेट में एक मूल्य का प्रतिनिधित्व करता है।
- Sum, जिसका अर्थ है "योग", आपको प्रत्येक मान के लिए निम्नलिखित मापदंडों की गणना करने के लिए कहता है, और फिर उन्हें एक साथ जोड़ देता है।
- x नमूना का मतलब है।
- n डेटा बिंदुओं की संख्या है।
नमूने के माध्य की गणना करें. प्रतीक x to या "x-क्षैतिज" का उपयोग नमूने के माध्य को इंगित करने के लिए किया जाता है। किसी भी औसत के रूप में गणना करें: सभी डेटा बिंदुओं को जोड़ें और इसे अंकों की संख्या से विभाजित करें।- उदाहरण के लिए: सबसे पहले, अपने डेटा पॉइंट्स जोड़ें: 17 + 15 + 23 + 7 + 9 + 13 = 84
इसके बाद, परिणाम को डेटा बिंदुओं की संख्या से विभाजित करें, इस मामले में छह: 84 result 6 = 14।
नमूना का मतलब = x̅ = 14. - आप डेटा के "केंद्र बिंदु" के रूप में माध्य के बारे में सोच सकते हैं। यदि डेटा माध्य के आसपास केंद्रित है, तो विचरण कम है। यदि वे माध्य से बहुत दूर हैं, तो विचरण अधिक है।
- उदाहरण के लिए: सबसे पहले, अपने डेटा पॉइंट्स जोड़ें: 17 + 15 + 23 + 7 + 9 + 13 = 84
प्रत्येक डेटा बिंदु से माध्य को घटाएं। अब गणना करने का समय है - x̅, जहां आपके डेटा सेट में प्रत्येक बिंदु है। प्रत्येक परिणाम प्रत्येक संगत बिंदु के माध्य से विचलन को इंगित करेगा, या इसे सरलता से रखने के लिए, माध्य से दूरी पर।- उदाहरण के लिए:
- x - = 17 - 14 = 3
- x - = 15 - 14 = 1
- x - = 23 - 14 = 9
- x - = 7 - 14 = -7
- x - = 9 - 14 = -5
- x - = 13 - 14 = -1 - अपनी गणना की जांच करना बहुत आसान है, क्योंकि परिणाम शून्य के योग होने चाहिए। इसका कारण यह है कि माध्य के माध्यम से, नकारात्मक परिणाम (मतलब छोटी संख्या से दूरी)। सकारात्मक परिणाम (मतलब बड़ी संख्या से दूरी) पूरी तरह से समाप्त हो गए हैं।
- उदाहरण के लिए:
सभी परिणामों को स्क्वायर करें। जैसा कि ऊपर उल्लेख किया गया है, वर्तमान विचलन सूची (- x has) में शून्य का योग है। इसका मतलब है कि "औसत विचलन" भी हमेशा शून्य होगा और डेटा के फैलाव के बारे में कुछ नहीं कहा जा सकता है। इस समस्या को हल करने के लिए, हम प्रत्येक विचलन का वर्ग पाते हैं। नतीजतन, सभी सकारात्मक संख्याएं हैं, नकारात्मक मूल्य और सकारात्मक मूल्य अब एक दूसरे को रद्द नहीं करते हैं और राशि शून्य देते हैं।- उदाहरण के लिए:
(- एक्स)
- एक्स)
9 = 81
(-7) = 49
(-5) = 25
(-1) = 1 - अब आपके पास (- x̅) नमूने में प्रत्येक डेटा बिंदु के लिए है।
- उदाहरण के लिए:
वर्ग मानों का योग ज्ञात कीजिए। अब सूत्र के संपूर्ण अंश की गणना करने का समय है: calculate। बड़े साइक्लो,,, के लिए आवश्यक है कि आप प्रत्येक मान के लिए निम्न तत्व मान जोड़ें। आपने नमूने में प्रत्येक मूल्य के लिए (- x̅) गणना की है, इसलिए आपको बस इतना करना है कि परिणामों को एक साथ जोड़ दें।- उदाहरण के लिए: 9 + 1 + 81 + 49 + 25 + 1 = 166.
N - 1 से विभाजित करें, जहां n डेटा बिंदुओं की संख्या है। बहुत पहले, नमूना विचरण की गणना करते समय, सांख्यिकीविद् केवल n से विभाजित होते हैं। वह विभाजन आपको चुकता विचलन का मतलब देगा, जो उस नमूने के विचरण से बिल्कुल मेल खाता है। हालांकि, ध्यान रखें कि नमूना केवल एक बड़ी आबादी का अनुमान है। यदि आप एक और यादृच्छिक नमूना लेते हैं और एक ही गणना करते हैं, तो आपको एक अलग परिणाम मिलेगा। जैसा कि यह पता चला है, n के बजाय n-1 से विभाजित करने से आपको एक बड़ी आबादी के विचरण का बेहतर अनुमान मिलता है - जिसके बारे में आपको परवाह है। यह सुधार इतना सामान्य है कि अब यह नमूना विचरण की स्वीकृत परिभाषा है।- उदाहरण के लिए: नमूने में छह डेटा बिंदु हैं, इसलिए n = 6।
नमूना विचरण = 33,2
- उदाहरण के लिए: नमूने में छह डेटा बिंदु हैं, इसलिए n = 6।
विचरण और मानक विचलन को समझें। ध्यान दें, चूंकि सूत्र में शक्तियां हैं, इसलिए मूल डेटा की इकाइयों के वर्ग में विचरण को मापा जाता है। यह नेत्रहीन भ्रामक है। इसके बजाय, अक्सर मानक विचलन काफी उपयोगी होता है। लेकिन किसी भी प्रयास को बर्बाद करने का कोई मतलब नहीं है, क्योंकि मानक विचलन को विचरण के वर्गमूल द्वारा निर्धारित किया जाता है। इसीलिए सैंपल वेरिएशन को शब्दों में लिखा जाता है, और सैंपल का मानक विचलन होता है।- उदाहरण के लिए, उपरोक्त नमूने का मानक विचलन = s = .233.2 = 5.76।
विधि 2 की 2: किसी जनसंख्या के विचरण की गणना करें
मास्टर डेटा सेट के साथ शुरू। शब्द "जनसंख्या" का उपयोग सभी प्रासंगिक टिप्पणियों को संदर्भित करने के लिए किया जाता है। उदाहरण के लिए, यदि आप हनोई निवासियों की आयु पर शोध कर रहे हैं, तो आपकी समग्र आबादी में हनोई में रहने वाले सभी व्यक्तियों की आयु शामिल होगी। आमतौर पर आप इस तरह सेट किए गए बड़े डेटा के लिए एक स्प्रेडशीट बनाते हैं, लेकिन यहां एक छोटा उदाहरण डेटा सेट है:- उदाहरण के लिए: एक मछलीघर के कमरे में, ठीक छह मछलीघर हैं। इन छह टैंकों में मछली की निम्नलिखित संख्याएँ हैं:
- उदाहरण के लिए: एक मछलीघर के कमरे में, ठीक छह मछलीघर हैं। इन छह टैंकों में मछली की निम्नलिखित संख्याएँ हैं:
समग्र विचरण का सूत्र लिखिए। चूंकि एक जनसंख्या में हमारे द्वारा आवश्यक सभी डेटा होते हैं, यह सूत्र हमें जनसंख्या का सटीक रूप प्रदान करता है। इसे नमूना विचरण से अलग करने के लिए (जो केवल एक अनुमान है), सांख्यिकीविद् अन्य चर का उपयोग करते हैं:- σ = /n
- iance = नमूना विचरण। यह सामान्य रूप से चुकता सॉसेज है। वर्ग इकाइयों में भिन्नता मापी जाती है।
- आपके डेटा सेट में एक तत्व का प्रतिनिधित्व करता है।
- Added में तत्व की गणना प्रत्येक मूल्य के लिए की जाती है, और फिर इसे जोड़ा जाता है।
- μ समग्र माध्य है।
- n जनसंख्या में डेटा बिंदुओं की संख्या है।
जनसंख्या का अर्थ ज्ञात कीजिए। जनसंख्या का विश्लेषण करते समय, प्रतीक μ ("म्यू") अंकगणितीय माध्य का प्रतिनिधित्व करता है। मतलब खोजने के लिए, सभी डेटा बिंदुओं को जोड़ें, फिर अंकों की संख्या से विभाजित करें।- आप औसत के रूप में "औसत" के बारे में सोच सकते हैं, लेकिन सावधान रहें, क्योंकि शब्द की कई गणितीय परिभाषाएं हैं।
- उदाहरण के लिए: माध्य मान = μ = = 10,5
प्रत्येक डेटा बिंदु से माध्य को घटाएं। मतलब के करीब डेटा बिंदुओं में शून्य के करीब अंतर होता है। सभी डेटा बिंदुओं के लिए घटाव समस्या को दोहराएं, और आप संभवतः डेटा के फैलाव को महसूस करना शुरू कर देंगे।- उदाहरण के लिए:
- μ = 5 – 10,5 = -5,5
- μ = 5 – 10,5 = -5,5
- μ = 8 – 10,5 = -2,5
- μ = 12 - 10., = 1,5
- μ = 15 – 10,5 = 4,5
- μ = 18 – 10,5 = 7,5
- उदाहरण के लिए:
प्रत्येक चिन्ह को वर्गाकार करें। इस बिंदु पर, पिछले चरण से प्राप्त कुछ परिणाम नकारात्मक होंगे और कुछ सकारात्मक होंगे।यदि आप एक समद्विबाहु रेखा पर डेटा की कल्पना करते हैं, तो ये दो वस्तुएं माध्य के बाईं और दाईं ओर संख्याओं का प्रतिनिधित्व करती हैं। विचरण की गणना में इसका कोई फायदा नहीं होगा, क्योंकि ये दोनों समूह एक दूसरे को रद्द कर देंगे। इसके बजाय, उन्हें सभी वर्ग दें ताकि वे सभी सकारात्मक हों।- उदाहरण के लिए:
(- μ) के प्रत्येक मान के लिए मैं 1 से 6 तक रन:
(-5,5) = 30,25
(-5,5) = 30,25
(-2,5) = 6,25
(1,5) = 2,25
(4,5) = 20,25
(7,5) = 56,25
- उदाहरण के लिए:
अपने परिणामों का औसत ज्ञात करें। अब आपके पास प्रत्येक डेटा बिंदु के लिए एक मूल्य है, संबंधित (सीधे नहीं) उस बिंदु से डेटा बिंदु कितनी दूर है। औसत उन्हें एक साथ जोड़कर और आपके पास मूल्यों की संख्या से विभाजित करके।- उदाहरण के लिए:
कुल मिलाकर विचरण = 24,25
- उदाहरण के लिए:
संपर्क नुस्खा। यदि आप सुनिश्चित नहीं हैं कि यह विधि की शुरुआत में उल्लिखित सूत्र को कैसे फिट करता है, तो पूरी समस्या को हाथ से लिखें, और संक्षिप्त रूप से न लिखें:- माध्य और वर्ग से अंतर ज्ञात करने के बाद, आपको (- μ), (- μ), और इसी तरह से (- μ) तक अंतिम डेटा बिंदु मिलता है। डेटा सेट में।
- इन मूल्यों के औसत को खोजने के लिए, उन्हें एक साथ जोड़ें और n: ((μ μ) + (- μ) + ... + (- μ)) / n द्वारा विभाजित करें
- सिग्माइड संकेतन के साथ अंश को फिर से लिखने के बाद, आपके पास /n, सूत्र विचरण।
सलाह
- चूँकि विचरण की व्याख्या करना कठिन है, इसलिए इस मान की गणना अक्सर मानक विचलन खोजने के लिए शुरुआती बिंदु के रूप में की जाती है।
- नमूना का विश्लेषण करते समय हर में "एन" के बजाय "एन -1" का उपयोग करना एक तकनीक है जिसे बेसेल सुधार के रूप में जाना जाता है। नमूना केवल एक पूर्ण आबादी का अनुमान है, और नमूने के साधन का उस अनुमान से मिलान करने के लिए एक निश्चित पूर्वाग्रह है। यह सुधार उपरोक्त पूर्वाग्रह को समाप्त करता है। यह इस तथ्य की चिंता करता है कि एक बार n - 1 डेटा बिंदुओं की गणना की गई है, अंतिम वें बिंदु n एक स्थिर था, क्योंकि केवल कुछ मानों का उपयोग विचरण सूत्र में नमूना (x only) के माध्य की गणना के लिए किया गया था।