विचरण की गणना कैसे करें: 15 चरण (फोटो के साथ) - युक्तियाँ

वीडियो: History of the 2,000-Calorie Diet

विषय

कदम
सलाह

भिन्न डेटा सेट के फैलाव को मापता है। यह सांख्यिकीय मॉडल बनाने में बहुत उपयोगी है: कम विचरण एक संकेत हो सकता है कि आप डेटा में अंतर्निहित संबंध के बजाय यादृच्छिक त्रुटि या शोर का वर्णन कर रहे हैं। इस लेख के साथ, wikiHow आपको सिखाता है कि विचरण की गणना कैसे करें।

कदम

विधि 1 की 2: एक नमूने के विचरण की गणना करें

अपना नमूना डेटा सेट लिखें। ज्यादातर मामलों में, सांख्यिकीविदों के पास केवल एक नमूना, या उस आबादी के सबसेट की जानकारी होती है जो वे पढ़ रहे हैं। उदाहरण के लिए, "जर्मनी में सभी कारों की लागत" के एक सामान्य विश्लेषण के बजाय, एक सांख्यिकीविद् कुछ हजार कारों के यादृच्छिक नमूने की लागत का पता लगा सकता है। जर्मनी में कारों की लागत का अच्छा अनुमान प्राप्त करने के लिए सांख्यिकीविद् इस नमूने का उपयोग कर सकते हैं। हालांकि, यह अधिक संभावना है कि यह वास्तविक संख्याओं से बिल्कुल मेल नहीं खाएगा।
- उदाहरण के लिए: जब एक कॉफी शॉप में प्रति दिन बेचे जाने वाले मफिन की संख्या का विश्लेषण करते हैं, तो आपने एक यादृच्छिक छह-दिन का नमूना लिया और निम्नलिखित परिणाम प्राप्त किए: 38, 37, 36, 28, 18, 14, 12, 11, 10.7, 9.9। यह एक नमूना है, जनसंख्या नहीं है, क्योंकि आपके पास हर दिन स्टोर खुला नहीं है।
- अगर हर एक मास्टर में डेटा बिंदु, कृपया नीचे दी गई विधि पर जाएं।
नमूना प्रसरण सूत्र लिखें। डेटा सेट का विचरण डेटा बिंदुओं के फैलाव को इंगित करता है। निकटता शून्य के करीब है, डेटा बिंदुओं को करीब से समूहीकृत किया गया है। नमूना डेटा सेट के साथ काम करते समय, विचरण की गणना के लिए निम्न सूत्र का उपयोग करें:
- = /_{(n - 1)}
- विचरण है। हमेशा वर्ग इकाइयों में भिन्नता की गणना की जाती है।
- आपके डेटा सेट में एक मूल्य का प्रतिनिधित्व करता है।
- Sum, जिसका अर्थ है "योग", आपको प्रत्येक मान के लिए निम्नलिखित मापदंडों की गणना करने के लिए कहता है, और फिर उन्हें एक साथ जोड़ देता है।
- x नमूना का मतलब है।
- n डेटा बिंदुओं की संख्या है।
नमूने के माध्य की गणना करें. प्रतीक x to या "x-क्षैतिज" का उपयोग नमूने के माध्य को इंगित करने के लिए किया जाता है। किसी भी औसत के रूप में गणना करें: सभी डेटा बिंदुओं को जोड़ें और इसे अंकों की संख्या से विभाजित करें।
- उदाहरण के लिए: सबसे पहले, अपने डेटा पॉइंट्स जोड़ें: 17 + 15 + 23 + 7 + 9 + 13 = 84
  इसके बाद, परिणाम को डेटा बिंदुओं की संख्या से विभाजित करें, इस मामले में छह: 84 result 6 = 14।
  नमूना का मतलब = x̅ = 14.
- आप डेटा के "केंद्र बिंदु" के रूप में माध्य के बारे में सोच सकते हैं। यदि डेटा माध्य के आसपास केंद्रित है, तो विचरण कम है। यदि वे माध्य से बहुत दूर हैं, तो विचरण अधिक है।
प्रत्येक डेटा बिंदु से माध्य को घटाएं। अब गणना करने का समय है - x̅, जहां आपके डेटा सेट में प्रत्येक बिंदु है। प्रत्येक परिणाम प्रत्येक संगत बिंदु के माध्य से विचलन को इंगित करेगा, या इसे सरलता से रखने के लिए, माध्य से दूरी पर।
- उदाहरण के लिए:
  - x - = 17 - 14 = 3
  - x - = 15 - 14 = 1
  - x - = 23 - 14 = 9
  - x - = 7 - 14 = -7
  - x - = 9 - 14 = -5
  - x - = 13 - 14 = -1
- अपनी गणना की जांच करना बहुत आसान है, क्योंकि परिणाम शून्य के योग होने चाहिए। इसका कारण यह है कि माध्य के माध्यम से, नकारात्मक परिणाम (मतलब छोटी संख्या से दूरी)। सकारात्मक परिणाम (मतलब बड़ी संख्या से दूरी) पूरी तरह से समाप्त हो गए हैं।
सभी परिणामों को स्क्वायर करें। जैसा कि ऊपर उल्लेख किया गया है, वर्तमान विचलन सूची (- x has) में शून्य का योग है। इसका मतलब है कि "औसत विचलन" भी हमेशा शून्य होगा और डेटा के फैलाव के बारे में कुछ नहीं कहा जा सकता है। इस समस्या को हल करने के लिए, हम प्रत्येक विचलन का वर्ग पाते हैं। नतीजतन, सभी सकारात्मक संख्याएं हैं, नकारात्मक मूल्य और सकारात्मक मूल्य अब एक दूसरे को रद्द नहीं करते हैं और राशि शून्य देते हैं।
- उदाहरण के लिए:
  (- एक्स)
  - एक्स)
  9 = 81
  (-7) = 49
  (-5) = 25
  (-1) = 1
- अब आपके पास (- x̅) नमूने में प्रत्येक डेटा बिंदु के लिए है।
वर्ग मानों का योग ज्ञात कीजिए। अब सूत्र के संपूर्ण अंश की गणना करने का समय है: calculate। बड़े साइक्लो,,, के लिए आवश्यक है कि आप प्रत्येक मान के लिए निम्न तत्व मान जोड़ें। आपने नमूने में प्रत्येक मूल्य के लिए (- x̅) गणना की है, इसलिए आपको बस इतना करना है कि परिणामों को एक साथ जोड़ दें।
- उदाहरण के लिए: 9 + 1 + 81 + 49 + 25 + 1 = 166.
N - 1 से विभाजित करें, जहां n डेटा बिंदुओं की संख्या है। बहुत पहले, नमूना विचरण की गणना करते समय, सांख्यिकीविद् केवल n से विभाजित होते हैं। वह विभाजन आपको चुकता विचलन का मतलब देगा, जो उस नमूने के विचरण से बिल्कुल मेल खाता है। हालांकि, ध्यान रखें कि नमूना केवल एक बड़ी आबादी का अनुमान है। यदि आप एक और यादृच्छिक नमूना लेते हैं और एक ही गणना करते हैं, तो आपको एक अलग परिणाम मिलेगा। जैसा कि यह पता चला है, n के बजाय n-1 से विभाजित करने से आपको एक बड़ी आबादी के विचरण का बेहतर अनुमान मिलता है - जिसके बारे में आपको परवाह है। यह सुधार इतना सामान्य है कि अब यह नमूना विचरण की स्वीकृत परिभाषा है।
- उदाहरण के लिए: नमूने में छह डेटा बिंदु हैं, इसलिए n = 6।
  नमूना विचरण = 33,2
विचरण और मानक विचलन को समझें। ध्यान दें, चूंकि सूत्र में शक्तियां हैं, इसलिए मूल डेटा की इकाइयों के वर्ग में विचरण को मापा जाता है। यह नेत्रहीन भ्रामक है। इसके बजाय, अक्सर मानक विचलन काफी उपयोगी होता है। लेकिन किसी भी प्रयास को बर्बाद करने का कोई मतलब नहीं है, क्योंकि मानक विचलन को विचरण के वर्गमूल द्वारा निर्धारित किया जाता है। इसीलिए सैंपल वेरिएशन को शब्दों में लिखा जाता है, और सैंपल का मानक विचलन होता है।
- उदाहरण के लिए, उपरोक्त नमूने का मानक विचलन = s = .233.2 = 5.76।
विज्ञापन

विधि 2 की 2: किसी जनसंख्या के विचरण की गणना करें

मास्टर डेटा सेट के साथ शुरू। शब्द "जनसंख्या" का उपयोग सभी प्रासंगिक टिप्पणियों को संदर्भित करने के लिए किया जाता है। उदाहरण के लिए, यदि आप हनोई निवासियों की आयु पर शोध कर रहे हैं, तो आपकी समग्र आबादी में हनोई में रहने वाले सभी व्यक्तियों की आयु शामिल होगी। आमतौर पर आप इस तरह सेट किए गए बड़े डेटा के लिए एक स्प्रेडशीट बनाते हैं, लेकिन यहां एक छोटा उदाहरण डेटा सेट है:
- उदाहरण के लिए: एक मछलीघर के कमरे में, ठीक छह मछलीघर हैं। इन छह टैंकों में मछली की निम्नलिखित संख्याएँ हैं:
समग्र विचरण का सूत्र लिखिए। चूंकि एक जनसंख्या में हमारे द्वारा आवश्यक सभी डेटा होते हैं, यह सूत्र हमें जनसंख्या का सटीक रूप प्रदान करता है। इसे नमूना विचरण से अलग करने के लिए (जो केवल एक अनुमान है), सांख्यिकीविद् अन्य चर का उपयोग करते हैं:
- σ = /_n
- iance = नमूना विचरण। यह सामान्य रूप से चुकता सॉसेज है। वर्ग इकाइयों में भिन्नता मापी जाती है।
- आपके डेटा सेट में एक तत्व का प्रतिनिधित्व करता है।
- Added में तत्व की गणना प्रत्येक मूल्य के लिए की जाती है, और फिर इसे जोड़ा जाता है।
- μ समग्र माध्य है।
- n जनसंख्या में डेटा बिंदुओं की संख्या है।
जनसंख्या का अर्थ ज्ञात कीजिए। जनसंख्या का विश्लेषण करते समय, प्रतीक μ ("म्यू") अंकगणितीय माध्य का प्रतिनिधित्व करता है। मतलब खोजने के लिए, सभी डेटा बिंदुओं को जोड़ें, फिर अंकों की संख्या से विभाजित करें।
- आप औसत के रूप में "औसत" के बारे में सोच सकते हैं, लेकिन सावधान रहें, क्योंकि शब्द की कई गणितीय परिभाषाएं हैं।
- उदाहरण के लिए: माध्य मान = μ = = 10,5
प्रत्येक डेटा बिंदु से माध्य को घटाएं। मतलब के करीब डेटा बिंदुओं में शून्य के करीब अंतर होता है। सभी डेटा बिंदुओं के लिए घटाव समस्या को दोहराएं, और आप संभवतः डेटा के फैलाव को महसूस करना शुरू कर देंगे।
- उदाहरण के लिए:
  - μ = 5 – 10,5 = -5,5
  - μ = 5 – 10,5 = -5,5
  - μ = 8 – 10,5 = -2,5
  - μ = 12 - 10., = 1,5
  - μ = 15 – 10,5 = 4,5
  - μ = 18 – 10,5 = 7,5
प्रत्येक चिन्ह को वर्गाकार करें। इस बिंदु पर, पिछले चरण से प्राप्त कुछ परिणाम नकारात्मक होंगे और कुछ सकारात्मक होंगे।यदि आप एक समद्विबाहु रेखा पर डेटा की कल्पना करते हैं, तो ये दो वस्तुएं माध्य के बाईं और दाईं ओर संख्याओं का प्रतिनिधित्व करती हैं। विचरण की गणना में इसका कोई फायदा नहीं होगा, क्योंकि ये दोनों समूह एक दूसरे को रद्द कर देंगे। इसके बजाय, उन्हें सभी वर्ग दें ताकि वे सभी सकारात्मक हों।
- उदाहरण के लिए:
  (- μ) के प्रत्येक मान के लिए मैं 1 से 6 तक रन:
  (-5,5) = 30,25
  (-5,5) = 30,25
  (-2,5) = 6,25
  (1,5) = 2,25
  (4,5) = 20,25
  (7,5) = 56,25
अपने परिणामों का औसत ज्ञात करें। अब आपके पास प्रत्येक डेटा बिंदु के लिए एक मूल्य है, संबंधित (सीधे नहीं) उस बिंदु से डेटा बिंदु कितनी दूर है। औसत उन्हें एक साथ जोड़कर और आपके पास मूल्यों की संख्या से विभाजित करके।
- उदाहरण के लिए:
  कुल मिलाकर विचरण = 24,25
संपर्क नुस्खा। यदि आप सुनिश्चित नहीं हैं कि यह विधि की शुरुआत में उल्लिखित सूत्र को कैसे फिट करता है, तो पूरी समस्या को हाथ से लिखें, और संक्षिप्त रूप से न लिखें:
- माध्य और वर्ग से अंतर ज्ञात करने के बाद, आपको (- μ), (- μ), और इसी तरह से (- μ) तक अंतिम डेटा बिंदु मिलता है। डेटा सेट में।
- इन मूल्यों के औसत को खोजने के लिए, उन्हें एक साथ जोड़ें और n: ((μ μ) + (- μ) + ... + (- μ)) / n द्वारा विभाजित करें
- सिग्माइड संकेतन के साथ अंश को फिर से लिखने के बाद, आपके पास /_n, सूत्र विचरण।
विज्ञापन

सलाह

चूँकि विचरण की व्याख्या करना कठिन है, इसलिए इस मान की गणना अक्सर मानक विचलन खोजने के लिए शुरुआती बिंदु के रूप में की जाती है।
नमूना का विश्लेषण करते समय हर में "एन" के बजाय "एन -1" का उपयोग करना एक तकनीक है जिसे बेसेल सुधार के रूप में जाना जाता है। नमूना केवल एक पूर्ण आबादी का अनुमान है, और नमूने के साधन का उस अनुमान से मिलान करने के लिए एक निश्चित पूर्वाग्रह है। यह सुधार उपरोक्त पूर्वाग्रह को समाप्त करता है। यह इस तथ्य की चिंता करता है कि एक बार n - 1 डेटा बिंदुओं की गणना की गई है, अंतिम वें बिंदु n एक स्थिर था, क्योंकि केवल कुछ मानों का उपयोग विचरण सूत्र में नमूना (x only) के माध्य की गणना के लिए किया गया था।