Python/C3/Statistics/Hindi

From Script | Spoken-Tutorial
Revision as of 16:59, 28 June 2013 by Devraj (Talk | contribs)

Jump to: navigation, search
Timing Narration
0:00 नमस्कार दोस्तों पाइथन का इस्तेमाल करके स्टैटिस्टिक पर ट्यूटोरियल में आपका स्वागत है।
0:06 इस ट्यूटोरियल की समाप्ति पर, आप निम्न करने में सक्षम होंगे,
  1. पाइथन में सांख्यिकीय ऑपरेशंस करने में
  2. संख्याओं के समूह को जोड़ने में
  3. उनका औसत, माध्यिका और मानक विचलन निकालने में
0:17 इस ट्यूटोरियल को शुरू करने से पहले, हम आपको सलाह देते हैं कि आप “फाइल्स से डेटा लोड करने पर” "Getting started with Lists" और "Accessing Pieces of Arrays" पर ट्यूटोरियल को पूरा कर लें।
0:29 अब, टर्मिनल पर टाइप करें ipython space hyphen pylab.
0:38 इस ट्यूटोरियल के लिए, हम डेटा फाइल इस्तेमाल करेंगे जो slash home slash fossee slash sslc2 dot txt पाथ पर है।
0:47 यह छात्रों के रिकॉर्ड और उनके स्टेट माध्यमिक बोर्ड परीक्षा में प्रदर्शन को सम्मिलित करता है।
0:53 इसमें रिकॉर्ड के 180,000 लाईन्स हैं।
0:57 हम इसे रीड करने जा रहे हैं और इस डेटा को संसाधित करने जा रहे हैं।
1:02 हम फाइल का कंटेंट उस पर डबल क्लिक करके देख सकते हैं।
1:06 यह खुलने में कुछ समय ले सकता है, क्योंकि यह काफी बड़ी फाइल है।
1:11 कृपया डेटा को न सम्पादित करें, क्योंकि इसकी एक विशिष्ट संरचना है।
1:15 फाइल के कंटेंट को जाँचने के लिए, हम cat कमांड इस्तेमाल करते हैं।
1:18 अतः टाइप करें cat space slash home slash fossee slash sslc2 dot txt और एंटर दबाएँ।
1:31 फाइल की प्रत्येक लाइन 11 फील्ड जो सेमी-कोलंस से विभाजित हैं उनका समूह है।
1:38 इस फाइल से एक नमूना लाइन देखें।
1:43 A semicolon 015163 semicolon JOSEPH RAJ S semicolon 083 semicolon 042 semicolon 47 semicolon 00 semicolon 72 semicolon 244 और एक रो में तीन सेमी-कोलंस।
2:11 निम्नकिसी भी दी हुई लाइन के फील्ड्स हैं।
2:16 * Region Code which is 'A' * Roll Number 015163 * Name JOSEPH RAJ S * Marks of 5 subjects: ** English 083 ** Hindi 042 ** Maths 47 **

Science 35 **Social Science 72 and Total marks 244

2:42 इस डेटा को अरै की तरह लोड करें और फिर इसपर विभिन्न फंक्शन्स रन करें।
2:48 अरै की तरह डेटा पाने के लिए, हम loadtxt कमांड इस्तेमाल करते हैं।
2:53 अतः टर्मिनल पर टाइप करें L is equal to loadtxt within brackets , single quotes slash home slash fossee slash sslc2 dot txt comma usecols is equal to within brackets 3,4,5,6,7 comma delimiter is equal to within single quotes semicolon) और एंटर दबाएँ।
3:45 हमें हमारा आउटपुट array dot loadtxt function के रूप में मिलता है।
3:57 अब हमें एक एरर मिली।
3:58 हमें कोष्ठकों से पहले loadtxt टाइप करना होगा।
4:09 डिलीमीटर कैरेक्टर का प्रकार निर्दिष्ट करता है, जो usecols द्वारा विभक्त डेटा के फील्ड्स में उपयोग होने वाले कॉलम्स को निर्दिष्ट करता है।
4:19 अतः कोष्ठकों के अंदर 3,4,5,6,7 loads those columns.
4:26 'comma' जोड़ा गया है क्योंकि usecols एक क्रम है।
4:31 जैसा कि हम देख सकते हैं कि L एक अरै है।
4:35 हम इस अरै की बनावट टर्मिनल का इस्तेमाल करके पा सकते हैं हम टाइप कर सकते हैं L dot shape और एंटर दबाएँ।
4:43 हमें एक ट्यूपल मिलता है जो रोस और कॉलम्स क्रमशः की संख्याएँ बताता है।
4:50 चलिए इनपर संख्यिकीय ऑपरेशंस लागू करना शुरू करते हैं।
4:55 हम सबसे बुनियादी से शुरू करते हैं, समिंग(summing)।
4:59 आप पहले विद्यार्थी के लिए कैसे सभी विषयों के अंकों का जोड़ निकालेंगे।
5:04 जैसा कि हम अरैज़ के पीसेस को एक्सेस करने के अपने ज्ञान से जानते हैं, पहले रो को एक्सेस करने के लिए, हम टर्मिनल में टाइप करेंगे, L square brackets 0 comma colon.
5:19 अब इसे जोड़ने के लिए हम कह सकते हैं total marks is equal to sum within brackets L within square brackets 0 comma colon और एंटर दबाएँ। फिर total marks. फिर से एंटर दबाएँ।
5:47 अब औसत पाने के लिए हम टोटल मार्क्स को लम्बाई से भाग दे सकते हैं।
5:52 अतः टाइप करें total marks slash len within brackets L in square brackets 0 comma colon.
6:10 या सरलता से फंक्शन mean इस्तेमाल करें।
6:13 इसके लिए टाइप करें, mean within brackets L और square brackets में 0 comma colon और एंटर दबाएँ।
6:31 किन्तु हमारे पास बहुत बड़ा डेटा समूह है और एक-एक करके प्रत्येक विद्यार्थी का औसत निकालना नामुमकिन है।
6:38 क्या काम को कम करने का कोई तरीका है।
6:40 इसके लिए हम मीन के प्रलेखन को देखेंगे।
6:42 अतः इसके लिए टर्मिनल में टाइप करें mean question mark
6:49 जैसा कि हम जानते हैं L एक टू डायमेंशनल अरै है।
6:52 हम अरै के प्रत्येक अक्ष के लिए औसत निकाल सकते हैं।
6:57 रोस का अक्ष संख्या 0 से और कॉलम्स 1 से निर्दिष्ट होता है।
7:02 अतः सभी कॉलम्स की औसत निकलने के लिए, हम अक्ष के लिए अतिरिक्त पैरामीटर 1 पास करेंगे।
7:07 अतः टाइप करें mean within brackets L comma 1 और एंटर दबाएँ।
7:17 यहाँ L, एक टू डायमेंशनल अरै है।
7:20 उसी प्रकार से प्रत्येक विषय के लिए सभी विद्यार्थियों द्वारा प्राप्त औसत अंकों को mean within brackets L comma 0 इस्तेमाल करके निकाल सकते हैं।
7:36 अगला, सभी विद्यार्थियों के लिए अंग्रेजी अंकों की माध्यिका निकालते हैं।
7:41 L स्कवैर ब्रेकेट्स colon comma zero का इस्तेमाल करके और एंटर दबाकर हम सभी विद्यार्थियों के अंग्रेजी अंकों को एक्सेस कर सकते हैं।
7:53 माध्यिका पाने के लिए हम सरलता से फंक्शन median इस्तेमाल करेंगे।
7:57 अतः टाइप करें median within brackets L square brackets colon comma 0 .
8:17 सभी विषयों के लिए हम यही सिन्टैक्स mean की तरह इस्तेमाल कर सकते हैं और median इस्तेमाल करके सभी रोस के लिए माध्यिका निकाल सकते हैं।
8:25 अतः टाइप करें median in brackets L comma 0 और एंटर दबाएँ।
8:35 उसी प्रकार अंग्रेजी के लिए मानक विचलन निकालने के लिए हम फंक्शन std इस्तेमाल करेंगे।
8:41 अतः टाइप करें std, in brackets L and in square brackets colon comma 0 और एंटर दबाएँ।
8:57 और सभी रोस के लिए, हम std within brackets L comma 0 करते हैं।
9:08 यहाँ पर वीडियो रोकें, निम्न अभ्यास करें और वीडियो पुनः चलायें।
9:13 पाथ slash home slash fossee slash football dot txt पर दी हुई फाइल football dot txt में, पहला कॉलम player name, दूसरा goals at home और तीसरा goals away का है।
9:28 1. प्रत्येक खिलाड़ी के लिए कुल गोल्स निकालें।
9:33 2.होम और अवे गोल्स का औसत निकालें।
9:37 3.होम और अवे गोल्स का मानक विचलन निकालें।
9:46 यह अपेक्षित डेटा है।
9:49 इसके लिए football dot txt फाइल खोलें।
9:54 हल आपकी स्क्रीन पर है।
10:00 इसी के साथ हम ट्यूटोरियल की समाप्ति की ओर आ गये हैं।
10:03 इस ट्यूटोरियल में, हमने सीखा,
10:07 1. पाइथन में सामान्य स्टैटिस्टिकल ऑपरेशंस जोड़, औसत माध्यिका और मानक विचलन करना।
10:14 2.वास्तविक समस्याओं को हल करने के लिए टेक्स्ट लोडिंग और स्टैटिस्टिकल ऑपरेशन को मिलाना।
10:24 यहाँ आपके हल करने के लिए कुछ स्वतः निर्धारण सवाल हैं।
10:27 1. एक टू डायमेंशनल लिस्ट दी है, two_dimensional_list is equal to square brackets के अंदर [3,5,8,2,1], अन्य square brackets के अंदर [4,3,6,2,1] हम प्रत्येक रो का औसत कैसे निकालेंगे?
10:49 2.दी हुई लिस्ट की माध्यिका कैसे निकालेंगे? student_marks is equal to square brackets के अंदर 74,78,56,87,91,82
11:03 और तीसरा सवाल है कि मानिए आपके पास 6 कॉलम्स के साथ एक फाइल है किन्तु हम टेक्स्ट केवल कॉलम्स 2,3,4,5 में करना चाहते हैं। हम यह निर्दिष्ट कैसे करेंगे?
11:16 और उत्तर हैं,
11:20 1.प्रत्येक रो का औसत पाने के लिए, हम बस फंक्शन mean के दूसरे पैरामीटर में 1 पास करते हैं।
11:29 अतः हमें टाइप करना होगा mean within brackets two_dimensional_list comma 1
11:37 2. लिस्ट की माध्यिका निकालने के लिए हम फंक्शन median इस्तेमाल करते हैं।
11:42 median within brackets student_marks टाइप करके।
11:47 और अंतिम है एक फाइल के विशिष्ट कॉलम्स को निर्दिष्ट करने के लिए, हम पैरामीटर usecols is equal to 2,3,4,5 इस्तेमाल करते हैं।
12:01 आशा है कि आपने इस ट्यूटोरियल का आनन्द उठाया और इसे लाभदायक पाया।
12:05 आई.आई.टी मुंबई की ओर से मैं रवि कुमार अब आपसे विदा लेता हूँ। धन्यवाद!

Contributors and Content Editors

Devraj, PoojaMoolya