Python-3.4.3/C3/Parsing-data/Hindi

From Script | Spoken-Tutorial
Jump to: navigation, search
Time Narration
00:01 Parsing data पर स्पोकन टयूटोरियल में आपका स्वागत है।
00:06 इस ट्यूटोरियल में हम सीखेंगे-

delimiter का उपयोग करके string का विभाजन करना।

string में सभी whitespaces और leading, trailing को हटाना और

भिन्न built-in datatypes के मध्य परिवर्तित करना।

00:22 इस ट्यूटोरियल को रिकॉर्ड करने के लिए, मैं उपयोग कर रही हूँ,

Ubuntu Linux 16.04 ऑपरेटिंग सिस्टम

Python 3.4.3 और IPython 5.1.0

00:38 इस ट्यूटोरियल का अभ्यास करने के लिए, आपको ज्ञात होना चाहिए कि lists का उपयोग कैसे करते हैं।

यदि नहीं, तो इस वेबसाइट पर संबंधित पाइथन ट्यूटोरियल्स देखें।

00:49 पहला, समझते हैं कि parsing data का अर्थ क्या है।
00:54 Parsing data टेक्स्ट रूप में डेटा को रीड करना है। इसे एक ऐसे रूप में परिवर्तित किया जाता है जिसका उपयोग अभिकलन के लिए किया जा सकता है।
01:04 अब हम split() function के बारे में सीखेंगे।
01:08 split() function परिभाषक separator का उपयोग करके बड़ी string को छोटी strings में बांटता है।
01:15 यदि कोई भी argument निर्दिष्ट नहीं है, तो डिफॉल्ट separator के रूप में whitespace का उपयोग किया जाता है।
01:22 सिंटैक्स हैः str dot split parentheses में argument
01:29 split function string को parses करता है और tokens का array रिटर्न करता है। इसे string tokenizing कहा जाता है।
01:38 पहले Ctrl+Alt+T कीज एक साथ दबाकर terminal खोलें ।
01:46 टाइप करें ipython3 और एंटर दबाएं।
01:52 pylab package आरंभ करें। टाइप करें percentage sign pylab और एंटर दबाएं।
02:02 यहाँ से कृपया याद रखें कि टर्मिनल पर प्रत्येक कमांड टाइप करने के बाद एंटर की दबाना है।
02:09 string data type के रूप में वेरिएबल str1 को परिभाषित करें।
02:14 टाइप करें str1 is equal to double quotes में Welcome to कुछ whitespaces प्रविष्ट करें, फिर Python tutorials
02:24 हमारे पास to और Python tutorials के मध्य whitespaces की कोई भी संख्या हो सकती है। लेकिन सभी spaces एक स्पेस माने जाते हैं।
02:34 अब, हम whitespace पर इस string को विभाजित कर रहे हैं।
02:38 टाइप करें str1 dot split open और close parentheses.
02:44 जैसा कि हम देख सकते हैं, हमें strings की सूची प्राप्त होती है।
02:48 argument के साथ split() function के लिए एक अन्य उदाहरण लेते हैं। दिखाए गए अनुसार टाइप करें।
02:57 टाइप करें, x dot split parentheses में single quotes में semicolon.
03:04 हमें comma द्वारा पृथक strings की सूची प्राप्त होती है।
03:08 वीडियो रोकें। इसका अभ्यास करें और फिर पुनः वीडियो शुरू करें।
03:14 argument के रूप में space का उपयोगग करके x को विभाजित करें। . क्या यह बिना argument के विभाजित करने के समान है ?
03:22 हल के लिए टर्मिनल पर जाएं।
03:26 टाइप करें b is equal to x dot split open और close parentheses.
03:32 टाइप करें c is equal to x dot split parentheses में और single quotes में space.
03:41 टाइप करें b
03:44 टाइप करें c
03:47 हम देख सकते हैं कि बिना argument के विभाजित करना argument के रूप में space देकर विभाजित करने के समान है।
03:54 बिना argument के string को विभाजित करना spaces की किसी भी संख्या द्वारा पृथक string को विभाजित करेगा।
04:01 और argument के रूप में space देना विशे। रूप से सिंगल whitespace पर वाक्य को विभाजित करेगा।
04:08 वेरिएबल str1 को रिकॉल करें।
04:12 अब हम इस string को argument के बिना विभाजित करेंगे। टाइप करें b is equal to str1 dot split open और close parentheses.
04:24 टाइप करें c is equal to str1 dot split parentheses में और single quotes में space.
04:33 टाइप करें b
04:36 टाइप करें c
04:38 जैसा कि आप देख सकते हैं, कि यहाँ b c के बराबर नहीं है। क्योंकि c में प्रविष्टियों के रूप में whitespaces हैं जबकि b में केवल शब्द हैं।
04:49 आगे हम strip method के बारे में सीखेंगे।
04:53 strip function string के सभी leading और trailing whitespaces हटाता है।
04:59 unstripped is equal to double quotes में space Hello world space टाइप करके string को परिभाषित करें।
05:09 अब whitespace को हटाने के लिए, टाइप करें unstripped dot strip open और close parentheses.
05:18 हम देख सकते हैं कि strip string के अंत में और शुरूआत में सभी whitespaces को हटाता है।
05:25 splitting और stripping के बाद हमें leading और trailing spaces हटाकर strings की सूची प्राप्त होती है।
05:32 अब strings को floats और integers में परिवर्तित करना सीखते हैं।
05:38 टाइप करें, mark underscore str is equal to double quotes में 1.25
05:46 ध्यान दें कि 1.25' एक string है और float नहीं है क्योंकि यह double quotes में है।
05:53 टाइप करें, mark is equal to' float 'parentheses में mark underscore str. यहाँ हम string को float में परिवर्तित कर रहे हैं।
06:05 टाइप करें type parentheses में mark underscore str. यह आपको mark_str का datatype अर्थात string दिखाता है।
06:17 टाइप करें type parentheses में mark . यह दर्शाता है mark float datatype है।
06:26 हम देख सकते हैं कि string float में परिवर्तित हो गया है। अब हम उनमें mathematical operations क्रियान्वित कर सकते हैं।
06:34 वीडियो रोकें। इसका अभ्यास करें और फिर पुनः वीडियो शुरू करें।
06:40 क्या होता है यदि आप टर्मिनल में टाइप करते हैं, int parentheses में double quotes में 1.25
06:48 हल के लिए टर्मिनल पर जाएं।
06:52 टाइप करें, int parentheses में double quotes में 1.25
06:59 हम एक ValueError देख सकते हैं We cannot convert a string to integer directly.
07:06 इसके लिए सही हल देखते हैं। टाइप करें dcml underscore str is equal to double quotes में 1.25.
07:18 टाइप करें flt is equal to float parentheses में dcml underscore str.
07:27 यहाँ हम string को float में परिवर्तित कर रहे हैं क्योंकि हम इसे सीधे integer में परिवर्तित नहीं कर सकते हैं।
07:34 टाइप करें flt
07:37 टाइप करें, number is equal to int parentheses मेंflt. अब हम float को integer में परिवर्तित कर रहे हैं।
07:48 टाइप करें number हमें integer आउटपुट प्राप्त हुआ।
07:54 इस तरह से हमें strings को floats और integers में परिवर्तित करना चाहिए।
07:59 आगे, हम data' को parse करने के लिए डेटा फाइल का उपयोग करेंगे।
08:04 मैं टेक्स्ट एडिटर में student underscore record.txt फाइल खोलती हूँ।
08:10 फाइल student underscore record.txt इस ट्यूटोरियल के Code files लिंक में उपलब्ध है। कृपया इसे अपनी Home directory में डाउनलोड करें और इसका उपयोग करें।
08:22 हम पहले लाइन दर लाइन फाइल को रीड करेंगे और इस फाइल में प्रत्येक रिकॉर्ड को parse करेंगे।
08:28 इसमें State Secondary Board Examination में छात्रों और उनके अंकों का रिकॉर्ड है।
08:35 इसमें 1 लाख 80 हजार लाइन्स का रिकॉर्ड है। हम इसे रीड और इस डेटा को प्रोसेस कर रहे हैं।
08:43 फाइल में प्रत्येक लाइन semicolons द्वारा पृथक fields का सेट है।
08:49 इस फ़ाइल से एक नमूना रिकॉर्ड पर विचार करें।
08:53 दी गई प्रत्येक लाइन में निम्न fields हैं।

Region Code Roll Number Name Marks of 5 subjects Total marks

09:08 नया टेक्स्ट एडिटर खोलें और दिखाए गए अनुसार कोड टाइप करें।
09:14 मैं इस प्रोग्राम को समझाती हूँ।
09:17 हमने पिछले ट्यूटोरियल में for loop पहले ही सीखा है। for loop छात्रों के रिकॉर्ड को प्रोसेस करेगा और प्रत्येक रिकॉर्ड के फिल्ड्स को विभाजित करेगा।
09:28 math के अंक बाद में float में परिवर्तित होेते हैं।
09:32 फिर यह जुड़ता है और region code A के लिए वेरिएबल math underscore marks underscore A में list के रूप में संचित होते हैं।
09:41 फाइल को Home directory में marks.py के रूप में सेव करें।
09:48 टर्मिनल पर जाएं।
09:51 percentage sign run space marks.py के साथ फाइल का निष्पादन करें।
09:58

एडिटर पर वापस आएं। अब हमारे पास region A के लिए सभी math के अंक लिस्ट math underscore marks underscore A में हैं।

10:09 region A के लिए math के अंकों के mean की गणना करने के लिए निम्न लाइन्स के जोड़ें।
10:15 इसके लिए, हमें केवल गणित के अंकों का योग और लंबाई द्वारा भाग देना होगा।
10:21 ध्यान दें लंबाई region ‘A’ के छात्रों की संख्या देगी।
10:26 फाइल सेव करें।
10:29 टर्मिनल पर जाएं।
10:32 'percentage sign run space marks.py के साथ फाइल का फिर से निष्पादन करें।
10:40 अतः हमें अपना अंतिम आउटपुट प्राप्त हुआ है।
10:43 यहाँ region A के लिए mean वैल्यू लगभग 1लाख 80 हजार रिकॉर्ड के लिए की जाती है।
10:51 इस तरह से हम बड़े डेटा को रीड और विभाजित करते हैं और इस पर अभिकलन क्रियान्वित करते हैं।
10:57 इसी के साथ हम इस ट्यूटोरियल के अंत में पहुँच गए हैं।
11:01 इस ट्यूटोरियल में हमने सीखाः
string  को Tokenize  करना।

split() function के साथ delimiters द्वारा पृथक string को विभाजित करना।

11:11 strip() function का उपयोग करके whitespaces हटाना।

संख्याओं के datatypes को एक टाइप से दूसरे में परिवर्तित करना। इनपुट डेटा Parse करना और इस पर अभिकलन क्रियान्वित करना।

11:25 यहाँ हल करने हेतु आपके लिए कुछ स्वतः निर्धारण वाले प्रश्न हैं।

1. आप शब्दों को प्राप्त करने के लिए string “Guido;Rossum;Python" को कैसे विभाजित करते हैं?

11:36 2. int paranthesis में double quotes में 20.0 क्या प्रदान करता है?
11:43 और उत्तर हैंः

1. line.split' parantheses में single quotes 'में comma

2. int parantheses में double quotes में 20.0 एक एरर देगा, क्योंकि string को सीधे integer में परिवर्तित करना संभव नहीं है।

12:03 कृपया समय के साथ अपने प्रश्नों को इस फोरम में पोस्ट करें।
12:07 कृपया Python से संबधित अपने सामान्य प्रश्नों को इस फोरम पर पोस्ट करें।
12:12 FOSSEE टीम TBC परियोजना का समन्वय करती है।
12:16 स्पोकन ट्यूटोरियल प्रोजेक्ट NMEICT, MHRD, भारत सरकार द्वारा वित्त पोषित है। अधिक जानकारी के लिए, इस वेबसाइट पर जाएँ।
12:27 यह स्क्रिप्ट विकास द्वारा अनुवादित है। हमसे जुड़ने के लिए धन्यवाद।

Contributors and Content Editors

Sakinashaikh