Biopython/C2/Blast/Hindi
From Script | Spoken-Tutorial
|
|
---|---|
00:01 | 'Biopython' टूल्स उपयोग करके 'BLAST' पर इस ट्यूटोरियल में आपका स्वागत है। |
00:06 | इस ट्यूटोरियल में हम सीखेंगे: Biopython टूल्स उपयोग करके 'query sequence' के लिए 'BLAST' रन करना |
00:13 | और आगे के विश्लेषण के लिए BLAST आउटपुट को 'parse' करना |
00:17 | इस ट्यूटोरियल के अनुसरण के लिए आपको स्नातक स्तर की बायोकेमिस्ट्री या बायोइन्फॉर्मेटिक्स |
00:24 | और बुनियादी 'Python' प्रोग्रामिंग के साथ परिचित होना चाहिए। |
00:27 | दिए गए लिंक पर 'Python' ट्यूटोरियल्स पर जाएँ। |
00:31 | इस ट्यूटोरियल को रेकॉर्ड करने के लिए मैं उपयोग कर रही हूँ 'Ubuntu' ऑपरेटिंग सिस्टम वर्जन 14.10 |
00:37 | 'Python' वर्जन 2.7.8 |
00:41 | 'Ipython interpretor' वर्जन 2.3.0 |
00:46 | 'Biopython' वर्जन 1.64 और * एक कार्यकारी इन्टरनेट कनेक्शन |
00:52 | 'BLAST' 'Basic Local Alignment Search Tool' का संक्षिप्त रूप है। |
00:57 | यह 'सीक्वेंस' की जानकारी की तुलना करने के लिए 'algorithm' है। |
01:02 | प्रोग्राम डेटाबेस के सीक्वेंस की 'nucleotide' या 'protein' सीक्वेंस से तुलना करता है और मैच के सांख्यिकीय महत्व की गणना करता है। |
01:14 | BLAST को रन करने के दो भिन्न-भिन्न तरीके हैं: |
01:17 | आपकी मशीन पर लोकल 'BLAST' या NCBI सर्वर्स से इन्टरनेट पर 'BLAST' रन करना |
01:24 | 'Biopython' में 'BLAST' को रन करने के दो स्टेप्स हैं। |
01:28 | पहला, आपकी 'क्वेरी सीक्वेंस' के लिए 'BLAST' रन करें और कुछ आउटपुट प्राप्त करें। |
01:33 | दूसरा, आगे के विश्लेषण के लिए 'BLAST' आउटपुट को 'parse' करें। |
01:38 | हम 'टर्मिनल' खोलेंगे और न्यूक्लोटाइड सीक्वेंस के लिए 'BLAST' रन करेंगे। |
01:43 | 'Ctrl, Alt' और 'T' कीज़ एकसाथ दबाकर टर्मिनल खोलें। |
01:48 | 'prompt' पर टाइप करें: 'ipython' और एंटर दबाएं। |
01:52 | इस ट्यूटोरियल में मैं दिखाऊंगी कि 'NCBI BLAST' सर्विस उपयोग करके इन्टरनेट पर 'BLAST' को कैसे रन करते हैं। |
02:01 | प्रॉम्प्ट पर निम्न टाइप करें 'Bio.Blast' पैकेज से 'Import NCBIWWW' मॉड्यूल, एंटर दबाएं। |
02:14 | आगे इन्टरनेट पर BLAST रन करने के लिए, प्रॉम्प्ट पर निम्न टाइप करें |
02:20 | हम 'NCBIWWW' मॉड्यूल में 'qblast function' उपयोग करेंगे। |
02:25 | 'qblast function' तीन 'आर्ग्युमेंट्स' लेता है: |
02:29 | पहला 'आर्ग्युमेंट' 'blast program' सर्च के लिए उपयोग होता है। |
02:33 | दूसरा, उस डेटाबेस को निर्दिष्ट करना जिसके विरुद्द सर्च करना है। |
02:38 | तीसरा 'आर्ग्युमेंट' आपका 'क्वेरी सीक्वेंस' है। |
02:43 | 'क्वेरी सीक्वेंस' के लिए इनपुट 'GI' नंबर या 'FASTA' फाइल की फॉर्म में हो सकता है। या यह 'सीक्वेंस रेकॉर्ड ऑब्जेक्ट' भी हो सकता है। |
02:53 | इस पदर्शन के लिए मैं 'nucleotide sequence' के लिए 'GI नंबर' उपयोग कर रही हूँ। |
02:58 | 'GI नंबर' 'insulin' के 'nucleotide sequence' के लिए है। |
03:03 | 'qblast फंक्शन' अन्य कई विकल्प आर्ग्युमेंट्स भी लेता है। |
03:09 | ये आर्ग्युमेंट्स भिन्न-भिन्न पैरामीटर्स के समान होते हैं जो आप 'BLAST' वेब पेज पर सेट कर सकते हैं। |
03:15 | 'qblast फंक्शन' 'xml' फॉर्मेट में 'BLAST' परिणामों को रिटर्न करेगा। |
03:20 | 'टर्मिनल' पर वापस आएं। |
03:22 | हमारा क्वेरी सीक्वेंस 'nucleotide' है या 'protein sequence' है इस आधार पर हमें उपयुक्त 'Blast' प्रोग्राम उपयोग करना है। |
03:30 | चूँकि हमारी क्वेरी 'nucleotide है हम 'blastn' प्रोग्राम उपयोग करेंगे और 'nt' 'nucleotide' डेटाबेस को दिखाता है। |
03:39 | इसके बारे में विवरण 'NCBI BLAST' वेबपेज पर उपलब्ध है। |
03:45 | 'blast आउटपुट' 'xml' फाइल की फॉर्म में 'result' नामक वेरिएबल में संचित किया जाता है। |
03:51 | एंटर दबाएं। |
03:53 | आपके इन्टरनेट की स्पीड के आधार पर यह 'BLAST' की खोज को पूरा करने के लिए कुछ समय ले सकता है। |
03:59 | आगे की प्रक्रिया से पहले 'xml' फाइल को डिस्क पर सेव करना ज़रूरी है। |
04:05 | 'xml file' को सेव करने के लिए निम्न लाइनें टाइप करें। |
04:09 | कोड की ये लाइनें 'home' फोल्डर में 'blast.xml' की तरह खोज के परिणामों को सेव करेंगी। |
04:18 | अपने 'home' फोल्डर और फाइल पर जाएँ। |
04:21 | फाइल पर क्लिक करें और फाइल की विषय वस्तु को जाँचें। |
04:30 | अगर आप 'FASTA' फाइल को 'क्वेरी' की तरह उपयोग करना चाहते हैं, तो इस टेक्स्ट फाइल में प्रदर्शित कोड उपयोग करें। |
04:36 | अगर आप क्वेरी की तरह एक 'FASTA' फाइल से 'सीक्वेंस रेकॉर्ड ऑब्जेक्ट' उपयोग करना चाहते हैं तो यहाँ वो कोड है। |
04:42 | 'टर्मिनल' पर वापस आएं। |
04:44 | अगली स्टेप है डेटा 'एक्सट्रैक्ट' करने के लिए फाइल को 'पार्स' करना। |
04:48 | पार्सिंग में पहली स्टेप है इनपुट के लिए 'xml' फाइल खोलना। |
04:53 | प्रॉम्प्ट पर निम्न टाइप करें। एंटर दबाएं। |
04:57 | आगे, 'Bio.Blast' पैकेज से 'NCBIXML' मॉड्यूल को 'इम्पोर्ट' करें। |
05:05 | एंटर दबाएं। |
05:07 | 'Blast' आउटपुट को 'पार्स' करने के लिए निम्न लाइनें टाइप करें। |
05:11 | ब्लास्ट रेकॉर्ड वो सारी जानकारी रखता है जो आप 'BLAST' आउटपुट से 'एक्सट्रैक्ट' करना चाहते हैं। |
05:18 | अब हम अपनी 'ब्लास्ट रिपोर्ट' में सारे 'हिट्स' की कुछ जानकारी प्रिंट करते हैं जो एक विशेष थ्रेशोल्ड से बड़ी है। |
05:27 | निम्न कोड टाइप करें। |
05:30 | 'मैच' के 'महत्वपूर्ण' होने के लिए अपेक्षित 'स्कोर' 0.01 से कम होना चाहिए। |
05:37 | प्रत्येक 'hsp' यानि हाई स्कोरिंग पेअर, के लिए हमें 'title, length, hsp score, gaps' और 'expect value' मिलता है। |
05:49 | हम 'क्वेरी' रखने वाली 'स्ट्रिंग्स', अलाइन किया हुआ डेटाबेस सीक्वेंस और स्ट्रिंग जो मैच और मिसमैच स्थितियों को निदिष्ट करता है, को भी प्रिंट करेंगे। |
06:02 | आउटपुट के लिए दो बार एंटर की दबाएं। |
06:05 | आउटपुट देखें। |
06:09 | प्रत्येक अलाइनमेंट के लिये हमारे पास 'length, score, gaps, e value' और 'strings' हैं। |
06:16 | आप 'Bio.Blast' पैकेज में उपलब्ध अन्य 'फंक्शन्स' उपयोग करके आवश्यक जानकारी एक्सट्रैक्ट कर सकते हैं। |
06:24 | हम इस ट्यूटोरियल के अंत में आ गए हैं। |
06:26 | संक्षेप में |
06:27 | इस ट्यूटोरियल में हमने सीखा 'GI' नंबर उपयोग करके क्वेरी न्युक्लियोटाइड सीक्वेंस के लिए 'BLAST' फंक्शन रन करना |
06:36 | और 'Bio.Blast.Record' मॉड्यूल उपयोग करके 'BLAST' आउटपुट को 'पार्स' करना। |
06:43 | नियत कार्य में अपनी पसंद के 'प्रोटीन' सीक्वेंस के लिए 'BLAST Search' रन करें। |
06:50 | आउटपुट फाइल को सेव करें और फाइल में निहित डेटा को पार्स करें। |
06:55 | आपका पूर्ण नियत कार्य इस फाइल में दिखाये गए की तरह कोड की निम्न लाइनें रखना चाहिए। |
07:01 | कोड देखें। चूँकि हमारी 'क्वेरी' 'प्रोटीन सीक्वेंस' है तो हमने 'blastp' प्रोग्राम और 'nr' जोकि 'BLAST' के लिए नॉन-रिडंडेंट प्रोटीन डेटाबेस है, उपयोग किया है। |
07:16 | निम्न लिंक पर उपलब्ध वीडियो स्पोकन ट्यूटोरियल प्रॉजेक्ट को सारांशित करता है। |
07:20 | कृपया इसे डाउनलोड करके देखें। |
07:22 | स्पोकन ट्यूटोरियल प्रॉजेक्ट टीम कार्यशालाएं चलाती है और ऑनलाइन टेस्ट पास करने वालों को प्रमाणपत्र देती है। |
07:30 | अधिक जानकारी के लिए हमें लिखें। |
07:33 | स्पोकन ट्यूटोरियल प्रॉजेक्ट भारत सरकार के MHRD के NMEICT द्वारा निधिबद्ध है। |
07:40 | इस मिशन पर अधिक जानकारी दिखाए लिंक पर उपलब्ध है। |
07:45 | आई आई टी बॉम्बे से मैं श्रुति आर्य आपसे विदा लेती हूँ। हमसे जुड़ने के लिए धन्यवाद। |