Biopython/C2/Writing-Sequence-Files/Hindi
From Script | Spoken-Tutorial
Revision as of 19:10, 13 February 2017 by Shruti arya (Talk | contribs)
|
|
---|---|
00:01 | नमस्कार |
00:02 | 'Writing Sequence Files' पर इस ट्यूटोरियल में आपका स्वागत है। |
00:07 | इस ट्यूटोरियल में हम सीखेंगे कि: 'Sequence Record Objects' कैसे बनाते हैं |
00:13 | सीक्वेंस फाइल्स कैसे लिखते हैं |
00:15 | 'फाइल फॉर्मेट्स' में कैसे बदलते हैं |
00:19 | और लम्बाई के आधार पर फाइल में 'रेकॉर्ड्स' को कैसे सॉर्ट यानि कि छांटते हैं। |
00:23 | इस ट्यूटोरियल के अनुसरण के लिए आपको |
00:27 | स्नातक स्तर की बायोकेमिस्ट्री या बायोइन्फॉर्मेटिक्स और |
00:31 | बुनियादी 'Python' प्रोग्रामिंग के साथ परिचित होना चाहिए। |
00:34 | दिए लिंक पर 'Python' ट्यूटोरियल्स को देखें। |
00:38 | इस ट्यूटोरियल को रेकॉर्ड करने के लिए मैं उपयोग कर रही हूँ: 'Ubuntu OS' वर्जन 14.10 |
00:45 | 'Python' वर्जन 2.7.8 |
00:48 | 'Ipython interpretor' वर्जन 2.3.0 और * 'Biopython' वर्जन 1.64. |
00:55 | हमने फाइल की विषय वस्तु को पढ़ने के लिए पहले ही 'parse' और 'read' 'फंक्शन्स' के बारे में सीखा है। |
01:03 | इस ट्यूटोरियल में हम सीखेंगे कि एक फाइल पर सीक्वेंसेस लिखने के लिए 'write' फंक्शन कैसे उपयोग करते हैं। |
01:09 | और विभिन्न फाइल फॉर्मेट्स के बीच अंतर-रूपांतरण करने के लिए 'Convert' फंक्शन कैसे उपयोग करते हैं। |
01:16 | अब मैं दिखाती हूँ कि 'write' फंक्शन को कैसे उपयोग करते हैं। |
01:20 | यहाँ एक प्रोटीन सीक्वेंस के साथ एक टेक्स्ट फाइल है। |
01:24 | यहाँ प्रदर्शित सीक्वेंस 'insulin protein' है। |
01:28 | फाइल कुछ जानकारी जैसे 'GI accession number' और 'description' भी रखती है। |
01:36 | अब हम 'FASTA' फॉर्मेट में इस सीक्वेंस के लिए एक फाइल बनायेंगे। |
01:41 | पहली स्टेप है 'sequence record object' बनाना। |
01:45 | सीक्वेंस रेकॉर्ड ऑब्जेक्ट के बारे में अधिक जानकारी: |
01:49 | यह 'sequence input/output interface' के लिए बुनियादी डेटा टाइप है। |
01:55 | सीक्वेंस रेकॉर्ड ऑब्जेक्ट में एक सीक्वेंस उच्च लेवल फीचर्स जैसे कि 'आईडेंटिफ़ायर्स' और डिस्क्रिप्शन्स के साथ संयुक्त की जाती है। |
02:04 | 'Ctrl, Alt' और 't' कीज़ एकसाथ दबाकर टर्मिनल खोलें। |
02:10 | प्रॉम्प्ट पर टाइप करें: 'ipython' एंटर दबाएं। |
02:15 | प्रॉम्प्ट पर निम्न लाइनें टाइप करें: |
02:18 | 'from Bio dot Seq module import Seq class'. |
02:24 | 'from Bio dot SeqRecord module import Sequence Record class' |
02:31 | अगला, 'from Bio dot Alphabet module import generic protein class'. |
02:38 | आगे, मैं वेरिएबल 'record1' में सीक्वेंस रेकॉर्ड ऑब्जेक्ट सेव करुँगी। |
02:45 | टेक्स्ट फाइल से 'sequence, id' और 'description' 'कॉपी' करें और टर्मिनल पर सम्बंधित लाइनों पर इसे पेस्ट करें। |
02:56 | एंटर दबाएं। |
02:58 | आउटपुट देखने के लिए टाइप करें: 'record1' |
03:02 | एंटर दबाएं। |
03:04 | आउटपुट 'insulin protein' सीक्वेंस को 'sequence record' ऑब्जेक्ट की तरह दिखाता है। |
03:10 | यह 'id' और 'description' के साथ सीक्वेंस दिखाता है। |
03:13 | हम उपरोक्त सीक्वेंस रेकॉर्ड ऑब्जेक्ट को 'FASTA' फाइल में बदलने के लिए 'write' फंक्शन उपयोग करेंगे। |
03:21 | 'Bio पैकेज' से ‘SeqIO module’ इम्पोर्ट करें |
03:26 | आगे सीक्वेंस ऑब्जेक्ट को 'FASTA' फाइल में बदलने के लिए 'write' फंक्शन के साथ 'command line' टाइप करें। |
03:40 | 'write' फंक्शन तीन 'आर्ग्युमेंट्स' लेता है। |
03:44 | पहला 'sequence record object' संचित करने वाला वेरिएबल है। |
03:49 | दूसरा 'FASTA' फाइल लिखने के लिए फाइल नाम है। |
03:54 | तीसरा लिखने के लिए फाइल फॉर्मेट है। एंटर दबाएं। |
03:58 | आउटपुट 1 दिखाता है जिसका मतलब है हमने एक 'sequence record object' को 'FASTA' फाइल में बदल दिया है। |
04:07 | 'FASTA' फॉर्मेट में फाइल 'example.fasta' की तरह 'home' फोल्डर में सेव की जाती है। |
04:13 | मैं आपको चेतावनी देती हूँ |
04:14 | आउटपुट उसी नाम की किसी भी पहले से मौजूद फाइल पर ओवर-राइट होगी। |
04:18 | फाइल देखने के लिए 'home' फोल्डर में फाइल पर जाएँ। |
04:24 | इस फाइल को 'टेक्स्ट एडिटर' में खोलें। |
04:27 | प्रोटीन सीक्वेंस अब 'FASTA' फॉर्मेट में है। |
04:31 | 'टेक्स्ट एडिटर' बंद करें। |
04:33 | बहुत से 'bioinformatics' टूल्स विभिन्न इनपुट फाइल फॉर्मेट्स लेते हैं। |
04:38 | अतः कभी-कभी सीक्वेंस फाइल फॉर्मेट्स के बीच अंतर-रूपांतरण की ज़रुरत होती है। |
04:44 | हम 'SeqIO module' में 'convert' फंक्शन उपयोग करके फाइल रूपांतरण कर सकते हैं। |
04:50 | प्रदर्शन के लिए मैं 'GenBank' फाइल को 'FASTA' फाइल में बदलूँगी। |
04:55 | मेरे 'home' फोल्डर से एक 'GenBank' फाइल लें। |
04:59 | इसे टेक्स्ट एडिटर में खोलें। |
05:02 | फाइल 'GenBank' फॉर्मेट में 'HIV genome' रखती है। |
05:07 | यह 'GenBank' फाइल, फाइल के पहले भाग में 'genome' में सारे 'genes' के विवरण रखती है। |
05:14 | इसके बाद पूरी 'genome' सीक्वेंस आती है। |
05:18 | टेक्स्ट एडिटर बंद करें। |
05:19 | टर्मिनल पर निम्न लाइनें टाइप करें। |
05:23 | यहाँ 'convert' फंक्शन 'GenBank' फाइल में उपस्थित पूरे 'genome' को 'FASTA' फाइल में बदलता है। एंटर दबाएं। |
05:33 | 'FASTA' फॉर्मेट में नयी फाइल home' फोल्डर में अब 'HIV.fasta' से सेव की जाती है। |
05:39 | फाइल पर जाएँ और टेक्स्ट एडिटर में खोलें। |
05:46 | टेक्स्ट एडिटर बंद करें। |
05:49 | भले ही हम 'convert' फंक्शन उपयोग करके फाइल फॉर्मेट्स को आसानी से बदल सकते हैं लेकिन यह सीमायें रखता है। |
05:56 | कुछ फॉर्मेट्स लिखने के लिए जानकारी की आवश्यकता होती है जो अन्य फाइल फॉर्मेट नहीं रखते हैं। |
06:02 | उदाहरण के लिए: हम 'GenBank' फाइल को 'FASTA' फाइल में बदल सकते हैं, लेकिन रिवर्स नहीं कर सकते। |
06:09 | उसी प्रकार हम एक 'FASTQ' फाइल को 'FASTA' फाइल में बदल सकते हैं लेकिन रिवर्स नहीं कर सकते। |
06:15 | 'convert' फंक्शन से सम्बंधित अधिक जानकारी के लिए टाइप करें 'help' कमांड। |
06:21 | एंटर दबाएं। |
06:24 | प्रॉम्प्ट पर वापस जाने के लिए की बोर्ड पर 'q' दबाएं। |
06:28 | हम 'GenBank' फॉर्मेट में 'HIV genome' से अलग-अलग 'genes' को भी एक्सट्रैक्ट कर सकते हैं। |
06:35 | ये अलग-अलग 'genes' 'FASTA' या कोई अन्य फॉर्मेट्स में सेव किये जा सकते हैं। |
06:41 | इसके लिए 'प्रॉम्प्ट' पर निम्न कोड टाइप करें। |
06:47 | यह कोड एक फाइल में सारे अलग-अलग 'CDS' जीन सीक्वेंसेस, उनकी ids और 'gene' का नाम लिखेगा |
06:56 | फाइल आपके 'home' फोल्डर में 'HIV_geneseq.fasta' की तरह सेव की जाती है। एंटर दबाएं। |
07:07 | 'Biopython' टूल्स उपयोग करके हम फाइल में रेकॉर्ड्स को लम्बाई से सॉर्ट यानि कि छांट सकते हैं। |
07:12 | यहाँ मैंने एक FASTA फाइल 'hemoglobin.fasta' खोली है जो छः रेकॉर्ड्स रखती है। |
07:19 | प्रत्येक रेकॉर्ड भिन्न-भिन्न लम्बाई का है। |
07:23 | सबसे लम्बे रेकॉर्ड को व्यवस्थित करने के लिए निम्न लाइनें टाइप करें। |
07:27 | सॉर्ट किये हुए सीक्वेंसेस के साथ नयी फाइल आपके 'home' फोल्डर में 'sorted_hemoglobin.fasta' से सेव की जाएगी। |
07:38 | पहले छोटे रेकॉर्ड्स के लिए 'records.sort' कमांड लाइन में आर्ग्युमेंट्स को रिवर्स करें। |
07:45 | इसे सारांशित करते हैं। |
07:46 | इस ट्यूटोरियल में हमने सीखा: सीक्वेंस रेकॉर्ड ऑब्जेक्ट्स बनाना |
07:51 | 'Sequence Input/Output' मॉड्यूल का 'write' फंक्शन उपयोग करके सीक्वेंसेस फाइल्स लिखना |
07:58 | 'convert' फंक्शन उपयोग करके 'सीक्वेंस फाइल फॉर्मेट्स' का रूपांतरण |
08:03 | और लम्बाई से फाइल में रेकॉर्ड्स सॉर्ट यानि कि छांटना। |
08:07 | नियत कार्य के लिए: |
08:09 | HIV के 'genomic' सीक्वेंस से 4587 से 5165 स्थानों तक जीन 'HIV1gp3' को एक्सट्रैक्ट करें। |
08:21 | फाइल 'HIV.gb' इस ट्यूटोरियल के कोड फाइल्स में शामिल की गयी है। |
08:28 | आपका पूर्ण नियत कार्य निम्न कोड रखेगा। |
08:43 | निम्न लिंक पर उपलब्ध वीडियो स्पोकन ट्यूटोरियल प्रॉजेक्ट को सारांशित करता है। |
08:48 | कृपया इसे डाउनलोड करके देखें। |
08:49 | स्पोकन ट्यूटोरियल प्रॉजेक्ट टीम कार्यशालाएं चलाती है और ऑनलाइन टेस्ट पास करने वालों को प्रमाणपत्र देती है। |
08:57 | अधिक जानकारी के लिए कृपया हमें लिखें। |
09:00 | स्पोकन ट्यूटोरियल प्रॉजेक्ट भारत सरकार के MHRD के NMEICT द्वारा निधिबद्ध है। |
09:06 | इस मिशन पर अधिक जानकारी इस लिंक पर उपलब्ध है। |
09:10 | आई आई टी बॉम्बे से मैं श्रुति आर्य आपसे विदा लेती हूँ। हमसे जुड़ने के लिए धन्यवाद। |