Biopython/C2/Writing-Sequence-Files/Hindi

From Script | Spoken-Tutorial
Revision as of 19:10, 13 February 2017 by Shruti arya (Talk | contribs)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to: navigation, search
Time
Narration
00:01 नमस्कार
00:02 'Writing Sequence Files' पर इस ट्यूटोरियल में आपका स्वागत है।
00:07 इस ट्यूटोरियल में हम सीखेंगे कि: 'Sequence Record Objects' कैसे बनाते हैं
00:13 सीक्वेंस फाइल्स कैसे लिखते हैं
00:15 'फाइल फॉर्मेट्स' में कैसे बदलते हैं
00:19 और लम्बाई के आधार पर फाइल में 'रेकॉर्ड्स' को कैसे सॉर्ट यानि कि छांटते हैं।
00:23 इस ट्यूटोरियल के अनुसरण के लिए आपको
00:27 स्नातक स्तर की बायोकेमिस्ट्री या बायोइन्फॉर्मेटिक्स और
00:31 बुनियादी 'Python' प्रोग्रामिंग के साथ परिचित होना चाहिए।
00:34 दिए लिंक पर 'Python' ट्यूटोरियल्स को देखें।
00:38 इस ट्यूटोरियल को रेकॉर्ड करने के लिए मैं उपयोग कर रही हूँ: 'Ubuntu OS' वर्जन 14.10
00:45 'Python' वर्जन 2.7.8
00:48 'Ipython interpretor' वर्जन 2.3.0 और * 'Biopython' वर्जन 1.64.
00:55 हमने फाइल की विषय वस्तु को पढ़ने के लिए पहले ही 'parse' और 'read' 'फंक्शन्स' के बारे में सीखा है।
01:03 इस ट्यूटोरियल में हम सीखेंगे कि एक फाइल पर सीक्वेंसेस लिखने के लिए 'write' फंक्शन कैसे उपयोग करते हैं।
01:09 और विभिन्न फाइल फॉर्मेट्स के बीच अंतर-रूपांतरण करने के लिए 'Convert' फंक्शन कैसे उपयोग करते हैं।
01:16 अब मैं दिखाती हूँ कि 'write' फंक्शन को कैसे उपयोग करते हैं।
01:20 यहाँ एक प्रोटीन सीक्वेंस के साथ एक टेक्स्ट फाइल है।
01:24 यहाँ प्रदर्शित सीक्वेंस 'insulin protein' है।
01:28 फाइल कुछ जानकारी जैसे 'GI accession number' और 'description' भी रखती है।
01:36 अब हम 'FASTA' फॉर्मेट में इस सीक्वेंस के लिए एक फाइल बनायेंगे।
01:41 पहली स्टेप है 'sequence record object' बनाना।
01:45 सीक्वेंस रेकॉर्ड ऑब्जेक्ट के बारे में अधिक जानकारी:
01:49 यह 'sequence input/output interface' के लिए बुनियादी डेटा टाइप है।
01:55 सीक्वेंस रेकॉर्ड ऑब्जेक्ट में एक सीक्वेंस उच्च लेवल फीचर्स जैसे कि 'आईडेंटिफ़ायर्स' और डिस्क्रिप्शन्स के साथ संयुक्त की जाती है।
02:04 'Ctrl, Alt' और 't' कीज़ एकसाथ दबाकर टर्मिनल खोलें।
02:10 प्रॉम्प्ट पर टाइप करें: 'ipython' एंटर दबाएं।
02:15 प्रॉम्प्ट पर निम्न लाइनें टाइप करें:
02:18 'from Bio dot Seq module import Seq class'.
02:24 'from Bio dot SeqRecord module import Sequence Record class'
02:31 अगला, 'from Bio dot Alphabet module import generic protein class'.
02:38 आगे, मैं वेरिएबल 'record1' में सीक्वेंस रेकॉर्ड ऑब्जेक्ट सेव करुँगी।
02:45 टेक्स्ट फाइल से 'sequence, id' और 'description' 'कॉपी' करें और टर्मिनल पर सम्बंधित लाइनों पर इसे पेस्ट करें।
02:56 एंटर दबाएं।
02:58 आउटपुट देखने के लिए टाइप करें: 'record1'
03:02 एंटर दबाएं।
03:04 आउटपुट 'insulin protein' सीक्वेंस को 'sequence record' ऑब्जेक्ट की तरह दिखाता है।
03:10 यह 'id' और 'description' के साथ सीक्वेंस दिखाता है।
03:13 हम उपरोक्त सीक्वेंस रेकॉर्ड ऑब्जेक्ट को 'FASTA' फाइल में बदलने के लिए 'write' फंक्शन उपयोग करेंगे।
03:21 'Bio पैकेज' से ‘SeqIO module’ इम्पोर्ट करें
03:26 आगे सीक्वेंस ऑब्जेक्ट को 'FASTA' फाइल में बदलने के लिए 'write' फंक्शन के साथ 'command line' टाइप करें।
03:40 'write' फंक्शन तीन 'आर्ग्युमेंट्स' लेता है।
03:44 पहला 'sequence record object' संचित करने वाला वेरिएबल है।
03:49 दूसरा 'FASTA' फाइल लिखने के लिए फाइल नाम है।
03:54 तीसरा लिखने के लिए फाइल फॉर्मेट है। एंटर दबाएं।
03:58 आउटपुट 1 दिखाता है जिसका मतलब है हमने एक 'sequence record object' को 'FASTA' फाइल में बदल दिया है।
04:07 'FASTA' फॉर्मेट में फाइल 'example.fasta' की तरह 'home' फोल्डर में सेव की जाती है।
04:13 मैं आपको चेतावनी देती हूँ
04:14 आउटपुट उसी नाम की किसी भी पहले से मौजूद फाइल पर ओवर-राइट होगी।
04:18 फाइल देखने के लिए 'home' फोल्डर में फाइल पर जाएँ।
04:24 इस फाइल को 'टेक्स्ट एडिटर' में खोलें।
04:27 प्रोटीन सीक्वेंस अब 'FASTA' फॉर्मेट में है।
04:31 'टेक्स्ट एडिटर' बंद करें।
04:33 बहुत से 'bioinformatics' टूल्स विभिन्न इनपुट फाइल फॉर्मेट्स लेते हैं।
04:38 अतः कभी-कभी सीक्वेंस फाइल फॉर्मेट्स के बीच अंतर-रूपांतरण की ज़रुरत होती है।
04:44 हम 'SeqIO module' में 'convert' फंक्शन उपयोग करके फाइल रूपांतरण कर सकते हैं।
04:50 प्रदर्शन के लिए मैं 'GenBank' फाइल को 'FASTA' फाइल में बदलूँगी।
04:55 मेरे 'home' फोल्डर से एक 'GenBank' फाइल लें।
04:59 इसे टेक्स्ट एडिटर में खोलें।
05:02 फाइल 'GenBank' फॉर्मेट में 'HIV genome' रखती है।
05:07 यह 'GenBank' फाइल, फाइल के पहले भाग में 'genome' में सारे 'genes' के विवरण रखती है।
05:14 इसके बाद पूरी 'genome' सीक्वेंस आती है।
05:18 टेक्स्ट एडिटर बंद करें।
05:19 टर्मिनल पर निम्न लाइनें टाइप करें।
05:23 यहाँ 'convert' फंक्शन 'GenBank' फाइल में उपस्थित पूरे 'genome' को 'FASTA' फाइल में बदलता है। एंटर दबाएं।
05:33 'FASTA' फॉर्मेट में नयी फाइल home' फोल्डर में अब 'HIV.fasta' से सेव की जाती है।
05:39 फाइल पर जाएँ और टेक्स्ट एडिटर में खोलें।
05:46 टेक्स्ट एडिटर बंद करें।
05:49 भले ही हम 'convert' फंक्शन उपयोग करके फाइल फॉर्मेट्स को आसानी से बदल सकते हैं लेकिन यह सीमायें रखता है।
05:56 कुछ फॉर्मेट्स लिखने के लिए जानकारी की आवश्यकता होती है जो अन्य फाइल फॉर्मेट नहीं रखते हैं।
06:02 उदाहरण के लिए: हम 'GenBank' फाइल को 'FASTA' फाइल में बदल सकते हैं, लेकिन रिवर्स नहीं कर सकते।
06:09 उसी प्रकार हम एक 'FASTQ' फाइल को 'FASTA' फाइल में बदल सकते हैं लेकिन रिवर्स नहीं कर सकते।
06:15 'convert' फंक्शन से सम्बंधित अधिक जानकारी के लिए टाइप करें 'help' कमांड।
06:21 एंटर दबाएं।
06:24 प्रॉम्प्ट पर वापस जाने के लिए की बोर्ड पर 'q' दबाएं।
06:28 हम 'GenBank' फॉर्मेट में 'HIV genome' से अलग-अलग 'genes' को भी एक्सट्रैक्ट कर सकते हैं।
06:35 ये अलग-अलग 'genes' 'FASTA' या कोई अन्य फॉर्मेट्स में सेव किये जा सकते हैं।
06:41 इसके लिए 'प्रॉम्प्ट' पर निम्न कोड टाइप करें।
06:47 यह कोड एक फाइल में सारे अलग-अलग 'CDS' जीन सीक्वेंसेस, उनकी ids और 'gene' का नाम लिखेगा
06:56 फाइल आपके 'home' फोल्डर में 'HIV_geneseq.fasta' की तरह सेव की जाती है। एंटर दबाएं।
07:07 'Biopython' टूल्स उपयोग करके हम फाइल में रेकॉर्ड्स को लम्बाई से सॉर्ट यानि कि छांट सकते हैं।
07:12 यहाँ मैंने एक FASTA फाइल 'hemoglobin.fasta' खोली है जो छः रेकॉर्ड्स रखती है।
07:19 प्रत्येक रेकॉर्ड भिन्न-भिन्न लम्बाई का है।
07:23 सबसे लम्बे रेकॉर्ड को व्यवस्थित करने के लिए निम्न लाइनें टाइप करें।
07:27 सॉर्ट किये हुए सीक्वेंसेस के साथ नयी फाइल आपके 'home' फोल्डर में 'sorted_hemoglobin.fasta' से सेव की जाएगी।
07:38 पहले छोटे रेकॉर्ड्स के लिए 'records.sort' कमांड लाइन में आर्ग्युमेंट्स को रिवर्स करें।
07:45 इसे सारांशित करते हैं।
07:46 इस ट्यूटोरियल में हमने सीखा: सीक्वेंस रेकॉर्ड ऑब्जेक्ट्स बनाना
07:51 'Sequence Input/Output' मॉड्यूल का 'write' फंक्शन उपयोग करके सीक्वेंसेस फाइल्स लिखना
07:58 'convert' फंक्शन उपयोग करके 'सीक्वेंस फाइल फॉर्मेट्स' का रूपांतरण
08:03 और लम्बाई से फाइल में रेकॉर्ड्स सॉर्ट यानि कि छांटना।
08:07 नियत कार्य के लिए:
08:09 HIV के 'genomic' सीक्वेंस से 4587 से 5165 स्थानों तक जीन 'HIV1gp3' को एक्सट्रैक्ट करें।
08:21 फाइल 'HIV.gb' इस ट्यूटोरियल के कोड फाइल्स में शामिल की गयी है।
08:28 आपका पूर्ण नियत कार्य निम्न कोड रखेगा।
08:43 निम्न लिंक पर उपलब्ध वीडियो स्पोकन ट्यूटोरियल प्रॉजेक्ट को सारांशित करता है।
08:48 कृपया इसे डाउनलोड करके देखें।
08:49 स्पोकन ट्यूटोरियल प्रॉजेक्ट टीम कार्यशालाएं चलाती है और ऑनलाइन टेस्ट पास करने वालों को प्रमाणपत्र देती है।
08:57 अधिक जानकारी के लिए कृपया हमें लिखें।
09:00 स्पोकन ट्यूटोरियल प्रॉजेक्ट भारत सरकार के MHRD के NMEICT द्वारा निधिबद्ध है।
09:06 इस मिशन पर अधिक जानकारी इस लिंक पर उपलब्ध है।
09:10 आई आई टी बॉम्बे से मैं श्रुति आर्य आपसे विदा लेती हूँ। हमसे जुड़ने के लिए धन्यवाद।

Contributors and Content Editors

Shruti arya