Biopython/C2/Writing-Sequence-Files/Hindi

Time	Narration
00:01	नमस्कार
00:02	'Writing Sequence Files' पर इस ट्यूटोरियल में आपका स्वागत है।
00:07	इस ट्यूटोरियल में हम सीखेंगे कि: 'Sequence Record Objects' कैसे बनाते हैं
00:13	सीक्वेंस फाइल्स कैसे लिखते हैं
00:15	'फाइल फॉर्मेट्स' में कैसे बदलते हैं
00:19	और लम्बाई के आधार पर फाइल में 'रेकॉर्ड्स' को कैसे सॉर्ट यानि कि छांटते हैं।
00:23	इस ट्यूटोरियल के अनुसरण के लिए आपको
00:27	स्नातक स्तर की बायोकेमिस्ट्री या बायोइन्फॉर्मेटिक्स और
00:31	बुनियादी 'Python' प्रोग्रामिंग के साथ परिचित होना चाहिए।
00:34	दिए लिंक पर 'Python' ट्यूटोरियल्स को देखें।
00:38	इस ट्यूटोरियल को रेकॉर्ड करने के लिए मैं उपयोग कर रही हूँ: 'Ubuntu OS' वर्जन 14.10
00:45	'Python' वर्जन 2.7.8
00:48	'Ipython interpretor' वर्जन 2.3.0 और * 'Biopython' वर्जन 1.64.
00:55	हमने फाइल की विषय वस्तु को पढ़ने के लिए पहले ही 'parse' और 'read' 'फंक्शन्स' के बारे में सीखा है।
01:03	इस ट्यूटोरियल में हम सीखेंगे कि एक फाइल पर सीक्वेंसेस लिखने के लिए 'write' फंक्शन कैसे उपयोग करते हैं।
01:09	और विभिन्न फाइल फॉर्मेट्स के बीच अंतर-रूपांतरण करने के लिए 'Convert' फंक्शन कैसे उपयोग करते हैं।
01:16	अब मैं दिखाती हूँ कि 'write' फंक्शन को कैसे उपयोग करते हैं।
01:20	यहाँ एक प्रोटीन सीक्वेंस के साथ एक टेक्स्ट फाइल है।
01:24	यहाँ प्रदर्शित सीक्वेंस 'insulin protein' है।
01:28	फाइल कुछ जानकारी जैसे 'GI accession number' और 'description' भी रखती है।
01:36	अब हम 'FASTA' फॉर्मेट में इस सीक्वेंस के लिए एक फाइल बनायेंगे।
01:41	पहली स्टेप है 'sequence record object' बनाना।
01:45	सीक्वेंस रेकॉर्ड ऑब्जेक्ट के बारे में अधिक जानकारी:
01:49	यह 'sequence input/output interface' के लिए बुनियादी डेटा टाइप है।
01:55	सीक्वेंस रेकॉर्ड ऑब्जेक्ट में एक सीक्वेंस उच्च लेवल फीचर्स जैसे कि 'आईडेंटिफ़ायर्स' और डिस्क्रिप्शन्स के साथ संयुक्त की जाती है।
02:04	'Ctrl, Alt' और 't' कीज़ एकसाथ दबाकर टर्मिनल खोलें।
02:10	प्रॉम्प्ट पर टाइप करें: 'ipython' एंटर दबाएं।
02:15	प्रॉम्प्ट पर निम्न लाइनें टाइप करें:
02:18	'from Bio dot Seq module import Seq class'.
02:24	'from Bio dot SeqRecord module import Sequence Record class'
02:31	अगला, 'from Bio dot Alphabet module import generic protein class'.
02:38	आगे, मैं वेरिएबल 'record1' में सीक्वेंस रेकॉर्ड ऑब्जेक्ट सेव करुँगी।
02:45	टेक्स्ट फाइल से 'sequence, id' और 'description' 'कॉपी' करें और टर्मिनल पर सम्बंधित लाइनों पर इसे पेस्ट करें।
02:56	एंटर दबाएं।
02:58	आउटपुट देखने के लिए टाइप करें: 'record1'
03:02	एंटर दबाएं।
03:04	आउटपुट 'insulin protein' सीक्वेंस को 'sequence record' ऑब्जेक्ट की तरह दिखाता है।
03:10	यह 'id' और 'description' के साथ सीक्वेंस दिखाता है।
03:13	हम उपरोक्त सीक्वेंस रेकॉर्ड ऑब्जेक्ट को 'FASTA' फाइल में बदलने के लिए 'write' फंक्शन उपयोग करेंगे।
03:21	'Bio पैकेज' से ‘SeqIO module’ इम्पोर्ट करें
03:26	आगे सीक्वेंस ऑब्जेक्ट को 'FASTA' फाइल में बदलने के लिए 'write' फंक्शन के साथ 'command line' टाइप करें।
03:40	'write' फंक्शन तीन 'आर्ग्युमेंट्स' लेता है।
03:44	पहला 'sequence record object' संचित करने वाला वेरिएबल है।
03:49	दूसरा 'FASTA' फाइल लिखने के लिए फाइल नाम है।
03:54	तीसरा लिखने के लिए फाइल फॉर्मेट है। एंटर दबाएं।
03:58	आउटपुट 1 दिखाता है जिसका मतलब है हमने एक 'sequence record object' को 'FASTA' फाइल में बदल दिया है।
04:07	'FASTA' फॉर्मेट में फाइल 'example.fasta' की तरह 'home' फोल्डर में सेव की जाती है।
04:13	मैं आपको चेतावनी देती हूँ
04:14	आउटपुट उसी नाम की किसी भी पहले से मौजूद फाइल पर ओवर-राइट होगी।
04:18	फाइल देखने के लिए 'home' फोल्डर में फाइल पर जाएँ।
04:24	इस फाइल को 'टेक्स्ट एडिटर' में खोलें।
04:27	प्रोटीन सीक्वेंस अब 'FASTA' फॉर्मेट में है।
04:31	'टेक्स्ट एडिटर' बंद करें।
04:33	बहुत से 'bioinformatics' टूल्स विभिन्न इनपुट फाइल फॉर्मेट्स लेते हैं।
04:38	अतः कभी-कभी सीक्वेंस फाइल फॉर्मेट्स के बीच अंतर-रूपांतरण की ज़रुरत होती है।
04:44	हम 'SeqIO module' में 'convert' फंक्शन उपयोग करके फाइल रूपांतरण कर सकते हैं।
04:50	प्रदर्शन के लिए मैं 'GenBank' फाइल को 'FASTA' फाइल में बदलूँगी।
04:55	मेरे 'home' फोल्डर से एक 'GenBank' फाइल लें।
04:59	इसे टेक्स्ट एडिटर में खोलें।
05:02	फाइल 'GenBank' फॉर्मेट में 'HIV genome' रखती है।
05:07	यह 'GenBank' फाइल, फाइल के पहले भाग में 'genome' में सारे 'genes' के विवरण रखती है।
05:14	इसके बाद पूरी 'genome' सीक्वेंस आती है।
05:18	टेक्स्ट एडिटर बंद करें।
05:19	टर्मिनल पर निम्न लाइनें टाइप करें।
05:23	यहाँ 'convert' फंक्शन 'GenBank' फाइल में उपस्थित पूरे 'genome' को 'FASTA' फाइल में बदलता है। एंटर दबाएं।
05:33	'FASTA' फॉर्मेट में नयी फाइल home' फोल्डर में अब 'HIV.fasta' से सेव की जाती है।
05:39	फाइल पर जाएँ और टेक्स्ट एडिटर में खोलें।
05:46	टेक्स्ट एडिटर बंद करें।
05:49	भले ही हम 'convert' फंक्शन उपयोग करके फाइल फॉर्मेट्स को आसानी से बदल सकते हैं लेकिन यह सीमायें रखता है।
05:56	कुछ फॉर्मेट्स लिखने के लिए जानकारी की आवश्यकता होती है जो अन्य फाइल फॉर्मेट नहीं रखते हैं।
06:02	उदाहरण के लिए: हम 'GenBank' फाइल को 'FASTA' फाइल में बदल सकते हैं, लेकिन रिवर्स नहीं कर सकते।
06:09	उसी प्रकार हम एक 'FASTQ' फाइल को 'FASTA' फाइल में बदल सकते हैं लेकिन रिवर्स नहीं कर सकते।
06:15	'convert' फंक्शन से सम्बंधित अधिक जानकारी के लिए टाइप करें 'help' कमांड।
06:21	एंटर दबाएं।
06:24	प्रॉम्प्ट पर वापस जाने के लिए की बोर्ड पर 'q' दबाएं।
06:28	हम 'GenBank' फॉर्मेट में 'HIV genome' से अलग-अलग 'genes' को भी एक्सट्रैक्ट कर सकते हैं।
06:35	ये अलग-अलग 'genes' 'FASTA' या कोई अन्य फॉर्मेट्स में सेव किये जा सकते हैं।
06:41	इसके लिए 'प्रॉम्प्ट' पर निम्न कोड टाइप करें।
06:47	यह कोड एक फाइल में सारे अलग-अलग 'CDS' जीन सीक्वेंसेस, उनकी ids और 'gene' का नाम लिखेगा
06:56	फाइल आपके 'home' फोल्डर में 'HIV_geneseq.fasta' की तरह सेव की जाती है। एंटर दबाएं।
07:07	'Biopython' टूल्स उपयोग करके हम फाइल में रेकॉर्ड्स को लम्बाई से सॉर्ट यानि कि छांट सकते हैं।
07:12	यहाँ मैंने एक FASTA फाइल 'hemoglobin.fasta' खोली है जो छः रेकॉर्ड्स रखती है।
07:19	प्रत्येक रेकॉर्ड भिन्न-भिन्न लम्बाई का है।
07:23	सबसे लम्बे रेकॉर्ड को व्यवस्थित करने के लिए निम्न लाइनें टाइप करें।
07:27	सॉर्ट किये हुए सीक्वेंसेस के साथ नयी फाइल आपके 'home' फोल्डर में 'sorted_hemoglobin.fasta' से सेव की जाएगी।
07:38	पहले छोटे रेकॉर्ड्स के लिए 'records.sort' कमांड लाइन में आर्ग्युमेंट्स को रिवर्स करें।
07:45	इसे सारांशित करते हैं।
07:46	इस ट्यूटोरियल में हमने सीखा: सीक्वेंस रेकॉर्ड ऑब्जेक्ट्स बनाना
07:51	'Sequence Input/Output' मॉड्यूल का 'write' फंक्शन उपयोग करके सीक्वेंसेस फाइल्स लिखना
07:58	'convert' फंक्शन उपयोग करके 'सीक्वेंस फाइल फॉर्मेट्स' का रूपांतरण
08:03	और लम्बाई से फाइल में रेकॉर्ड्स सॉर्ट यानि कि छांटना।
08:07	नियत कार्य के लिए:
08:09	HIV के 'genomic' सीक्वेंस से 4587 से 5165 स्थानों तक जीन 'HIV1gp3' को एक्सट्रैक्ट करें।
08:21	फाइल 'HIV.gb' इस ट्यूटोरियल के कोड फाइल्स में शामिल की गयी है।
08:28	आपका पूर्ण नियत कार्य निम्न कोड रखेगा।
08:43	निम्न लिंक पर उपलब्ध वीडियो स्पोकन ट्यूटोरियल प्रॉजेक्ट को सारांशित करता है।
08:48	कृपया इसे डाउनलोड करके देखें।
08:49	स्पोकन ट्यूटोरियल प्रॉजेक्ट टीम कार्यशालाएं चलाती है और ऑनलाइन टेस्ट पास करने वालों को प्रमाणपत्र देती है।
08:57	अधिक जानकारी के लिए कृपया हमें लिखें।
09:00	स्पोकन ट्यूटोरियल प्रॉजेक्ट भारत सरकार के MHRD के NMEICT द्वारा निधिबद्ध है।
09:06	इस मिशन पर अधिक जानकारी इस लिंक पर उपलब्ध है।
09:10	आई आई टी बॉम्बे से मैं श्रुति आर्य आपसे विदा लेती हूँ। हमसे जुड़ने के लिए धन्यवाद।

Contributors and Content Editors

Shruti arya

Biopython/C2/Writing-Sequence-Files/Hindi

Contributors and Content Editors

Navigation menu

Personal tools

Namespaces

Variants

Views

Actions

Search

Navigation

Tools