Biopython/C2/Writing-Sequence-Files/Marathi

From Script | Spoken-Tutorial
Revision as of 13:06, 10 January 2017 by Ranjana (Talk | contribs)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to: navigation, search
Time
Narration
00:01 नमस्कार.
00:02 Writing Sequence Files वरील ट्यूटोरियल मध्ये आपले स्वागत.
00:07 ह्या ट्यूटोरियल मध्ये, आपण शिकणार आहोत: Sequence Record Objects कसे तयार करणे.
00:13 * सीक्वेन्स फाइल्स कसे लिहीणे
00:15 * file formats दरम्यान कसे रुपांतर करणे
00:19 * आणि, लांबी द्वारे फाइल मध्ये रेकॉर्ड्स कसे सॉर्ट करणे.
00:23 ह्या ट्यूटोरियलचे अनुसरण करण्यासाठी तुम्हाला
00:27 अंडर ग्रॅज्युएट बायोकेमिस्ट्री किंवा बायोइन्फर्मेटिक्स आणि मूलभूत Python प्रोग्रँमिंग माहीत असले पाहिजे.
00:34 दिलेल्या लिंक वरील Python ट्यूटोरियल्स पहा.
00:38 हा ट्यूटोरियल रेकॉर्ड करण्यासाठी, मी Ubuntu OS वर्जन 14.10
00:45 * Python वर्जन 2.7.8
00:48 * Ipython interpreter वर्जन 2.3.0 आणि Biopython वर्जन 1.64.
00:55 आपण पुर्वी फाइलचे कॉंटेंट्स वाचण्यास पार्स आणि रीड फंक्शन्स बद्दल शिकलो आहोत.
01:03 ह्या ट्यूटोरियल मध्ये, आपण फाइल मध्ये सीक्वेन्सेस लिहिण्यास write फंक्शन कसे वापरावे हे शिकू.
01:09 आणि, विविध file formats दरम्यान इंटर-कन्व्हरशन साठी Convert फंक्शन वापरु.
01:16 आता मी write फंक्शन कसे वापरावे हे दाखवते.
01:20 येथे एक प्रोटीन सीक्वेन्स सह टेक्स्ट फाइल आहे.
01:24 येथे insulin protein सीक्वेन्स दर्शविले आहे.
01:28 तसेच फाइल कडे GI accession number आणि description म्हणून माहिती आहे.
01:36 आता आपण FASTA फॉर्मॅट मध्ये ह्या सीक्वेन्स साठी एक फाइल तयार करूया.
01:41 प्रथम स्टेप sequence record object तयार करण्याची आहे.
01:45 सीक्वेन्स रेकॉर्ड ऑब्जेक्ट्स बद्दल अधिक माहिती:
01:49 हे sequence input/output interface साठी मूलभूत डेटा टाइप आहे.
01:55 सीक्वेन्स रेकॉर्ड ऑब्जेक्ट मध्ये, एक सीक्वेन्स उच्च पातळीच्या वैशिष्ट्यांशी संबंधित आहे जसे की identifiers आणि descriptions .
02:04 Ctrl, Alt आणि t किज दाबून टर्मिनल उघडा.
02:10 प्रॉंप्ट वर टाइप करा: ipython, एंटर दाबा.
02:15 प्रॉंप्ट वर खालील ओळी टाइप करा:
02:18 from Bio dot Seq module import Seq class.
02:24 from Bio dot SeqRecord module import Sequence Record class
02:31 पुढे, from Bio dot Alphabet module import generic protein class.
02:38 पुढे, मी record1 वेरियबल मध्ये सीक्वेन्स रेकॉर्ड ऑब्जेक्ट सेव्ह करेल.
02:45 टेक्स्ट फाइल मधून sequence, id आणि description कॉपी करून टर्मिनल वर संबंधित ओळींमध्ये त्यांना पेस्ट करा.
02:56 एंटर दाबा.
02:58 आउटपुट पाहण्यासाठी टाइप करा: record1.
03:02 एंटर दाबा.
03:04 आउटपुट, sequence record ऑब्जेक्ट म्हणून insulin protein सीक्वेन्सला दाखवते.
03:10 ते id आणि description सह सीक्वेन्सला दाखवते.
03:13 आपण FASTA फाइल मध्ये वरील सीक्वेन्स रेकॉर्ड ऑब्जेक्ट रुपांतरित करण्यासाठी write फंक्शन वापरुया.
03:21 Bio पॅकेज मधून SeqIO module इम्पोर्ट करू.
03:26 पुढे, FASTA फाइल मध्ये सीक्वेन्स ऑब्जेक्टला रुपांतरित करण्यासाठी write फंक्शन सह कमांड लाइन टाइप करा.
03:40 write फंक्शन, 3 arguments घेते.
03:44 प्रथम वेरियबल जे sequence record object ला संचित करते.
03:49 दुसरा FASTA फाइल लिहिण्यासाठी फाइलचे नाव आहे.
03:54 तिसरा फाइल फॉर्मॅट लिहिण्यासाठी आहे. एंटर दाबा.
03:58 आउटपुट दाखवते की, आपण FASTA फाइल मध्ये एक sequence record object ला रुपांतरित केले आहे.
04:07 FASTA फॉर्मॅट मधील फाइल, "example.fasta" म्हणून होम फोल्डर मध्ये सेव्ह केलेली आहे.
04:13 मी तुम्हाला सल्ला देते,
04:14 आउटपुट, त्याच नावाच्या कोणत्याही पूर्वीच्या अस्तित्वातील फाइलला ओवर-राइट करेल.
04:18 फाइल पाहण्यासाठी, home फोल्डर मध्ये फाइलला नॅविगेट करा.
04:24 ही फाइल 'टेक्स्ट एडिटर' मध्ये उघडा.
04:27 प्रोटीन सीक्वेन्स, आता FASTA फॉर्मॅट मध्ये आहे.
04:31 'टेक्स्ट एडिटर' बंद करा.
04:33 अनेक bioinformatics टूल्स विविध इनपुट फाइल फॉरमॅट्स घेतात.
04:38 त्यामुळे, कधी कधी सीक्वेन्स फाइल फॉरमॅट्स यांमधील रुपांतरित करण्याची गरज आहे.
04:44 आपण SeqIO module मध्ये convert फंक्शन वापरुन फाइल्सना रुपांतर करू शकतो.
04:50 प्रात्यक्षिकेसाठी, मी FASTA फाइल मध्ये GenBank फाइलला रुपांतर करेल.
04:55 माझ्या होम फोल्डर मध्ये GenBank फाइल आहे.
04:59 मी हे टेक्स्ट एडिटर मध्ये उघडते.
05:02 GenBank फॉर्मॅट फाइल मध्ये HIV genome चा समावेश आहे.
05:07 ह्या GenBank फाइलच्या पहिल्या भागात, genome मधील सर्व genes चे वर्णन केले आहेत.
05:14 हे पूर्णपणे genome सीक्वेन्स द्वारे अनुसरले आहे.
05:18 टेक्स्ट एडिटर बंद करा.
05:19 टर्मिनल वर खालील ओळी टाइप करा.
05:23 येथे एक convert फंक्शन आहे जे GenBank फाइल मधील उपस्थित genome सीक्वेन्सला पूर्णपणे FASTA फाइल मध्ये रुपांतरित करतो. एंटर दाबा.
05:33 FASTA फॉर्मॅट मधील नवीन फाइल, 'होम' फोल्डर मध्ये HIV.fasta म्हणून सेव्ह केले आहे.
05:39 फाइलला नॅविगेट करून टेक्स्ट एडिटर मध्ये उघडा.
05:46 टेक्स्ट एडिटर बंद करा.
05:49 जरी हे खरे असेल, तर आपण सहज convert फंक्शन वापरुन फाइल फॉरमॅट्स रूपांतरित करू शकतो, त्यांना काही मर्यादा आहेत.
05:56 काही फॉरमॅट्स लिहितांना माहिती आवश्यक आहे, जे इतर फाइल फॉरमॅट्स मध्ये नसते.
06:02 उदाहरणार्थ: आपण FASTA फाइल मध्ये GenBank फाइलला रुपांतर करू शकतो, आपण ते उलट करू शकत नाही.
06:09 त्याचप्रमाणे, आपण FASTA फाइल मध्ये FASTQ फाइल चालू करू शकतो, पण उलट करू शकत नाही.
06:15 convert फंक्शन विषयी अधिक माहितीसाठी, help कमांड टाइप करा.
06:21 एंटर दाबा.
06:24 प्रॉंप्ट वर परत जाण्यासाठी कीबोर्ड वरील 'q' बटन दाबा.
06:28 आपण GenBank फॉर्मॅट मधील HIV genome मधून प्रत्येक genes देखील एक्सट्रॅक्ट करू शकतो.
06:35 हे प्रत्येक genes, FASTA किंवा कोणत्याही इतर फॉरमॅट्स मध्ये सेव्ह केले जाऊ शकतात.
06:41 ह्या साठी, प्रॉंप्ट वर खालील कोड टाइप करा.
06:47 हा कोड, सर्व CDS जीन सीक्वेन्ससना, त्यांचे ids आणि gene चे नाव एका फाइल मध्ये लिहेल.
06:56 तुमच्या होम फोल्डर मध्ये, फाइल “HIV_geneseq.fasta” म्हणून सेव्ह केले आहे. एंटर दाबा.
07:07 Biopython टूल्स वापरुन, आपण लांबी द्वारे फाइल मधील रेकॉर्ड्स सॉर्ट करू शकतो.
07:12 येथे, मी FASTA file “hemoglobin.fasta” उघडले आहे ज्यात सहा रेकॉर्ड्स आहेत.
07:19 प्रत्येक रेकॉर्ड भिन्न लांबीचे आहे.
07:23 प्रथम सर्वात मोठ्या रेकॉर्डची व्यवस्था करण्यासाठी खालील ओळी टाइप करा.
07:27 सॉर्ट केलेल्या सीक्वेन्सेस सह नवीन फाइल तुमच्या होम फोल्डर मध्ये "sorted_hemoglobin.fasta" म्हणून सेव्ह होईल.
07:38 प्रथम लहान रेकॉर्ड्स साठी, records.sort कमांड लाइन मध्ये आर्ग्युमेंट्स रिवर्स करा.
07:45 थोडक्यात.
07:46 ह्या ट्यूटोरियल मध्ये, आपण सीक्वेन्स रेकॉर्ड ऑब्जेक्ट्स तयार करणे शिकलो.
07:51 * Sequence Input/Output मॉड्यूलचे write फंक्शन वापरुन सीक्वेन्स फाइल्स लिहीणे.
07:58 * convert फंक्शन वापरुन, sequence file formats दरम्यान रुपांतर करणे.
08:03 * आणि, लांबी द्वारे फाइल मधील रेकॉर्ड्स सॉर्ट करणे.
08:07 असाइनमेंट साठी:
08:09 HIV चे genomic सीक्वेन्स मधून 4587 ते 5165 स्थिती वर जीन "HIV1gp3" एक्सट्रॅक्ट करा.
08:21 ह्या ट्यूटोरियलचे कोड फाइल्स मध्ये “HIV.gb” फाइल समाविष्ट आहे.
08:28 तुमच्या पूर्ण झालेल्या असाइनमेंट मध्ये खालील कोड असले पाहिजे.
08:43 स्क्रीनवर दिसणार्‍या लिंकवर उपलब्ध असलेल्या व्हिडिओमधे तुम्हाला प्रॉजेक्टचा सारांश मिळेल.
08:48 कृपया डाउनलोड करून पहा.
08:49 स्पोकन ट्युटोरियल प्रॉजेक्ट टीम, कार्यशाळा चालविते, परीक्षा उत्तीर्ण होणा-या विद्यार्थ्यांना प्रमाणपत्रही देते.
08:57 अधिक माहितीसाठी, आम्हाला लिहा.
09:00 स्पोकन ट्युटोरियल प्रॉजेक्टला अर्थसहाय्य NMEICT, MHRD, Govt of India ने दिले आहे.
09:06 यासंबंधी माहिती पुढील साईटवर उपलब्ध आहे.
09:10 मी रंजना भांबळे आपला निरोप घेते. सहभागासाठी धन्यवाद.

Contributors and Content Editors

PoojaMoolya, Ranjana