Biopython/C2/Writing-Sequence-Files/Marathi
From Script | Spoken-Tutorial
Time | Narration |
00:01 | नमस्कार,Writing Sequence Files वरील ट्यूटोरियल मध्ये आपले स्वागत. |
00:07 | ह्या ट्यूटोरियल मध्ये, आपण शिकणार आहोत: Sequence Record Objects कसे तयार करणे. |
00:13 | सीक्वेन्स फाइल्स कसे लिहीणे |
00:15 | file formats दरम्यान कसे रुपांतर करणे |
00:19 | आणि, लांबी द्वारे फाइल मध्ये रेकॉर्ड्स कसे सॉर्ट करणे. |
00:23 | ह्या ट्यूटोरियलचे अनुसरण करण्यासाठी तुम्हाला |
00:27 | अंडर ग्रॅज्युएट बायोकेमिस्ट्री किंवा बायोइन्फर्मेटिक्स आणि मूलभूत Python प्रोग्रँमिंग माहीत असले पाहिजे. |
00:34 | दिलेल्या लिंक वरील Python ट्यूटोरियल्स पहा. |
00:38 | हा ट्यूटोरियल रेकॉर्ड करण्यासाठी, मी Ubuntu OS वर्जन 14.10 |
00:45 | Python वर्जन 2.7.8 |
00:48 | Ipython interpreter वर्जन 2.3.0 आणि Biopython वर्जन 1.64. |
00:55 | आपण पुर्वी फाइलचे कॉंटेंट्स वाचण्यास पार्स आणि रीड फंक्शन्स बद्दल शिकलो आहोत. |
01:03 | ह्या ट्यूटोरियल मध्ये, आपण फाइल मध्ये सीक्वेन्सेस लिहिण्यास write फंक्शन कसे वापरावे हे शिकू. |
01:09 | आणि, विविध file formats दरम्यान इंटर-कन्व्हरशन साठी Convert फंक्शन वापरु. |
01:16 | आता मी write फंक्शन कसे वापरावे हे दाखवते. |
01:20 | येथे एक प्रोटीन सीक्वेन्स सह टेक्स्ट फाइल आहे. |
01:24 | येथे insulin protein सीक्वेन्स दर्शविले आहे. |
01:28 | तसेच फाइल कडे GI accession number आणि description म्हणून माहिती आहे. |
01:36 | आता आपण FASTA फॉर्मॅट मध्ये ह्या सीक्वेन्स साठी एक फाइल तयार करूया. |
01:41 | प्रथम स्टेप sequence record object तयार करण्याची आहे. |
01:45 | सीक्वेन्स रेकॉर्ड ऑब्जेक्ट्स बद्दल अधिक माहिती: |
01:49 | हे sequence input/output interface साठी मूलभूत डेटा टाइप आहे. |
01:55 | सीक्वेन्स रेकॉर्ड ऑब्जेक्ट मध्ये, एक सीक्वेन्स उच्च पातळीच्या वैशिष्ट्यांशी संबंधित आहे जसे की identifiers आणि descriptions . |
02:04 | Ctrl, Alt आणि t किज दाबून टर्मिनल उघडा. |
02:10 | प्रॉंप्ट वर टाइप करा: ipython, एंटर दाबा. |
02:15 | प्रॉंप्ट वर खालील ओळी टाइप करा: |
02:18 | from Bio dot Seq module import Seq class. |
02:24 | from Bio dot SeqRecord module import Sequence Record class |
02:31 | पुढे, from Bio dot Alphabet module import generic protein class. |
02:38 | पुढे, मी record1 वेरियबल मध्ये सीक्वेन्स रेकॉर्ड ऑब्जेक्ट सेव्ह करेल. |
02:45 | टेक्स्ट फाइल मधून sequence, id आणि description कॉपी करून टर्मिनल वर संबंधित ओळींमध्ये त्यांना पेस्ट करा. |
02:56 | एंटर दाबा. |
02:58 | आउटपुट पाहण्यासाठी टाइप करा: record1. |
03:02 | एंटर दाबा. |
03:04 | आउटपुट, sequence record ऑब्जेक्ट म्हणून insulin protein सीक्वेन्सला दाखवते. |
03:10 | ते id आणि description सह सीक्वेन्सला दाखवते. |
03:13 | आपण FASTA फाइल मध्ये वरील सीक्वेन्स रेकॉर्ड ऑब्जेक्ट रुपांतरित करण्यासाठी write फंक्शन वापरुया. |
03:21 | Bio पॅकेज मधून SeqIO module इम्पोर्ट करू. |
03:26 | पुढे, FASTA फाइल मध्ये सीक्वेन्स ऑब्जेक्टला रुपांतरित करण्यासाठी write फंक्शन सह कमांड लाइन टाइप करा. |
03:40 | write फंक्शन, 3 arguments घेते. |
03:44 | प्रथम वेरियबल जे sequence record object ला संचित करते. |
03:49 | दुसरा FASTA फाइल लिहिण्यासाठी फाइलचे नाव आहे. |
03:54 | तिसरा फाइल फॉर्मॅट लिहिण्यासाठी आहे. एंटर दाबा. |
03:58 | आउटपुट दाखवते की, आपण FASTA फाइल मध्ये एक sequence record object ला रुपांतरित केले आहे. |
04:07 | FASTA फॉर्मॅट मधील फाइल, "example.fasta" म्हणून होम फोल्डर मध्ये सेव्ह केलेली आहे. |
04:13 | मी तुम्हाला सल्ला देते,आउटपुट, त्याच नावाच्या कोणत्याही पूर्वीच्या अस्तित्वातील फाइलला ओवर-राइट करेल. |
04:18 | फाइल पाहण्यासाठी, home फोल्डर मध्ये फाइलला नॅविगेट करा. |
04:24 | ही फाइल 'टेक्स्ट एडिटर' मध्ये उघडा. |
04:27 | प्रोटीन सीक्वेन्स, आता FASTA फॉर्मॅट मध्ये आहे. |
04:31 | 'टेक्स्ट एडिटर' बंद करा. |
04:33 | अनेक bioinformatics टूल्स विविध इनपुट फाइल फॉरमॅट्स घेतात. |
04:38 | त्यामुळे, कधी कधी सीक्वेन्स फाइल फॉरमॅट्स यांमधील रुपांतरित करण्याची गरज आहे. |
04:44 | आपण SeqIO module मध्ये convert फंक्शन वापरुन फाइल्सना रुपांतर करू शकतो. |
04:50 | प्रात्यक्षिकेसाठी, मी FASTA फाइल मध्ये GenBank फाइलला रुपांतर करेल. |
04:55 | माझ्या होम फोल्डर मध्ये GenBank फाइल आहे. |
04:59 | मी हे टेक्स्ट एडिटर मध्ये उघडते. |
05:02 | GenBank फॉर्मॅट फाइल मध्ये HIV genome चा समावेश आहे. |
05:07 | ह्या GenBank फाइलच्या पहिल्या भागात, genome मधील सर्व genes चे वर्णन केले आहेत. |
05:14 | हे पूर्णपणे genome सीक्वेन्स द्वारे अनुसरले आहे. |
05:18 | टेक्स्ट एडिटर बंद करा,टर्मिनल वर खालील ओळी टाइप करा. |
05:23 | येथे एक convert फंक्शन आहे जे GenBank फाइल मधील उपस्थित genome सीक्वेन्सला पूर्णपणे FASTA फाइल मध्ये रुपांतरित करतो. एंटर दाबा. |
05:33 | FASTA फॉर्मॅट मधील नवीन फाइल, 'होम' फोल्डर मध्ये HIV.fasta म्हणून सेव्ह केले आहे. |
05:39 | फाइलला नॅविगेट करून टेक्स्ट एडिटर मध्ये उघडा. |
05:46 | टेक्स्ट एडिटर बंद करा. |
05:49 | जरी हे खरे असेल, तर आपण सहज convert फंक्शन वापरुन फाइल फॉरमॅट्स रूपांतरित करू शकतो, त्यांना काही मर्यादा आहेत. |
05:56 | काही फॉरमॅट्स लिहितांना माहिती आवश्यक आहे, जे इतर फाइल फॉरमॅट्स मध्ये नसते. |
06:02 | उदाहरणार्थ: आपण FASTA फाइल मध्ये GenBank फाइलला रुपांतर करू शकतो, आपण ते उलट करू शकत नाही. |
06:09 | त्याचप्रमाणे, आपण FASTA फाइल मध्ये FASTQ फाइल चालू करू शकतो, पण उलट करू शकत नाही. |
06:15 | convert फंक्शन विषयी अधिक माहितीसाठी, help कमांड टाइप करा. |
06:21 | एंटर दाबा. |
06:24 | प्रॉंप्ट वर परत जाण्यासाठी कीबोर्ड वरील 'q' बटन दाबा. |
06:28 | आपण GenBank फॉर्मॅट मधील HIV genome मधून प्रत्येक genes देखील एक्सट्रॅक्ट करू शकतो. |
06:35 | हे प्रत्येक genes, FASTA किंवा कोणत्याही इतर फॉरमॅट्स मध्ये सेव्ह केले जाऊ शकतात. |
06:41 | ह्या साठी, प्रॉंप्ट वर खालील कोड टाइप करा. |
06:47 | हा कोड, सर्व CDS जीन सीक्वेन्ससना, त्यांचे ids आणि gene चे नाव एका फाइल मध्ये लिहेल. |
06:56 | तुमच्या होम फोल्डर मध्ये, फाइल “HIV_geneseq.fasta” म्हणून सेव्ह केले आहे. एंटर दाबा. |
07:07 | Biopython टूल्स वापरुन, आपण लांबी द्वारे फाइल मधील रेकॉर्ड्स सॉर्ट करू शकतो. |
07:12 | येथे, मी FASTA file “hemoglobin.fasta” उघडले आहे ज्यात सहा रेकॉर्ड्स आहेत. |
07:19 | प्रत्येक रेकॉर्ड भिन्न लांबीचे आहे. |
07:23 | प्रथम सर्वात मोठ्या रेकॉर्डची व्यवस्था करण्यासाठी खालील ओळी टाइप करा. |
07:27 | सॉर्ट केलेल्या सीक्वेन्सेस सह नवीन फाइल तुमच्या होम फोल्डर मध्ये "sorted_hemoglobin.fasta" म्हणून सेव्ह होईल. |
07:38 | प्रथम लहान रेकॉर्ड्स साठी, records.sort कमांड लाइन मध्ये आर्ग्युमेंट्स रिवर्स करा. |
07:45 | थोडक्यात,ह्या ट्यूटोरियल मध्ये, आपण सीक्वेन्स रेकॉर्ड ऑब्जेक्ट्स तयार करणे शिकलो. |
07:51 | Sequence Input/Output मॉड्यूलचे write फंक्शन वापरुन सीक्वेन्स फाइल्स लिहीणे. |
07:58 | convert फंक्शन वापरुन, sequence file formats दरम्यान रुपांतर करणे. |
08:03 | आणि, लांबी द्वारे फाइल मधील रेकॉर्ड्स सॉर्ट करणे. |
08:07 | असाइनमेंट साठी: |
08:09 | HIV चे genomic सीक्वेन्स मधून 4587 ते 5165 स्थिती वर जीन "HIV1gp3" एक्सट्रॅक्ट करा. |
08:21 | ह्या ट्यूटोरियलचे कोड फाइल्स मध्ये “HIV.gb” फाइल समाविष्ट आहे. |
08:28 | तुमच्या पूर्ण झालेल्या असाइनमेंट मध्ये खालील कोड असले पाहिजे. |
08:43 | स्क्रीनवर दिसणार्या लिंकवर उपलब्ध असलेल्या व्हिडिओमधे तुम्हाला प्रॉजेक्टचा सारांश मिळेल. |
08:48 | कृपया डाउनलोड करून पहा,स्पोकन ट्युटोरियल प्रॉजेक्ट टीम, कार्यशाळा चालविते, परीक्षा उत्तीर्ण होणा-या विद्यार्थ्यांना प्रमाणपत्रही देते. |
08:57 | अधिक माहितीसाठी, आम्हाला लिहा. |
09:00 | स्पोकन ट्युटोरियल प्रॉजेक्टला अर्थसहाय्य NMEICT, MHRD, Govt of India ने दिले आहे. |
09:06 | यासंबंधी माहिती पुढील साईटवर उपलब्ध आहे. |
09:10 | मी रंजना भांबळे आपला निरोप घेते. सहभागासाठी धन्यवाद. |