Biopython/C2/Parsing-Data/Sanskrit

From Script | Spoken-Tutorial
Jump to: navigation, search
Time Narration
00:01 सर्वेभ्योऽपि नमस्कारः । Parsing Data इत्याख्ये अनुशिक्षणे भवतां स्वागतम् ।
00:06 अस्मिन् अनुशिक्षणे वयं NCBI डाटाबेस्-जालपुटतः FASTA तथा GenBank सञ्चिकाः डौन्लोड्-करणं पठिष्यामः ।
00:14 तथैव सिक्वेनस् इन्पुट्-औट्पुट् मोड्यूल्-मध्ये विद्यमानफङ्क्षन्स् उपयुज्य, डेटा सञ्चिकाः पार्स् कर्तुं पठिष्यामः ।
00:19 एतत् अनुशिक्षणम् अवगन्तुम् , भवतां पदविपूर्वजीवरसायनशास्त्रम् अथवा बयोइन्फर्मेटिक्स्
00:26 तथा च बेसिक् पैथान् प्रोग्रामिङ्ग् इत्येतेषां ज्ञानं भवेत् ।
00:30 पर्चन्यां दत्तं पैथान् अनुशिक्षणं पश्यन्तु ।
00:34 एतत् अनुशिक्षणं रेकार्ड् कर्तुम् अहं Ubuntu OS इत्यस्य 14.10 आवृत्तेः
00:40 python इत्यस्य 2.7. 8 आवृत्तेः
00:44 I python interpreter इत्यस्य 2.3.0 आवृत्तेः
00:48 Bio python इत्यस्य 1.64 आवृत्तेः तथा च Mozilla Firefoxब्रौसर् इत्यस्य 35.0 आवृत्तेः च उपयोगं कृतवान् अस्मि ।
00:56 जीवशास्त्रीय वैज्ञानिकदत्तांशान् सामान्यतया FASTA, GenBank, EMBL, Swiss-Prot इत्यादिषु टेक्स्ट् सञ्चिकासु सङ्गृह्यते ।
01:07 डेटासञ्चिकाः डेटाबेस् जालपुटेभ्यः डौन्लोड् कर्तुं शक्यते ।
01:12 यस्मिन् कस्मिन्नपि वेब् ब्रौसर् मध्ये, अधोनिर्दिष्ट-जालपुटस्य पर्चनीम् उद्घाटयन्तु ।
01:17 किञ्चन वेब्-पेज् उद्घाटितं भवति ।
01:19 वयं मानवस्य इन्सुलिन् जीन् निमित्तं FASTA तथा GenBank सञ्चिकाः डौन्लोड् कुर्मः ।
01:25 search box मध्ये “human insulin” इति टङ्कनं कृत्वा “search” इति क्लिक् कुर्वन्तु । ।
01:31 मानवस्य इन्सुलिन् जीन् निमित्तं वेब्-पेज्, बह्व्यः सञ्चिकाः प्रदर्शयति ।
01:35 अत्र विवरणार्थम् अहं Homo sapiens Insulin mRNA इत्याख्याः 4(चतस्रः) सञ्चिकाः चिनोमि ।
01:43 500 बेस् पेर् अपेक्षया न्यूनतमाः सञ्चिकाः अहं चिनोमि ।
01:48 डौन्लोड् कर्तुं सञ्चिकां चेतुं, चेक् बाक्स् उपरि क्लिक् कुर्वन्तु ।
01:56 पेज् उपरि दक्षिणकोणस्थं Send to इति विकल्पस्य समीपे कर्सर् आनयन्तु ।
02:02 Send to बटन् पार्श्वस्थम् डौन्लोड् इति लघ्वीं सेलेक्षन् बटन् क्लिक् कुर्वन्तु ।
02:09 Choose destination इति शीर्षिकायाः अधः विद्यमानं File इति विकल्पं क्लिक् कुर्वन्तु ।
02:13 Format इति ड्राप्-डौन्-लिस्ट्-बाक्स्-मध्ये विद्यमाने कस्मिंश्चिदपि file फार्मेट् मध्ये, भवन्तः एतां सञ्चिकां सेव् कर्तुं शक्नुवन्ति ।
02:21 प्रदत्तविकल्पेषु FASTA चिन्वन्तु ।
02:25 पश्चात् Create file विकल्पं नुदन्तु ।
02:29 स्क्रीन् उपरि किञ्चन डैलाग् बाक्स् दृश्यते ।
02:32 Open with इति विकल्पं चित्वा, OK इति क्लिक् कुर्वन्तु ।
02:36 टेक्स्ट् एडिटर् मध्ये काचित् सञ्चिका उद्घाटिता भवति ।
02:39 अस्माभिः चतस्रः सञ्चिकाः डौन्-लोड् कर्तुं चयनं कृतं, अतः एषा सञ्चिका चतुरः रेकार्ड्स् प्रदर्शयति ।
02:46 प्रत्येकस्मिन् रेकार्ड् मध्ये प्रथमा पङ्क्तिः, ऐडेण्टिफयर् लैन् भवति ।
02:50 एतत्सा greater than (>) चिह्नात् आरभ्यते ।
02:53 तदनन्तरं sequence भविष्यति ।
02:56 सञ्चिकां भवतां home फोल्डर् मध्ये sequence.fasta इति सेव् कुर्वन्तु ।
03:01 टेक्स्ट् एडिटर् पिधानं कुर्वन्तु ।
03:03 आदौ चिताः सञ्चिकाः GenBank फार्मेट् मध्ये डौन्लोड्-कर्तुं उपरि दर्शितानि सोपानानि एव अनुसरन्तु ।
03:12 file format इत्येतं GenBank इति चिन्वन्तु ।
03:16 एकां सञ्चिकां create कृत्वा टेक्स्ट् एडिटर् मध्ये open कुर्वन्तु ।
03:21 GenBankफार्माट् मध्यस्थं सिक्वेन्स् सञ्चिकायाम्, FASTAसञ्चिकापेक्षया अधिकानि वैशिष्ट्यानि परिशीलयन्तु ।
03:27 इमां सञ्चिकां भवतां home फोल्डर् मध्ये, sequence.gb इति सेव् कुर्वन्तु । टेक्स्ट् एडिटर् close कुर्वन्तु ।
03:34 अत्र विवरणार्थम् , अस्मभ्यम् एक-रेकार्ड्-युक्तायाः FASTA सञ्चिकायाः आवश्यकता अस्ति ।
03:39 एतदर्थं चेक् बाक्स्स् उपरि पुनः क्लिक् कृत्वा, आदौ कृतं चयनं क्लियर् कुर्वन्तु ।
03:48 अधुना Human insulin gene complete cds इति सञ्चिकां चिन्वन्तु ।
03:54 चेक् बाक्स् उपरि क्लिक्-कुर्वन्तु ।
03:57 तथा च सञ्चिकां homeफोल्डर् मध्ये सेव् कर्तुम् , आदौ प्रदर्शितानि सोपानानि अनुसरन्तु ।
04:01 सञ्चिकां insulin.fasta इति सेव् कुर्वन्तु ।
04:08 Biopython library उपयुज्य , अस्यां सञ्चिकायां सङ्गृहीतान् biological डेटा पुनःप्राप्तुं परिवर्तयितुं च शक्यते ।
04:16 टेक्स्ट् एडिटर् close कुर्वन्तु ।
04:19 डेटा सञ्चिकाभ्यः डेटा स्वीकरणं parsing इति उच्यते ।
04:23 SeqIO माड्यूल्-मध्ये उपलभ्यमानानि फङ्क्षन्स् उपयुज्य, अधिकानि file फार्मेट्स् पार्स् कर्तुं शक्नुमः ।
04:30 सामन्यतया उपयुज्यमानानि SeqIO माड्यूल् फङ्क्षन्स् एवं वर्तन्ते : parse, read, write तथा convert
04:38 Ctrl, Alt तथा T बटन्स् युगपत् नोदनद्वारा टर्मिनल् उद्घाटयन्तु ।
04:44 प्राम्प्ट्मध्ये “iपैथान्” इति टैप्-करणद्वारा iपैथान् आरभ्यताम् । Enter की नुदन्तु ।
04:51 अनन्तरं Bio प्याकेज् तः SeqIO माड्यूल् इम्पोर्ट् कुर्वन्तु ।
04:56 Prompt मध्ये “from Bio import SeqIO” इति टङ्कनं कृत्वा Enter की नुदन्तु ।
05:04 वयं बहुमुख्यतः parse फङ्क्षन्-तः प्रारम्भं कुर्मः ।
05:07 अत्र विवरणार्थं डेटाबेस्-तः पूर्वं डौन्लोड् कृतं , कांश्चन रेकार्ड्स्-युक्तानि FASTA सञ्चिकाः अहम् उपयोगं करोमि ।
05:17 सरल FASTA पार्सिङ्ग् निमित्तम् अधोनिर्दिष्टानि प्राम्पट् मध्ये टङ्कयन्तु ।
05:22 अत्र वयं sequence.fasta सञ्चिकास्थं पठितुं parse फङ्क्षन् उपयोगं कुर्मः।
05:30 औट्पुट् निमित्तं रेकार्ड् id, रेकार्ड्-मध्ये स्थितं सीक्वेन्स् तथा सीक्वेन्स्-दैर्घ्यं प्रिण्ट् कुर्वन्तु ।
05:41 तथैव सिक्वेन्स् दत्तांशं सिक्वेनस् रेकार्ड् आब्जेक्ट्स् इव रीड् कर्तुं parseफङ्क्षन् उपयुज्यते इति अवधार्यताम्।
05:48 सामान्यतः एतत् forलूप् इत्यनेन सह उपयुज्यते ।
05:52 एतत् 2 आर्ग्युमेण्ट्स् स्वीकर्तुं शक्यते । प्रथमं, दत्तांशं पठितुम् अपेक्षितं फैल् नाम ।
05:59 द्वितीयं, सञ्चिका फार्मेट् सूचयति ।
06:02 औट्पुट् प्राप्तुं , Enter की द्विवारं नुदन्तु ।
06:07 औट्पुट्, ऐडेण्टिफयर् लैन् , सञ्चिकायां विद्यमानं सीक्वेन्स् तथा च सञ्चिकायां विद्यमानानाम् सर्वेषां रेकार्ड्सीक्वेन्स् इत्येतेषां दैर्घ्यं प्रदर्शयति ।
06:21 FASTA फार्मेट् , अल्फाबेट्स् न सूचयति इति अवधारयन्तु ।
06:26 अतः, औट्पुट्, एतत् DNA सीक्वेनस् इति न सूचयति ।
06:31 GenBank सञ्चिकां पार्स् कर्तुम्, एतानि सोपानानि एव पुनरावर्तयितुं शक्यन्ते ।
06:36 विवरणार्र्थम्, वयम् आदौ डाटाबेस्-तः डौन्-लोड्-कृतायाः GenBank सञ्चिकायाः उपयोगं करिष्यामः ।
06:43 अस्माभिः पूर्वम् उपयुक्तानां कोड् इत्येतेषां पङ्क्तीः प्राप्तुं up-arrow की नुदन्तु ।
06:49 सञ्चिकायाः नाम sequence.gb इति परिवर्तयन्तु ।
06:53 सञ्चिकायाः फार्मेट् genbank प्रति परिवर्तयन्तु ।
06:56 अवशिष्टं कोड् , पूर्ववदेव भवति ।
06:58 औट्पुट् प्राप्तुं Enterकी द्विवारं नुदन्तु ।
07:03 अत्रापि औट्पुट् , रेकार्ड् id, सिक्वेन्स् तथा च सञ्चिकायाः सर्वेषां रेकार्ड् सीक्वेन्स् दैर्घ्यं प्रदर्शयति ।
07:12 GenBank फार्मेट् , सीक्वेन्स् इत्येतत् DNA सीक्वेन्स् सूचयति इति अवधार्यताम् ।
07:19 तथैव, Swiss-prot तथा च EMBL सञ्चिकाः , उपरितनकोड् उपयुज्य पार्स् कर्तुं शक्यते ।
07:27 भवतां सञ्चिका एक-रेकार्ड्-युक्ता चेत् , पार्सिङ्ग् कृते अधस्तनाः पङ्क्तीः टङ्कयन्तु ।
07:34 अत्र, अस्माभिः पूर्वं सेव् कृतम् , एक-रेकार्ड्-युक्तां FASTA सञ्चिकां उपयुञ्ज्महे । उदाहरणार्थम् - insulin.fasta.
07:43 पार्स् फङ्क्षन् परतया, वयं रीड् फङ्क्षन् उपयोगं कृतवन्तः इति अवधानं कुरुत । Enter की नुदन्तु ।
07:50 औट्पुट् , insulin.fastaसञ्चिकायाम् अस्ति इति प्रदर्शयति ।
07:55 एतत् सीक्वेन्स्, सीक्वेन्स् रेकार्ड् आब्जेक्ट् इव,
07:59 तथा च अन्यत् एट्रिब्यूट्स् – GI, accession number, description इत्येतानि प्रदर्शयति ।
08:06 अस्य रेकार्ड् इत्येतस्य प्रत्येकानि गुणलक्षणानि, वयं अधः द्रष्टुं शक्नुमः ।
08:11 Prompt मध्ये एवं टङ्कनं कुर्वन्तु : record dot seq ; अनन्तरं Enter की नुदन्तु ।
08:18 औट्पुट् , सञ्चिकास्थं सीक्वेन्स् प्रदर्शयति ।
08:22 अस्य रेकार्ड् इत्येतस्य ऐडेण्टिफयर्स् द्रष्टुं, एवं टङ्कयन्तु : record dot id अनन्तरं Enter की नुदन्तु ।
08:29 औट्पुट् , GI सङ्ख्यां तथा अक्सेशन् सङ्ख्यादीन् प्रदर्शयति ।
08:34 उपरि व्याख्यातं फङ्क्षन् इत्येतत्, भवतां अपेक्षितां डेटा सञ्चिकां पार्स् कर्तुं उपयोक्तुं शक्यते ।
08:40 सङ्क्षेपेण,
08:42 अस्मिन् अनुशिक्षणे वयं, FASTA सञ्चिकाः, GenBank सञ्चिकाश्च NCBI डेटाबेस् जालपुट-तः डौन्लोड्- करणं तथा SeqIO माड्यूल् पार्सिङ्ग् तथा रीड् फङ्क्षन्स् उपयोगं,
08:55 FASTA तथा GenBankसञ्चिकाभ्यः रेकार्ड् id, विवरणं, सीक्वेन्स् इत्यादिनां डेटा एक्स्ट्राक्ट् करणं च ज्ञातवन्तः ।
09:03 अधुना असैन्मेण्ट् निमित्तं
09:06 NCBI डेटाबेस् तः, भवताम् अपेक्षितं न्यूक्लियोटैड् सीक्वेन्स् निमित्तं, FASTA सञ्चिकाः डौन्लोड् कुर्वन्तु ।
09:13 एतेषां सीक्वेन्स् सञ्चिकां तस्याः रिवर्स् काम्प्लिमेण्ट् प्रति परिवर्तयन्तु ।
09:17 भवतां समाप्तम् असैन्मेण्ट्, अधस्तन-कोड्-युक्तं भवेत् ।
09:22 FASTA सञ्चिका-तः न्यूक्लियोटैड् सीक्वेन्स् लोड् कर्तुं, पार्स् फङ्क्षन् उपयुज्यताम् ।
09:28 अनन्तरं सीक्वेनस् आब्जेक्ट् इत्यस्य रिवर्स् काम्प्लिमेण्ट् इति बिल्ट् इन् मेथड् उपयुज्य, रिवर्स् काम्प्लिमेण्ट्स् प्रिण्ट् कुर्वन्तु ।
09:37 अस्यां पर्चन्यां विद्यमानां विडियो , स्पोकन् ट्युटोरियल् प्राजेक्ट् सूचयति ।
09:42 कृपया एतत् डौन्लोड् कृत्वा पश्यन्तु ।
09:44 स्पोकन् ट्युटोरियल् प्रोजेक्ट् गणः कार्यशालाः चालयति , तथा च आन्लैन् परीक्षायाम् उत्तीर्णेभ्यः प्रमाणपत्राणि ददाति ।
09:51 अधिकविवरणार्थं, कृपया अस्माकं सम्पर्कं कुर्वन्तु ।
09:55 स्पोकन् ट्युटोरियल् प्राजेक्ट् , राष्ट्रियसाक्षरता मिषन्, ICT, MHRD द्वारा भारतसर्वकारस्य आधारं प्राप्तवती वर्तते ।
10:01 अस्याः संस्थायाः विषये अधिकं विवरणम् अत्र पर्चन्याम् उपलभ्यते ।
10:06 अस्य अनुशिक्षणस्य अनुवादकः डा. उदयन हेगडे प्रवाचकश्च नवीन भट्टः उप्पिनपट्टणम् । धन्यवादाः ।

Contributors and Content Editors

NaveenBhat, Sandhya.np14, Udayana