Difference between revisions of "Biopython/C2/Parsing-Data/Sanskrit"
From Script | Spoken-Tutorial
NaveenBhat (Talk | contribs) |
Sandhya.np14 (Talk | contribs) |
||
Line 4: | Line 4: | ||
|- | |- | ||
| 00:01 | | 00:01 | ||
− | | सर्वेभ्योऽपि नमस्कारः । | + | | सर्वेभ्योऽपि नमस्कारः । '''Parsing Data''' इत्याख्ये अनुशिक्षणे भवतां स्वागतम् । |
|- | |- | ||
| 00:06 | | 00:06 |
Latest revision as of 10:36, 9 August 2019
Time | Narration |
00:01 | सर्वेभ्योऽपि नमस्कारः । Parsing Data इत्याख्ये अनुशिक्षणे भवतां स्वागतम् । |
00:06 | अस्मिन् अनुशिक्षणे वयं NCBI डाटाबेस्-जालपुटतः FASTA तथा GenBank सञ्चिकाः डौन्लोड्-करणं पठिष्यामः । |
00:14 | तथैव सिक्वेनस् इन्पुट्-औट्पुट् मोड्यूल्-मध्ये विद्यमानफङ्क्षन्स् उपयुज्य, डेटा सञ्चिकाः पार्स् कर्तुं पठिष्यामः । |
00:19 | एतत् अनुशिक्षणम् अवगन्तुम् , भवतां पदविपूर्वजीवरसायनशास्त्रम् अथवा बयोइन्फर्मेटिक्स् |
00:26 | तथा च बेसिक् पैथान् प्रोग्रामिङ्ग् इत्येतेषां ज्ञानं भवेत् । |
00:30 | पर्चन्यां दत्तं पैथान् अनुशिक्षणं पश्यन्तु । |
00:34 | एतत् अनुशिक्षणं रेकार्ड् कर्तुम् अहं Ubuntu OS इत्यस्य 14.10 आवृत्तेः |
00:40 | python इत्यस्य 2.7. 8 आवृत्तेः |
00:44 | I python interpreter इत्यस्य 2.3.0 आवृत्तेः |
00:48 | Bio python इत्यस्य 1.64 आवृत्तेः तथा च Mozilla Firefoxब्रौसर् इत्यस्य 35.0 आवृत्तेः च उपयोगं कृतवान् अस्मि । |
00:56 | जीवशास्त्रीय वैज्ञानिकदत्तांशान् सामान्यतया FASTA, GenBank, EMBL, Swiss-Prot इत्यादिषु टेक्स्ट् सञ्चिकासु सङ्गृह्यते । |
01:07 | डेटासञ्चिकाः डेटाबेस् जालपुटेभ्यः डौन्लोड् कर्तुं शक्यते । |
01:12 | यस्मिन् कस्मिन्नपि वेब् ब्रौसर् मध्ये, अधोनिर्दिष्ट-जालपुटस्य पर्चनीम् उद्घाटयन्तु । |
01:17 | किञ्चन वेब्-पेज् उद्घाटितं भवति । |
01:19 | वयं मानवस्य इन्सुलिन् जीन् निमित्तं FASTA तथा GenBank सञ्चिकाः डौन्लोड् कुर्मः । |
01:25 | search box मध्ये “human insulin” इति टङ्कनं कृत्वा “search” इति क्लिक् कुर्वन्तु । । |
01:31 | मानवस्य इन्सुलिन् जीन् निमित्तं वेब्-पेज्, बह्व्यः सञ्चिकाः प्रदर्शयति । |
01:35 | अत्र विवरणार्थम् अहं Homo sapiens Insulin mRNA इत्याख्याः 4(चतस्रः) सञ्चिकाः चिनोमि । |
01:43 | 500 बेस् पेर् अपेक्षया न्यूनतमाः सञ्चिकाः अहं चिनोमि । |
01:48 | डौन्लोड् कर्तुं सञ्चिकां चेतुं, चेक् बाक्स् उपरि क्लिक् कुर्वन्तु । |
01:56 | पेज् उपरि दक्षिणकोणस्थं Send to इति विकल्पस्य समीपे कर्सर् आनयन्तु । |
02:02 | Send to बटन् पार्श्वस्थम् डौन्लोड् इति लघ्वीं सेलेक्षन् बटन् क्लिक् कुर्वन्तु । |
02:09 | Choose destination इति शीर्षिकायाः अधः विद्यमानं File इति विकल्पं क्लिक् कुर्वन्तु । |
02:13 | Format इति ड्राप्-डौन्-लिस्ट्-बाक्स्-मध्ये विद्यमाने कस्मिंश्चिदपि file फार्मेट् मध्ये, भवन्तः एतां सञ्चिकां सेव् कर्तुं शक्नुवन्ति । |
02:21 | प्रदत्तविकल्पेषु FASTA चिन्वन्तु । |
02:25 | पश्चात् Create file विकल्पं नुदन्तु । |
02:29 | स्क्रीन् उपरि किञ्चन डैलाग् बाक्स् दृश्यते । |
02:32 | Open with इति विकल्पं चित्वा, OK इति क्लिक् कुर्वन्तु । |
02:36 | टेक्स्ट् एडिटर् मध्ये काचित् सञ्चिका उद्घाटिता भवति । |
02:39 | अस्माभिः चतस्रः सञ्चिकाः डौन्-लोड् कर्तुं चयनं कृतं, अतः एषा सञ्चिका चतुरः रेकार्ड्स् प्रदर्शयति । |
02:46 | प्रत्येकस्मिन् रेकार्ड् मध्ये प्रथमा पङ्क्तिः, ऐडेण्टिफयर् लैन् भवति । |
02:50 | एतत्सा greater than (>) चिह्नात् आरभ्यते । |
02:53 | तदनन्तरं sequence भविष्यति । |
02:56 | सञ्चिकां भवतां home फोल्डर् मध्ये sequence.fasta इति सेव् कुर्वन्तु । |
03:01 | टेक्स्ट् एडिटर् पिधानं कुर्वन्तु । |
03:03 | आदौ चिताः सञ्चिकाः GenBank फार्मेट् मध्ये डौन्लोड्-कर्तुं उपरि दर्शितानि सोपानानि एव अनुसरन्तु । |
03:12 | file format इत्येतं GenBank इति चिन्वन्तु । |
03:16 | एकां सञ्चिकां create कृत्वा टेक्स्ट् एडिटर् मध्ये open कुर्वन्तु । |
03:21 | GenBankफार्माट् मध्यस्थं सिक्वेन्स् सञ्चिकायाम्, FASTAसञ्चिकापेक्षया अधिकानि वैशिष्ट्यानि परिशीलयन्तु । |
03:27 | इमां सञ्चिकां भवतां home फोल्डर् मध्ये, sequence.gb इति सेव् कुर्वन्तु । टेक्स्ट् एडिटर् close कुर्वन्तु । |
03:34 | अत्र विवरणार्थम् , अस्मभ्यम् एक-रेकार्ड्-युक्तायाः FASTA सञ्चिकायाः आवश्यकता अस्ति । |
03:39 | एतदर्थं चेक् बाक्स्स् उपरि पुनः क्लिक् कृत्वा, आदौ कृतं चयनं क्लियर् कुर्वन्तु । |
03:48 | अधुना Human insulin gene complete cds इति सञ्चिकां चिन्वन्तु । |
03:54 | चेक् बाक्स् उपरि क्लिक्-कुर्वन्तु । |
03:57 | तथा च सञ्चिकां homeफोल्डर् मध्ये सेव् कर्तुम् , आदौ प्रदर्शितानि सोपानानि अनुसरन्तु । |
04:01 | सञ्चिकां insulin.fasta इति सेव् कुर्वन्तु । |
04:08 | Biopython library उपयुज्य , अस्यां सञ्चिकायां सङ्गृहीतान् biological डेटा पुनःप्राप्तुं परिवर्तयितुं च शक्यते । |
04:16 | टेक्स्ट् एडिटर् close कुर्वन्तु । |
04:19 | डेटा सञ्चिकाभ्यः डेटा स्वीकरणं parsing इति उच्यते । |
04:23 | SeqIO माड्यूल्-मध्ये उपलभ्यमानानि फङ्क्षन्स् उपयुज्य, अधिकानि file फार्मेट्स् पार्स् कर्तुं शक्नुमः । |
04:30 | सामन्यतया उपयुज्यमानानि SeqIO माड्यूल् फङ्क्षन्स् एवं वर्तन्ते : parse, read, write तथा convert। |
04:38 | Ctrl, Alt तथा T बटन्स् युगपत् नोदनद्वारा टर्मिनल् उद्घाटयन्तु । |
04:44 | प्राम्प्ट्मध्ये “iपैथान्” इति टैप्-करणद्वारा iपैथान् आरभ्यताम् । Enter की नुदन्तु । |
04:51 | अनन्तरं Bio प्याकेज् तः SeqIO माड्यूल् इम्पोर्ट् कुर्वन्तु । |
04:56 | Prompt मध्ये “from Bio import SeqIO” इति टङ्कनं कृत्वा Enter की नुदन्तु । |
05:04 | वयं बहुमुख्यतः parse फङ्क्षन्-तः प्रारम्भं कुर्मः । |
05:07 | अत्र विवरणार्थं डेटाबेस्-तः पूर्वं डौन्लोड् कृतं , कांश्चन रेकार्ड्स्-युक्तानि FASTA सञ्चिकाः अहम् उपयोगं करोमि । |
05:17 | सरल FASTA पार्सिङ्ग् निमित्तम् अधोनिर्दिष्टानि प्राम्पट् मध्ये टङ्कयन्तु । |
05:22 | अत्र वयं sequence.fasta सञ्चिकास्थं पठितुं parse फङ्क्षन् उपयोगं कुर्मः। |
05:30 | औट्पुट् निमित्तं रेकार्ड् id, रेकार्ड्-मध्ये स्थितं सीक्वेन्स् तथा सीक्वेन्स्-दैर्घ्यं प्रिण्ट् कुर्वन्तु । |
05:41 | तथैव सिक्वेन्स् दत्तांशं सिक्वेनस् रेकार्ड् आब्जेक्ट्स् इव रीड् कर्तुं parseफङ्क्षन् उपयुज्यते इति अवधार्यताम्। |
05:48 | सामान्यतः एतत् forलूप् इत्यनेन सह उपयुज्यते । |
05:52 | एतत् 2 आर्ग्युमेण्ट्स् स्वीकर्तुं शक्यते । प्रथमं, दत्तांशं पठितुम् अपेक्षितं फैल् नाम । |
05:59 | द्वितीयं, सञ्चिका फार्मेट् सूचयति । |
06:02 | औट्पुट् प्राप्तुं , Enter की द्विवारं नुदन्तु । |
06:07 | औट्पुट्, ऐडेण्टिफयर् लैन् , सञ्चिकायां विद्यमानं सीक्वेन्स् तथा च सञ्चिकायां विद्यमानानाम् सर्वेषां रेकार्ड्सीक्वेन्स् इत्येतेषां दैर्घ्यं प्रदर्शयति । |
06:21 | FASTA फार्मेट् , अल्फाबेट्स् न सूचयति इति अवधारयन्तु । |
06:26 | अतः, औट्पुट्, एतत् DNA सीक्वेनस् इति न सूचयति । |
06:31 | GenBank सञ्चिकां पार्स् कर्तुम्, एतानि सोपानानि एव पुनरावर्तयितुं शक्यन्ते । |
06:36 | विवरणार्र्थम्, वयम् आदौ डाटाबेस्-तः डौन्-लोड्-कृतायाः GenBank सञ्चिकायाः उपयोगं करिष्यामः । |
06:43 | अस्माभिः पूर्वम् उपयुक्तानां कोड् इत्येतेषां पङ्क्तीः प्राप्तुं up-arrow की नुदन्तु । |
06:49 | सञ्चिकायाः नाम sequence.gb इति परिवर्तयन्तु । |
06:53 | सञ्चिकायाः फार्मेट् genbank प्रति परिवर्तयन्तु । |
06:56 | अवशिष्टं कोड् , पूर्ववदेव भवति । |
06:58 | औट्पुट् प्राप्तुं Enterकी द्विवारं नुदन्तु । |
07:03 | अत्रापि औट्पुट् , रेकार्ड् id, सिक्वेन्स् तथा च सञ्चिकायाः सर्वेषां रेकार्ड् सीक्वेन्स् दैर्घ्यं प्रदर्शयति । |
07:12 | GenBank फार्मेट् , सीक्वेन्स् इत्येतत् DNA सीक्वेन्स् सूचयति इति अवधार्यताम् । |
07:19 | तथैव, Swiss-prot तथा च EMBL सञ्चिकाः , उपरितनकोड् उपयुज्य पार्स् कर्तुं शक्यते । |
07:27 | भवतां सञ्चिका एक-रेकार्ड्-युक्ता चेत् , पार्सिङ्ग् कृते अधस्तनाः पङ्क्तीः टङ्कयन्तु । |
07:34 | अत्र, अस्माभिः पूर्वं सेव् कृतम् , एक-रेकार्ड्-युक्तां FASTA सञ्चिकां उपयुञ्ज्महे । उदाहरणार्थम् - insulin.fasta. |
07:43 | पार्स् फङ्क्षन् परतया, वयं रीड् फङ्क्षन् उपयोगं कृतवन्तः इति अवधानं कुरुत । Enter की नुदन्तु । |
07:50 | औट्पुट् , insulin.fastaसञ्चिकायाम् अस्ति इति प्रदर्शयति । |
07:55 | एतत् सीक्वेन्स्, सीक्वेन्स् रेकार्ड् आब्जेक्ट् इव, |
07:59 | तथा च अन्यत् एट्रिब्यूट्स् – GI, accession number, description इत्येतानि प्रदर्शयति । |
08:06 | अस्य रेकार्ड् इत्येतस्य प्रत्येकानि गुणलक्षणानि, वयं अधः द्रष्टुं शक्नुमः । |
08:11 | Prompt मध्ये एवं टङ्कनं कुर्वन्तु : record dot seq ; अनन्तरं Enter की नुदन्तु । |
08:18 | औट्पुट् , सञ्चिकास्थं सीक्वेन्स् प्रदर्शयति । |
08:22 | अस्य रेकार्ड् इत्येतस्य ऐडेण्टिफयर्स् द्रष्टुं, एवं टङ्कयन्तु : record dot id अनन्तरं Enter की नुदन्तु । |
08:29 | औट्पुट् , GI सङ्ख्यां तथा अक्सेशन् सङ्ख्यादीन् प्रदर्शयति । |
08:34 | उपरि व्याख्यातं फङ्क्षन् इत्येतत्, भवतां अपेक्षितां डेटा सञ्चिकां पार्स् कर्तुं उपयोक्तुं शक्यते । |
08:40 | सङ्क्षेपेण, |
08:42 | अस्मिन् अनुशिक्षणे वयं, FASTA सञ्चिकाः, GenBank सञ्चिकाश्च NCBI डेटाबेस् जालपुट-तः डौन्लोड्- करणं तथा SeqIO माड्यूल् पार्सिङ्ग् तथा रीड् फङ्क्षन्स् उपयोगं, |
08:55 | FASTA तथा GenBankसञ्चिकाभ्यः रेकार्ड् id, विवरणं, सीक्वेन्स् इत्यादिनां डेटा एक्स्ट्राक्ट् करणं च ज्ञातवन्तः । |
09:03 | अधुना असैन्मेण्ट् निमित्तं |
09:06 | NCBI डेटाबेस् तः, भवताम् अपेक्षितं न्यूक्लियोटैड् सीक्वेन्स् निमित्तं, FASTA सञ्चिकाः डौन्लोड् कुर्वन्तु । |
09:13 | एतेषां सीक्वेन्स् सञ्चिकां तस्याः रिवर्स् काम्प्लिमेण्ट् प्रति परिवर्तयन्तु । |
09:17 | भवतां समाप्तम् असैन्मेण्ट्, अधस्तन-कोड्-युक्तं भवेत् । |
09:22 | FASTA सञ्चिका-तः न्यूक्लियोटैड् सीक्वेन्स् लोड् कर्तुं, पार्स् फङ्क्षन् उपयुज्यताम् । |
09:28 | अनन्तरं सीक्वेनस् आब्जेक्ट् इत्यस्य रिवर्स् काम्प्लिमेण्ट् इति बिल्ट् इन् मेथड् उपयुज्य, रिवर्स् काम्प्लिमेण्ट्स् प्रिण्ट् कुर्वन्तु । |
09:37 | अस्यां पर्चन्यां विद्यमानां विडियो , स्पोकन् ट्युटोरियल् प्राजेक्ट् सूचयति । |
09:42 | कृपया एतत् डौन्लोड् कृत्वा पश्यन्तु । |
09:44 | स्पोकन् ट्युटोरियल् प्रोजेक्ट् गणः कार्यशालाः चालयति , तथा च आन्लैन् परीक्षायाम् उत्तीर्णेभ्यः प्रमाणपत्राणि ददाति । |
09:51 | अधिकविवरणार्थं, कृपया अस्माकं सम्पर्कं कुर्वन्तु । |
09:55 | स्पोकन् ट्युटोरियल् प्राजेक्ट् , राष्ट्रियसाक्षरता मिषन्, ICT, MHRD द्वारा भारतसर्वकारस्य आधारं प्राप्तवती वर्तते । |
10:01 | अस्याः संस्थायाः विषये अधिकं विवरणम् अत्र पर्चन्याम् उपलभ्यते । |
10:06 | अस्य अनुशिक्षणस्य अनुवादकः डा. उदयन हेगडे प्रवाचकश्च नवीन भट्टः उप्पिनपट्टणम् । धन्यवादाः । |