Biopython/C2/Parsing-Data/Sanskrit

Time	Narration
00:01	सर्वेभ्योऽपि नमस्कारः । फार्सिङ्ग् डाटा इत्याख्ये अनुशिक्षणे भवतां स्वागतम् ।
00:06	अस्मिन् अनुशिक्षणे वयं NCBI डाटाबेस्-जालपुटतः FASTA तथा GenBank सञ्चिकाः डौन्लोड्-करणं पठिष्यामः ।
00:14
00:19	एतत् अनुशिक्षणम् अवगन्तुम् , भवतां पदविपूर्वजीवरसायनशास्त्रम् अथवा बयोइन्फर्मेटिक्स्
00:26	तथा च बेसिक् पैथान् प्रोग्रामिङ्ग् इत्येतेषां ज्ञानं भवेत् ।
00:30	पर्चन्यां दत्तं पैथान् अनुशिक्षणं पश्यन्तु ।
00:34	एतत् अनुशिक्षणं रेकार्ड् कर्तुम् अहं Ubuntu OS इत्यस्य 14.10 आवृत्तेः
00:40	python इत्यस्य 2.7. 8आवृत्तेः
00:44	I python interpreterइत्यस्य 2.3.0 आवृत्तेः
00:48
00:56	जीवशास्त्रीय वैज्ञानिकदत्तांशान् सामान्यतया FASTA, GenBank, EMBL, Swiss-Prot इत्यादिषु टेक्स्ट् सञ्चिकासु सङ्गृह्यते ।
01:07	डेटासञ्चिकाः डेटाबेस् जालपुटेभ्यः डौन्लोड् कर्तुं शक्यते ।
01:12	यस्मिन् कस्मिन्नपि वेब् ब्रौसर् मध्ये, अधोनिर्दिष्ट-जालपुटस्य पर्चनीम् उद्घाटयन्तु ।
01:17	किञ्चन वेब्-पेज् उद्घाटितं भवति ।
01:19	वयं मानवस्य इन्सुलिन् जीन् निमित्तं FASTA तथा GenBank सञ्चिकाः डौन्लोड् कुर्मः ।
01:25	search box मध्ये “human insulin” इति टङ्कनं कृत्वा “search” इति क्लिक् कुर्वन्तु । ।
01:31	मानवस्य इन्सुलिन् जीन् निमित्तं वेब्-पेज्, बह्व्यः सञ्चिकाः प्रदर्शयति ।
01:35	अत्र विवरणार्थम् अहं Homo sapiens Insulin mRNA इत्याख्याः4 सञ्चिकाः चिनोमि ।
01:43	500 बेस् पेर् अपेक्षया न्यूनतमाः सञ्चिकाः अहं चिनोमि ।
01:48	डौन्लोड् कर्तुं सञ्चिकां चेतुं, चेक् बाक्स् उपरि क्लिक् कुर्वन्तु ।
01:56	पेज् उपरि दक्षिणकोणस्थं Send to इति विकल्पस्य समीपे कर्सर् आनयन्तु ।
02:02	Send to बटन् पार्श्वस्थम् डौन्लोड् इति लघ्वीं सेलेक्षन् बटन् क्लिक् कुर्वन्तु ।
02:09	Choose destination इति शीर्षिकायाः अधः विद्यमानं File इति विकल्पं क्लिक् कुर्वन्तु ।
02:13	Format इति ड्राप्-डौन्-लिस्ट्-बाक्स्-मध्ये विद्यमाने कस्मिंश्चिदपि file फार्मेट् मध्ये, भवन्तः एतां सञ्चिकां सेव् कर्तुं शक्नुवन्ति ।
02:21	प्रदत्तविकल्पेषु FASTA चिन्वन्तु ।
02:25	पश्चात् Create file विकल्पं नुदन्तु ।
02:29	स्क्रीन् उपरि किञ्चन डैलाग् बाक्स् दृश्यते ।
02:32	Open with इति विकल्पं चित्वा, OK इति क्लिक् कुर्वन्तु ।
02:36	टेक्स्ट् एडिटर् मध्ये काचित् सञ्चिका उद्घाटिता भवति ।
02:39	अस्माभिः चतस्रः सञ्चिकाः डौन्-लोड् कर्तुं चयनं कृतं, अतः एषा सञ्चिका चतुरः रेकार्ड्स् प्रदर्शयति ।
02:46	प्रत्येकस्मिन् रेकार्ड् मध्ये प्रथमा पङ्क्तिः, ऐडेण्टिफयर् लैन् भवति ।
02:50	एतत्सा greater than (>) चिह्नात् आरभ्यते ।
02:53	तदनन्तरं sequence भविष्यति ।
02:56	सञ्चिकां भवतां home फोल्डर् मध्ये sequence.fasta इति सेव् कुर्वन्तु ।
03:01	टेक्स्ट् एडिटर् पिधानं कुर्वन्तु ।
03:03	आदौ चिताः सञ्चिकाः GenBank फार्मेट् मध्ये डौन्लोड्-कर्तुं उपरि दर्शितानि सोपानानि एव अनुसरन्तु ।
03:12	file format इत्येतं GenBank इति चिन्वन्तु ।
03:16	एकां सञ्चिकां create कृत्वा टेक्स्ट् एडिटर् मध्ये open कुर्वन्तु ।
03:21	GenBankफार्माट् मध्यस्थं सिक्वेन्स् सञ्चिकायाम्, FASTAसञ्चिकापेक्षया अधिकानि वैशिष्ट्यानि परिशीलयन्तु ।
03:27	इमां सञ्चिकां भवतां home फोल्डर् मध्ये, सिक्वेनस्.gb इति सेव् कुर्वन्तु । टेक्स्ट् एडिटर् close कुर्वन्तु ।
03:34	अत्र विवरणार्थम् , अस्मभ्यम् एक -रेकार्ड्- युक्तायाः FASTA सञ्चिकायाः आवश्यकता अस्ति ।
03:39	एतदर्थं चेक् बाक्स्स् उपरि पुनः क्लिक् कृत्वा, आदौ कृतं चयनं क्लियर् कुर्वन्तु ।
03:48	अधुना Human insulin gene complete cds इति सञ्चिकां चिन्वन्तु ।
03:54	चेक् बाक्स् उपरि क्लिक्-कुर्वन्तु ।
03:57	तथा च सञ्चिकां homeफोल्डर् मध्ये सेव् कर्तुम् , आदौ प्रदर्शितानि सोपानानि अनुसरन्तु ।
04:01	सञ्चिकां insulin.fasta इति सेव् कुर्वन्तु ।
04:08	Biopython library उपयुज्य , अस्यां सञ्चिकायां सङ्गृहीतान् biological डेटा पुनःप्राप्तुं परिवर्तयितुं च शक्यते ।
04:16	टेक्स्ट् एडिटर् close कुर्वन्तु ।
04:19	डेटा सञ्चिकाभ्यः डेटा स्वीकरणं parsing इति उच्यते ।
04:23	SeqIO माड्यूल्-म ध्ये उपलभ्यमानानि फङ्क्षन्स् उपयुज्य, अधिकानि file फार्मेट्स् पार्स् कर्तुं शक्यते ।
04:30	सामन्यतया उपयुज्यमानानि SeqIO माड्यूल् फङ्क्षन्स् एवं वर्तन्ते : parse, read, write तथा convert।
04:38	Ctrl, Alt तथा t बटन्स् युगपत् नोदनद्वारा टर्मिनल् उद्घाटयन्तु ।
04:44	प्राम्प्ट्मध्ये “iपैथान्” इति टैप्-करणद्वारा iपैथान् आरभ्यताम् । Enter की नुदन्तु ।
04:51	अनन्तरं Bio प्याकेज् तः SeqIO माड्यूल् इम्पोर्ट् कुर्वन्तु ।
04:56	Prompt मध्ये “from Bio import SeqIO” इति टङ्कनं कृत्वा Enter की नुदन्तु ।
05:04	वयं बहुमुख्य parse फङ्क्षन्-तः प्रारम्भं कुर्मः ।
05:07	अत्र विवरणार्थं डेटाबेस्-तः पूर्वं डौन्लोड् कृतं , कांश्चन रेकार्ड्स्-युक्तानि FASTA सञ्चिकाः अहम् उपयोगं करोमि ।
05:17	सरल FASTA पार्सिङ्ग् निमित्तम् अधोनिर्दिष्टानि प्राम्पट् मध्ये टङ्कयन्तु ।
05:22	अत्र वयं sequence.fasta सञ्चिकास्थं पठितुं parse फङ्क्षन् उपयोगं कुर्मः।
05:30	औट्पुट् निमित्तं रेकार्ड् id, रेकार्ड्-मध्ये स्थितं सीक्वेन्स् तथा सीक्वेन्स्-दैर्घ्यं प्रिण्ट् कुर्वन्तु ।
05:41	तथैव सिक्वेन्स् दत्तांशं सिक्वेनस् रेकार्ड् आब्जेक्ट्स् इव रीड् कर्तुं parseफङ्क्षन् उपयुज्यते इति अवधार्यताम्।
05:48	सामान्यतः एतत् forलूप् इत्यनेन सह उपयुज्यते ।
05:52	एतत् 2 आर्ग्युमेण्ट्स् स्वीकर्तुं शक्यते । प्रथमं, दत्तांशं पठितुम् अपेक्षितं फैल् नाम ।
05:59	द्वितीयं, सञ्चिका फार्मेट् सूचयति ।
06:02	औट्पुट् प्राप्तुं , Enter की द्विवारं नुदन्तु ।
06:07	औट्पुट्, ऐडेण्टिफयर् लैन् , सञ्चिकायां विद्यमानं सीक्वेन्स् तथा च सञ्चिकायां विद्यमानानाम् सर्वेषां रेकार्ड्सीक्वेन्स् इत्येतेषां दैर्घ्यं प्रदर्शयति ।
06:21	FASTA फार्मेट् , अल्फाबेट्स् न सूचयति इति अवधारयन्तु ।
06:26	अतः, औट्पुट्, एतत् DNA सीक्वेनस् इति न सूचयति ।
06:31	GenBank सञ्चिकां पार्स् कर्तुम्, एतानि सोपानानि एव पुनरावर्तयितुं शक्यन्ते ।
06:36	विवरणार्र्थम्, वयम् आदौ डाटाबेस्-तः डौन्-लोड्-कृतायाः GenBank सञ्चिकायाः उपयोगं करिष्यामः ।
06:43	अस्माभिः पूर्वम् उपयुक्तानां कोड् इत्येतेषां पङ्क्तीः प्राप्तुं up-arrow की नुदन्तु ।
06:49	सञ्चिकायाः नाम सिक्वेनस्.gb इति परिवर्तयन्तु ।
06:53	सञ्चिकायाः फार्मेट् genbank प्रति परिवर्तयन्तु ।
06:56	अवशिष्टं कोड् , पूर्ववदेव भवति ।
06:58	औट्पुट् प्राप्तुं Enterकी द्विवारं नुदन्तु ।
07:03	अत्रापि, औट्पुट् , रेकार्ड् id, सिक्वेन्स् तथा च सञ्चिकायाः सर्वेषां रेकार्ड् सीक्वेन्स् दैर्घ्यं प्रदर्शयति ।
07:12	GenBank फार्मेट् , सीक्वेन्स् इत्येतत् DNA सीक्वेन्स् सूचयति इति अवधार्यताम् ।
07:19	तथैव, Swiss-prot तथा च EMBL सञ्चिकाः , उपरितनकोड् उपयुज्य पार्स् कर्तुं शक्यते ।
07:27	भवतां सञ्चिका एक-रेकार्ड् युक्ता चेत् , पार्सिङ्ग् कृते अधस्तनाः पङ्क्तीः टङ्कयन्तु ।
07:34	अत्र, अस्माभिः पूर्वं सेव् कृतम् , एक रेकार्ड् युक्त FASTA सञ्चिकां उपयुञ्ज्महे । उदाहरणार्थम् - insulin.fasta.
07:43	पार्स् फङ्क्षन् परतया, वयं रीड् फङ्क्षन् उपयोगं कृतवन्तः इति अवधानं कुरुत । Enter की नुदन्तु ।
07:50	औट्पुट् , insulin.fastaसञ्चिकायाम् अस्ति इति प्रदर्शयति ।
07:55	एतत् सीक्वेन्स्, सीक्वेन्स् रेकार्ड् आब्जेक्ट् इव,
07:59	तथा च अन्यत् अटिब्यूट् – GI, accession number, description इत्येतानि प्रदर्शयति ।
08:06	अस्य रेकार्ड् इत्येतस्य प्रत्येकानि गुणलक्षणानि, वयं अधः द्रष्टुं शक्नुमः ।
08:11	Prompt मध्ये एवं टङ्कनं कुर्वन्तु : record dot seq अनन्तरं Enter की नुदन्तु ।
08:18	औट्पुट् , सञ्चिकास्थं सीक्वेन्स् प्रदर्शयति ।
08:22	अस्य रेकार्ड् इत्येतस्य ऐडेण्टिफयर्स् द्रष्टुं, एवं टङ्कयन्तु : record dot id अनन्तरं Enter की नुदन्तु ।
08:29	औट्पुट् , GI सङ्ख्यां तथा अक्सेशन् सङ्ख्यादीन् प्रदर्शयति ।
08:34	उपरि व्याख्यातं फङ्क्षन् इत्येतत्, भवतां अपेक्षितां डेटा सञ्चिकां पार्स् कर्तुं उपयोक्तुं शक्यते ।
08:40	सङ्क्षेपेण,
08:42	अस्मिन् अनुशिक्षणे वयं, FASTA सञ्चिकाः, GenBank सञ्चिकाश्च NCBI डेटाबेस् जालपुट-तः डौन्लोड्- करणं तथा SeqIO माड्यूल् पार्सिङ्ग् तथा रीड् फङ्क्षन्स् उपयोगं,
08:55	FASTA तथा GenBankसञ्चिकाभ्यः रेकार्ड् id, विवरणं, सीक्वेन्स् इत्यादिनां डेटा एक्स्ट्राक्ट् करणं ज्ञातवन्तः ।
09:03	अधुना असैन्मेण्ट् निमित्तं
09:06	NCBI डेटाबेस् तः, भवताम् अपेक्षितं न्यूक्लियोटैड् सीक्वेन्स् निमित्तं, FASTA सञ्चिकाः डौन्लोड् कुर्वन्तु ।
09:13	एतेषां सीक्वेन्स् सञ्चिकां तस्याः रिवर्स् काम्प्लिमेण्ट् प्रति परिवर्तयन्तु ।
09:17	भवतां समाप्तम् असैन्मेण्ट्, अधस्तन-कोड्युक्तं भवेत् ।
09:22	FASTA सञ्चिका-तः न्यूक्लियोटैड् सीक्वेन्स् लोड् कर्तुं, पार्स् फङ्क्षन् उपयुज्यताम् ।
09:28	अनन्तरं सीक्वेनस् आब्जेक्ट् इत्यस्य रिवर्स् काम्प्लिमेण्ट् इति बिल्ट् इन् मेथड् उपयुज्य, रिवर्स् काम्प्लिमेण्ट्स् प्रिण्ट् कुर्वन्तु ।
09:37	अस्यां पर्चन्यां विद्यमानां विडियो , स्पोकन् ट्युटोरियल् प्राजेक्ट् सूचयति ।
09:42	कृपया एतत् डौन्लोड् कृत्वा पश्यन्तु ।
09:44	स्पोकन् ट्युटोरियल् प्रोजेक्ट् गणः कार्यशालाः चालयति , तथा च आन्लैन् परीक्षायाम् उत्तीर्णेभ्यः प्रमाणपत्राणि ददाति ।
09:51	अधिकविवरणार्थं, कृपया अस्माकं सम्पर्कं कुर्वन्तु ।
09:55	स्पोकन् ट्युटोरियल् प्राजेक्ट् , राष्ट्रियसाक्षरता मिषन्, ICT, MHRD द्वारा भारतसर्वकारस्य आधारं प्राप्तवती वर्तते ।
10:01	अस्याः संस्थायाः विषये अधिकं विवरणम् अत्र पर्चन्याम् उपलभ्यते ।
10:06	अस्य अनुशिक्षणस्य अनुवादकः डा. उदयन हेगडे प्रवाचकश्च नवीन भट्टः । धन्यवादाः ।

Contributors and Content Editors

NaveenBhat, Sandhya.np14, Udayana

Biopython/C2/Parsing-Data/Sanskrit

Contributors and Content Editors

Navigation menu

Personal tools

Namespaces

Variants

Views

Actions

Search

Navigation

Tools