Biopython/C2/Parsing-Data/Malayalam

From Script | Spoken-Tutorial
Revision as of 16:12, 19 January 2018 by Vijinair (Talk | contribs)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to: navigation, search
Time
Narration
00:01 ഹലോ എല്ലാവരും Parsing Data.യെക്കുറിച്ചുള്ള ഈ ട്യൂട്ടോറിയലിലേക്ക് സ്വാഗതം.
00:06 ഈ ടുട്ടോറിയലിൽ, ഞങ്ങൾ 'FASTA' , 'GenBank' ഫയലുകൾ 'NCBI' ഡാറ്റാബേസ് വെബ് സൈറ്റിൽ നിന്നും ഡൌൺലോഡ് ചെയ്യാൻ പഠിക്കും.
00:14 'ഫയൽ ഫംഗ്ഷനുകൾ' ഫങ്ഷൻ Sequence Input/Output മൊഡ്യൂൾ ഉപയോഗിച്ച് ഉപയോഗിക്കുന്നു.
00:19 ഈ ട്യൂട്ടോറിയൽ പിന്തുടരുന്നതിന്, നിങ്ങൾ അണ്ടർഗ്രാജുവേറ്റ് ബയോകെമിസ്റ്ററി അല്ലെങ്കിൽ ബയോഇൻഫർമാറ്റിക്സ് പരിചയത്തിലായിരിക്കണം
00:26 ബേസിക് പൈത്തൺ പ്രോഗ്രാമിങ്.
00:30 തന്നിരിക്കുന്ന ലിങ്ക് പൈത്തൺ ട്യൂട്ടോറിയലുകൾ കാണുക.
00:34 ഈ ട്യൂട്ടോറിയൽ രേഖപ്പെടുത്താൻ ഞാൻ ഉപയോഗിക്കുന്നു: * 'ഉബുണ്ടു ഓസ്' 'പതിപ്പ് 14.10
00:40 Python version 2.7.8
00:44 Ipython interpretor version 2.3.0
00:48 Biopython വേർഷൻ 1.64 and * Mozilla Firefox ബ്രൌസർ 35.0.
00:56 ജീവശാസ്ത്രത്തിലെ ശാസ്ത്രീയ വിവരങ്ങൾ സാധാരണയായി 'FASTA' , 'GenBank' , 'EMBL' , Swiss-Prot '
01:07 ഡാറ്റ ഫയലുകൾ ഡാറ്റാബേസ് വെബ്സൈറ്റുകളിൽ നിന്ന് ഡൌൺലോഡ് ചെയ്യാവുന്നതാണ്.
01:12 ഏതെങ്കിലും വെബ് ബ്രൌസറിൽ താഴെ കൊടുത്തിരിക്കുന്ന വെബ്സൈറ്റ് ലിങ്ക് തുറക്കുക.
01:17 ഒരു വെബ് പേജ് തുറക്കുന്നു.
01:19 മനുഷ്യന്റെ ഇൻസുലിൻ ജീൻ 'FASTA' , 'GenBank' എന്നീ ഫയലുകൾ നമുക്ക് ഡൌൺലോഡ് ചെയ്യാം.
01:25 തിരയൽ ബോക്സിൽ, ടൈപ്പുചെയ്യുക "human insulin", ,Search ബട്ടണിൽ ക്ലിക്കുചെയ്യുക.
01:31 മനുഷ്യർ ഇൻസുലിൻ ജീൻ എന്ന പേരിൽ ധാരാളം ഫയലുകൾ കാണിക്കുന്നു.
01:35 പ്രദർശനത്തിനായി,“Homo sapiens Insulin mRNA”. എന്ന പേരിൽ 4 ഫയലുകൾ ഞാൻ തിരഞ്ഞെടുക്കും.
01:43 500 base പൈറസ് ഉള്ള ഫയലുകളെ ഞാൻ തിരഞ്ഞെടുക്കും.
01:48 ഫയൽ ഡൌൺലോഡ് ചെയ്യുന്നതിനായി ചെക്ക് ബോക്സിൽ ക്ലിക്കുചെയ്യുക.
01:56 പേജിന്റെ മുകളിൽ വലത് കോണിലുള്ള " 'അയയ്ക്കുക' '" ഓപ്ഷനിലേക്ക് കഴ്സർ കൊണ്ടുവരിക.
02:02 "താഴേയ്ക്കുള്ള അമ്പടയാളം ഉള്ള ചെറിയ ബട്ടണില് അമര്ത്തുക“Send to” ബട്ടണ് ചേര്ക്കുക.
02:09 Choose destination”, എന്ന തലക്കെട്ടിൽFile ഓപ്ഷനിൽ ക്ലിക്ക് ചെയ്യുക.
02:13 ഈ ഫയൽformatഡ്രോപ്പ്-ഡൗൺ ലിസ്റ്റ് ബോക്സിൽ നൽകിയിരിക്കുന്ന ഏതൊരു ഫയൽ ഫോർമാറ്റിലും 'സേവ്' സേവ് ചെയ്യാം.
02:21 തന്നിരിക്കുന്ന ഐച്ഛികങ്ങളിൽ നിന്ന് 'FASTA' 'തിരഞ്ഞെടുക്കുക.
02:25 പിന്നെ Create file ഓപ്ഷൻ ക്ലിക്ക് ചെയ്യുക.
02:29 സ്ക്രീനില് ഒരു ഡയലോഗ് ബോക്സ് പ്രത്യക്ഷപ്പെടുന്നു.
02: 32 Open with OK. ക്ലിക്കുചെയ്യുക.'
02:36 text editor.ൽ ഒരു ഫയൽ തുറക്കുന്നു.
02:39 ഡൌൺലോഡ് ചെയ്യുന്നതിന് നാല് ഫയലുകൾ ഞങ്ങൾ തിരഞ്ഞെടുത്തിരുന്നതിനാൽ ഫയൽ 4 രേഖകൾ കാണിക്കുന്നു.
02:46 ഓരോ രേഖയിലും ആദ്യ വരി ഒരുidentifier line ആണ്
02:50 “greater than (>)” ചിഹ്നത്തോടൊപ്പം ഇത് ആരംഭിക്കുന്നു.
02:53 ഇത് പിന്നീട് ഒരു sequence.ആണ്.
02:56 home ഫോൾഡറിൽ “sequence.fasta'”.എന്ന പേരിൽ സേവ് ചെയ്യുക.
03:01 ടെക്സ്റ്റ് എഡിറ്റർ ക്ലോസെ ചെയുക .
03:03 'GenBank' ഫോർമാറ്റിലുള്ള ഫയലുകൾ ഡൌൺലോഡ് ചെയ്യാൻ മുകളിലുള്ള അതേ നടപടികൾ പാലിക്കുക
03:08 നേരത്തെ തിരഞ്ഞെടുത്ത ഫയലുകളിലേയ്ക്ക്
03:12 'ഫയൽ ഫോർമാറ്റ്'GenBank. എന്നായി തെരഞ്ഞെടുക്കുക.
03:16 ഒരു ഫയൽ സൃഷ്ടിക്കുക. ഒരു ടെക്സ്റ്റ് എഡിറ്റർ ഉപയോഗിച്ച് തുറക്കുക.
03:21 'GenBank' ഫോർമാറ്റിൽ ലുള്ള ഫയല് 'FASTA' 'ഫയലിനെക്കാള് കൂടുതല് സവിശേഷതകള് ഉള്ളതായി ശ്രദ്ധിക്കുക.
03:27 sequence.gb എന്ന് ഫയൽ സേവ് ചെയ്യുക. ടെക്സ്റ്റ് എഡിറ്റർ അടയ്ക്കുക.
03:34 പ്രകടന ലക്ഷ്യത്തിന് ഒരു 'റെക്കോർഡ്' ഉപയോഗിച്ച് നമുക്ക് ഒരു ഫാസ്റ്റാ ഫയൽ വേണം.
03:39 ഇതിനായി, മുമ്പത്തെ തിരഞ്ഞെടുക്കൽ ചെക്ക് ബോക്സുകളിൽ വീണ്ടും ക്ലിക്ക് ചെയ്യുക.
03:48 ഇപ്പോൾ, “Human insulin gene complete cds” എന്ന ഫയൽ തിരഞ്ഞെടുക്കുക.
03:54 ചെക്ക് ബോക്സിൽ ക്ലിക്കുചെയ്യുക.
03:57 'ഹോം' ഫോൾഡറിൽ ഫയൽ 'സേവ്' നേരത്തെ കാണിച്ചിരിക്കുന്ന അതേ നടപടികൾ പാലിക്കുക.
04:01 "insulin.fasta". ഈ ഫയൽ 'സേവ്' ചെയുക
04:08 ഈ ഫയലുകളിൽ സംഭരിച്ചിട്ടുള്ള ബയോളജിക്കൽ ഡാറ്റ Biopython ലൈബ്രറികൾ ഉപയോഗിച്ച് എക്സ്ട്രാക്റ്റുചെയ്ത് പരിഷ്ക്കരിക്കാൻ കഴിയും.
04:16 വാചകം-എഡിറ്റർ അടയ്ക്കുക.
04:19 ഡാറ്റാ ഫയലുകളിൽ നിന്നും ഡാറ്റ എക്സ്ട്രാചെയ്യുന്നത് Parsing. എന്നറിയപ്പെടുന്നു.
04:23 'SeqIO' മൊഡ്യൂളിലെ 'ഫംഗ്ഷൻ' ഉപയോഗിച്ച് കൂടുതൽ ഫയൽ ഫോർമാറ്റുകൾ പാഴ്സ് ചെയ്യാവുന്നതാണ്.
04:30 'Seqio' മൊഡ്യൂൾ ഏറ്റവും സാധാരണയായി ഉപയോഗിക്കുന്ന പ്രവർത്തനങ്ങൾ: parse, read, write and convert.
04:38 'Ctrl, Alt' , 't' കീകൾ ഒരേസമയം അമർത്തി ടെർമിനൽ തുറക്കൂ.
04:44 "ipython"പ്രോംപ്റ്റിൽ "ipython" ടൈപ്പുചെയ്യുക. എന്റർ അമർത്തുക.
04:51 അടുത്തതായി, Bio പാക്കേജിൽ നിന്ന് "SeqIO" മൊഡ്യൂൾ ഇംപോർട്ട് ചെയുക
04:56 പ്രോംപ്റ്റിൽ,from Bio import SeqIO. ടൈപ്പ് ചെയ്യുക. എന്റർ അമർത്തുക.
05:04 നമ്മൾ ഏറ്റവും പ്രധാനപ്പെട്ട ഫംഗ്ഷൻ“parse”. ആരംഭിക്കും.
05:07 പ്രദർശനത്തിനായി, ഞങ്ങൾ നേരത്തെ തന്നെ ഡൌൺലോഡ് ചെയ്ത നിരവധി റെക്കോർഡ് റെക്കോർഡുകളുള്ള 'FASTA' ഫയൽ ഉപയോഗിക്കും.
05:17 ലളിതമായ 'FASTA' പാഴ്സിങിനായി, പ്രോംപ്റ്റിൽ ഇനിപ്പറയുന്നവ ടൈപ്പ് ചെയ്യുക.
05:22 'Sequence.fasta' 'ഫയലിന്റെ ഉള്ളടക്കം വായിക്കാൻ ഞങ്ങൾ ഇവിടെparseഫങ്ഷൻ ഉപയോഗിക്കുന്നു.
05:30 ഔട്ട്പുട്ടിനായി, record id, , റെക്കോർഡിലെ സീക്വൻസും സീക്വൻസിൻറെ ദൈർഘ്യവും.
05:41 parse ഫങ്ഷൻ സീക്വൻ ഡേറ്റായി Sequence record objects.വായിക്കാൻ ഉപയോഗിക്കുന്നു.
05:48 ഇത് 'ലൂപ്പിനുള്ള' ഉപയോഗിച്ച് സാധാരണയായി ഉപയോഗിക്കുന്നു.
05:52 ഇത് രണ്ട് argumentsസ്വീകരിക്കാവുന്നതാണ്, ആദ്യത്തേത് ഡാറ്റ വായിക്കുന്നതിനുള്ള ഫയൽ നാമമാണ്.
05:59 രണ്ടാമത്തെ ഫയൽ ഫോർമാറ്റ് വ്യക്തമാക്കുന്നു.
06:02 ഔട്ട്പുട്ട് ലഭിക്കുന്നതിന് 'Enter' കീ രണ്ടുതവണ അമർത്തുക.
06:07 ഉബുണ്ടുവിൽ identifier line, , അതിനുശേഷം ഫയലിലുള്ള സീക്വൻസ്, ഫയലിൽ എല്ലാ റെക്കോർഡുകളുടേയും ശ്രേണിയുടെ നീളം എന്നിവയും കാണിക്കുന്നു.
06:21 'FASTA' ഫോർമാറ്റ് അക്ഷരമാല വ്യക്തമാക്കുന്നില്ലെന്ന് ശ്രദ്ധിക്കുക.
06:26 അതിനാൽ, ഔട്ട്പുട്ട് ഒരു DNA sequence.എന്ന് വ്യക്തമാക്കിയിട്ടില്ല.
06:31 'Genbank' ഫയൽ പാഴ്സ് ചെയ്യുന്നതിന് അതേ നടപടികൾ വീണ്ടും ആവർത്തിക്കാവുന്നതാണ്.
06:36 ഡെമോൺസ്ട്രേഷൻ വേണ്ടി നേരത്തെ തന്നെ ഡൌൺലോഡ് ചെയ്തിട്ടുള്ള 'GenBank' ഫയൽ ഞങ്ങൾ ഉപയോഗിക്കും.
06:43 മുമ്പു് ഉപയോഗിച്ചിരുന്ന കോഡ്യുടെ ലൈനുകൾ ലഭ്യമാക്കുന്നതിനായി അപ്പ്-ആരോ കീ അമർത്തുക.
06:49 ഫയലിന്റെ പേര് 'sequence.gb' എന്നതിലേക്ക് മാറ്റുക.
06:53 ഫയൽ ഫോർമാറ്റ്genbank.ലേക്ക് മാറ്റുക.'
06:56 ബാക്കിയുള്ള കോഡ് സമാനമാണ്.
06:58 ഔട്ട്പുട്ട് ലഭിക്കുന്നതിന് 'Enter' രണ്ടുപ്രാവശ്യം അമർത്തുക.
07:03 ഇവിടെ ഉൽപ്പെടുത്തിട്ടുള്ളത് record id,,sequence കൂടാതെ എല്ലാ റെക്കോഡിനുള്ള റെക്കോർഡിനും.
07:12 'GenBank' ഫോർമാറ്റ് ഡിഎൻഎ ശ്രേണി എന്ന നിലയിൽ രേഖപ്പെടുത്തുന്നു.
07:19 അതുപോലെSwiss-prot EMBL ഫിലെസ് അതേ കോഡ് ഉപയോഗിച്ചു് പാഴ്സ് ചെയ്യാവുന്നതാണ്.
07:27 നിങ്ങളുടെ ഫയലിൽ ഒരൊറ്റ റെക്കോർഡ് ഉണ്ടെങ്കിൽ, 'parsing.നുള്ള വരികൾ ടൈപ്പ് ചെയ്യുക.
07:34 ഇവിടെ, മുമ്പ് സംരക്ഷിച്ച 'FASTA' 'ഫയൽ ഒരു റെക്കോർഡുപയോഗിച്ച് ഉപയോഗിക്കും, അതായത്,' insulin.fasta 'ഒരു ഉദാഹരണമായി.\
07:43 parseഫംഗ്ഷനു പകരംread ഫങ്ഷൻ ഉപയോഗിച്ചുവെന്നത് ശ്രദ്ധിക്കുക. എന്റർ അമർത്തുക.
07:50 'Insulin.fasta' 'ന് വേണ്ടിയുള്ള ഉളളടക്കം ഔട്ട്പുട്ട് കാണിക്കുന്നു.
07:55 sequence record object.എന്ന സെക്യുഎൻസ് കാണിക്കുന്നു.
07:59 GI, accession number description.തുടങ്ങിയ മറ്റ് ആട്രിബ്യൂട്ടുകൾ.
08:06 നമുക്ക് ഈ റെക്കോർഡിന്റെ വ്യക്തിഗത ആട്രിബ്യൂട്ടുകൾ താഴെ കാണാം.
08:11 പ്രോംപ്റ്റില്, ടൈപ്പ് ചെയ്യുക: record dot seq എന്റർ അമർത്തുക.
08:18 ഔട്ട്പുട്ട് ഫയലിൽ ഉള്ള സീക്വൻസ് കാണിക്കുന്നു.
08:22 ഈ റെക്കോഡിനുള്ള ഐഡന്റിഫയറുകൾ കാണാൻ, ടൈപ്പ് ചെയ്യുക record dot id. അമർത്തുക 'Enter' .
08:29 ഔട്ട്പുട്ട് GI 'നമ്പർ', 'നമ്പർ', 'അക്സൈഷൻ നമ്പർ' എന്നിവയാണ്.
08:34 താങ്കളുടെ താല്പര്യപ്രകാരം, parseവിശദീകരിച്ചിരിക്കുന്ന ഫങ്ഷൻ ഉപയോഗിക്കാവുന്നതാണ്.
08:40 ഇപ്പോൾ നമുക്ക് സംഗ്രഹിക്കാം.
08:42 ഈ ട്യൂട്ടോറിയലിൽ, നമ്മൾ പഠിച്ചത്: NCBI ഡാറ്റാബേസിൽ നിന്നും FASTA GenBank ഫയലുകൾ ' 'SeqIO' മൊഡ്യൂളിലെ 'parse read ഫക്ഷൻസ്
08:55 'FASTA' , 'GenBank' തുടങ്ങിയ ഫയലുകളിൽ നിന്നും റെക്കോഡ് ഐഡി , വിവരണം, സീക്വൻസുകൾ തുടങ്ങിയ വിവരങ്ങൾ ശേഖരിക്കാൻ.
09:03 ഇപ്പോൾ, അസൈൻമെന്റ്-
09:06 'എഫ്എഎസ്എ' എൻ.സി.ബി.ഐ ഡാറ്റാബേസിൽ നിന്ന് നിങ്ങൾക്കിഷ്ടമുള്ള ന്യൂക്ലിയോടൈഡ് അനുപാതത്തിനായി ഫയലുകൾ.
09:13 സീക്വൻസുകളുടെ ഫയൽ 'റിവേഴ്സ് ഗംഭീര' s ലേക്ക് പരിവർത്തനം ചെയ്യുക.
09:17 നിങ്ങളുടെ പൂർത്തിയാക്കിയ ചുമതലയിൽ ഇനിപ്പറയുന്ന കോഡ് കോഡുകൾ ഉണ്ടായിരിക്കണം.
09:22 'FASTA' ഫയലിൽ നിന്ന് 'ന്യൂക്ലിയോടൈഡ് സീക്വൻസുകളിലേക്ക്' പാഴ്സ് 'ഫങ്ഷൻ' ലോഡ് ചെയ്യുക.
09:28 അടുത്തതായി, 'റിവേഴ്സ് പരിപൂര്ണ്ണ' രീതിയില് നിര്മ്മിച്ച സീക്വന്സ് ഒബ്ജക്റ്റുകള് ഉപയോഗിച്ച് റിവേഴ്സ് പൂര്ത്തിയാക്കലുകള് പ്രിന്റ് ചെയ്യുക.
09:37 താഴെയുള്ള ലിങ്കിലെ വീഡിയോ, സ്പോക്കൺ-ടുട്ടോറിയൽ പ്രൊജക്റ്റിനെ സംഗ്രഹിക്കുന്നു.
09:42 ഇത് ഡൌൺലോഡ് ചെയ്ത് കാണുക.
09:44 സ്പോകെൻ ട്യൂട്ടോറിയൽ പ്രൊജക്റ്റ് ടീം വർക്ക്ഷോപ്പുകൾ നടത്തുന്നു, ഓൺലൈനിൽ പരീക്ഷിക്കുന്നവർക്ക് സർട്ടിഫികറ്റുകൾ നൽകുന്നു.
09:51 കൂടുതൽ വിവരങ്ങൾക്ക്, ദയവായി ഞങ്ങൾക്ക് എഴുതുക.
09:55 സ്പോകെൻ ട്യൂട്ടോറിയൽ പ്രൊജക്റ്റ്, എൻഎംഇഐടി, എംഎച്ച്ആർഡി, ഗവർമെന്റ് ഓഫ് ഇന്ത്യ.
10:01 ഈ ദൗത്യത്തെക്കുറിച്ചുള്ള കൂടുതൽ വിവരങ്ങൾ കാണിച്ചിരിക്കുന്ന ലിങ്കിൽ ലഭ്യമാണ്.
10:06 ഇത് ഐഇറ്റി ബോംബേ യിൽ നിന്ന് വിജി നായർ ആണ്. പങ്കുചേർന്നതിന് നന്ദി.

Contributors and Content Editors

Prena, Vijinair