Difference between revisions of "Biopython/C2/Parsing-Data/Malayalam"

Latest revision as of 16:12, 19 January 2018

Time	Narration
00:01	ഹലോ എല്ലാവരും Parsing Data.യെക്കുറിച്ചുള്ള ഈ ട്യൂട്ടോറിയലിലേക്ക് സ്വാഗതം.
00:06	ഈ ടുട്ടോറിയലിൽ, ഞങ്ങൾ 'FASTA' , 'GenBank' ഫയലുകൾ 'NCBI' ഡാറ്റാബേസ് വെബ് സൈറ്റിൽ നിന്നും ഡൌൺലോഡ് ചെയ്യാൻ പഠിക്കും.
00:14	'ഫയൽ ഫംഗ്ഷനുകൾ' ഫങ്ഷൻ Sequence Input/Output മൊഡ്യൂൾ ഉപയോഗിച്ച് ഉപയോഗിക്കുന്നു.
00:19	ഈ ട്യൂട്ടോറിയൽ പിന്തുടരുന്നതിന്, നിങ്ങൾ അണ്ടർഗ്രാജുവേറ്റ് ബയോകെമിസ്റ്ററി അല്ലെങ്കിൽ ബയോഇൻഫർമാറ്റിക്സ് പരിചയത്തിലായിരിക്കണം
00:26	ബേസിക് പൈത്തൺ പ്രോഗ്രാമിങ്.
00:30	തന്നിരിക്കുന്ന ലിങ്ക് പൈത്തൺ ട്യൂട്ടോറിയലുകൾ കാണുക.
00:34	ഈ ട്യൂട്ടോറിയൽ രേഖപ്പെടുത്താൻ ഞാൻ ഉപയോഗിക്കുന്നു: * 'ഉബുണ്ടു ഓസ്' 'പതിപ്പ് 14.10
00:40	Python version 2.7.8
00:44	Ipython interpretor version 2.3.0
00:48	Biopython വേർഷൻ 1.64 and * Mozilla Firefox ബ്രൌസർ 35.0.
00:56	ജീവശാസ്ത്രത്തിലെ ശാസ്ത്രീയ വിവരങ്ങൾ സാധാരണയായി 'FASTA' , 'GenBank' , 'EMBL' , Swiss-Prot '
01:07	ഡാറ്റ ഫയലുകൾ ഡാറ്റാബേസ് വെബ്സൈറ്റുകളിൽ നിന്ന് ഡൌൺലോഡ് ചെയ്യാവുന്നതാണ്.
01:12	ഏതെങ്കിലും വെബ് ബ്രൌസറിൽ താഴെ കൊടുത്തിരിക്കുന്ന വെബ്സൈറ്റ് ലിങ്ക് തുറക്കുക.
01:17	ഒരു വെബ് പേജ് തുറക്കുന്നു.
01:19	മനുഷ്യന്റെ ഇൻസുലിൻ ജീൻ 'FASTA' , 'GenBank' എന്നീ ഫയലുകൾ നമുക്ക് ഡൌൺലോഡ് ചെയ്യാം.
01:25	തിരയൽ ബോക്സിൽ, ടൈപ്പുചെയ്യുക "human insulin", ,Search ബട്ടണിൽ ക്ലിക്കുചെയ്യുക.
01:31	മനുഷ്യർ ഇൻസുലിൻ ജീൻ എന്ന പേരിൽ ധാരാളം ഫയലുകൾ കാണിക്കുന്നു.
01:35	പ്രദർശനത്തിനായി,“Homo sapiens Insulin mRNA”. എന്ന പേരിൽ 4 ഫയലുകൾ ഞാൻ തിരഞ്ഞെടുക്കും.
01:43	500 base പൈറസ് ഉള്ള ഫയലുകളെ ഞാൻ തിരഞ്ഞെടുക്കും.
01:48	ഫയൽ ഡൌൺലോഡ് ചെയ്യുന്നതിനായി ചെക്ക് ബോക്സിൽ ക്ലിക്കുചെയ്യുക.
01:56	പേജിന്റെ മുകളിൽ വലത് കോണിലുള്ള " 'അയയ്ക്കുക' '" ഓപ്ഷനിലേക്ക് കഴ്സർ കൊണ്ടുവരിക.
02:02	"താഴേയ്ക്കുള്ള അമ്പടയാളം ഉള്ള ചെറിയ ബട്ടണില് അമര്ത്തുക“Send to” ബട്ടണ് ചേര്ക്കുക.
02:09	“Choose destination”, എന്ന തലക്കെട്ടിൽFile ഓപ്ഷനിൽ ക്ലിക്ക് ചെയ്യുക.
02:13	ഈ ഫയൽformatഡ്രോപ്പ്-ഡൗൺ ലിസ്റ്റ് ബോക്സിൽ നൽകിയിരിക്കുന്ന ഏതൊരു ഫയൽ ഫോർമാറ്റിലും 'സേവ്' സേവ് ചെയ്യാം.
02:21	തന്നിരിക്കുന്ന ഐച്ഛികങ്ങളിൽ നിന്ന് 'FASTA' 'തിരഞ്ഞെടുക്കുക.
02:25	പിന്നെ Create file ഓപ്ഷൻ ക്ലിക്ക് ചെയ്യുക.
02:29	സ്ക്രീനില് ഒരു ഡയലോഗ് ബോക്സ് പ്രത്യക്ഷപ്പെടുന്നു.
02: 32	Open with OK. ക്ലിക്കുചെയ്യുക.'
02:36	text editor.ൽ ഒരു ഫയൽ തുറക്കുന്നു.
02:39	ഡൌൺലോഡ് ചെയ്യുന്നതിന് നാല് ഫയലുകൾ ഞങ്ങൾ തിരഞ്ഞെടുത്തിരുന്നതിനാൽ ഫയൽ 4 രേഖകൾ കാണിക്കുന്നു.
02:46	ഓരോ രേഖയിലും ആദ്യ വരി ഒരുidentifier line ആണ്
02:50	“greater than (>)” ചിഹ്നത്തോടൊപ്പം ഇത് ആരംഭിക്കുന്നു.
02:53	ഇത് പിന്നീട് ഒരു sequence.ആണ്.
02:56	home ഫോൾഡറിൽ “sequence.fasta'”.എന്ന പേരിൽ സേവ് ചെയ്യുക.
03:01	ടെക്സ്റ്റ് എഡിറ്റർ ക്ലോസെ ചെയുക .
03:03	'GenBank' ഫോർമാറ്റിലുള്ള ഫയലുകൾ ഡൌൺലോഡ് ചെയ്യാൻ മുകളിലുള്ള അതേ നടപടികൾ പാലിക്കുക
03:08	നേരത്തെ തിരഞ്ഞെടുത്ത ഫയലുകളിലേയ്ക്ക്
03:12	'ഫയൽ ഫോർമാറ്റ്'GenBank.* എന്നായി തെരഞ്ഞെടുക്കുക.*
03:16	ഒരു ഫയൽ സൃഷ്ടിക്കുക. ഒരു ടെക്സ്റ്റ് എഡിറ്റർ ഉപയോഗിച്ച് തുറക്കുക.
03:21	'GenBank' ഫോർമാറ്റിൽ ലുള്ള ഫയല് 'FASTA' 'ഫയലിനെക്കാള് കൂടുതല് സവിശേഷതകള് ഉള്ളതായി ശ്രദ്ധിക്കുക.
03:27	sequence.gb എന്ന് ഫയൽ സേവ് ചെയ്യുക. ടെക്സ്റ്റ് എഡിറ്റർ അടയ്ക്കുക.
03:34	പ്രകടന ലക്ഷ്യത്തിന് ഒരു 'റെക്കോർഡ്' ഉപയോഗിച്ച് നമുക്ക് ഒരു ഫാസ്റ്റാ ഫയൽ വേണം.
03:39	ഇതിനായി, മുമ്പത്തെ തിരഞ്ഞെടുക്കൽ ചെക്ക് ബോക്സുകളിൽ വീണ്ടും ക്ലിക്ക് ചെയ്യുക.
03:48	ഇപ്പോൾ, “Human insulin gene complete cds” എന്ന ഫയൽ തിരഞ്ഞെടുക്കുക.
03:54	ചെക്ക് ബോക്സിൽ ക്ലിക്കുചെയ്യുക.
03:57	'ഹോം' ഫോൾഡറിൽ ഫയൽ 'സേവ്' നേരത്തെ കാണിച്ചിരിക്കുന്ന അതേ നടപടികൾ പാലിക്കുക.
04:01	"insulin.fasta". ഈ ഫയൽ 'സേവ്' ചെയുക
04:08	ഈ ഫയലുകളിൽ സംഭരിച്ചിട്ടുള്ള ബയോളജിക്കൽ ഡാറ്റ Biopython ലൈബ്രറികൾ ഉപയോഗിച്ച് എക്സ്ട്രാക്റ്റുചെയ്ത് പരിഷ്ക്കരിക്കാൻ കഴിയും.
04:16	വാചകം-എഡിറ്റർ അടയ്ക്കുക.
04:19	ഡാറ്റാ ഫയലുകളിൽ നിന്നും ഡാറ്റ എക്സ്ട്രാചെയ്യുന്നത് Parsing. എന്നറിയപ്പെടുന്നു.
04:23	'SeqIO' മൊഡ്യൂളിലെ 'ഫംഗ്ഷൻ' ഉപയോഗിച്ച് കൂടുതൽ ഫയൽ ഫോർമാറ്റുകൾ പാഴ്സ് ചെയ്യാവുന്നതാണ്.
04:30	'Seqio' മൊഡ്യൂൾ ഏറ്റവും സാധാരണയായി ഉപയോഗിക്കുന്ന പ്രവർത്തനങ്ങൾ: parse, read, write and convert.
04:38	'Ctrl, Alt' , 't' കീകൾ ഒരേസമയം അമർത്തി ടെർമിനൽ തുറക്കൂ.
04:44	"ipython"പ്രോംപ്റ്റിൽ "ipython" ടൈപ്പുചെയ്യുക. എന്റർ അമർത്തുക.
04:51	അടുത്തതായി, Bio പാക്കേജിൽ നിന്ന് "SeqIO" മൊഡ്യൂൾ ഇംപോർട്ട് ചെയുക
04:56	പ്രോംപ്റ്റിൽ,from Bio import SeqIO. ടൈപ്പ് ചെയ്യുക. എന്റർ അമർത്തുക.
05:04	നമ്മൾ ഏറ്റവും പ്രധാനപ്പെട്ട ഫംഗ്ഷൻ“parse”. ആരംഭിക്കും.
05:07	പ്രദർശനത്തിനായി, ഞങ്ങൾ നേരത്തെ തന്നെ ഡൌൺലോഡ് ചെയ്ത നിരവധി റെക്കോർഡ് റെക്കോർഡുകളുള്ള 'FASTA' ഫയൽ ഉപയോഗിക്കും.
05:17	ലളിതമായ 'FASTA' പാഴ്സിങിനായി, പ്രോംപ്റ്റിൽ ഇനിപ്പറയുന്നവ ടൈപ്പ് ചെയ്യുക.
05:22	'Sequence.fasta' 'ഫയലിന്റെ ഉള്ളടക്കം വായിക്കാൻ ഞങ്ങൾ ഇവിടെparseഫങ്ഷൻ ഉപയോഗിക്കുന്നു.
05:30	ഔട്ട്പുട്ടിനായി, record id, , റെക്കോർഡിലെ സീക്വൻസും സീക്വൻസിൻറെ ദൈർഘ്യവും.
05:41	parse ഫങ്ഷൻ സീക്വൻ ഡേറ്റായി Sequence record objects.വായിക്കാൻ ഉപയോഗിക്കുന്നു.
05:48	ഇത് 'ലൂപ്പിനുള്ള' ഉപയോഗിച്ച് സാധാരണയായി ഉപയോഗിക്കുന്നു.
05:52	ഇത് രണ്ട് argumentsസ്വീകരിക്കാവുന്നതാണ്, ആദ്യത്തേത് ഡാറ്റ വായിക്കുന്നതിനുള്ള ഫയൽ നാമമാണ്.
05:59	രണ്ടാമത്തെ ഫയൽ ഫോർമാറ്റ് വ്യക്തമാക്കുന്നു.
06:02	ഔട്ട്പുട്ട് ലഭിക്കുന്നതിന് 'Enter' കീ രണ്ടുതവണ അമർത്തുക.
06:07	ഉബുണ്ടുവിൽ identifier line, , അതിനുശേഷം ഫയലിലുള്ള സീക്വൻസ്, ഫയലിൽ എല്ലാ റെക്കോർഡുകളുടേയും ശ്രേണിയുടെ നീളം എന്നിവയും കാണിക്കുന്നു.
06:21	'FASTA' ഫോർമാറ്റ് അക്ഷരമാല വ്യക്തമാക്കുന്നില്ലെന്ന് ശ്രദ്ധിക്കുക.
06:26	അതിനാൽ, ഔട്ട്പുട്ട് ഒരു DNA sequence.എന്ന് വ്യക്തമാക്കിയിട്ടില്ല.
06:31	'Genbank' ഫയൽ പാഴ്സ് ചെയ്യുന്നതിന് അതേ നടപടികൾ വീണ്ടും ആവർത്തിക്കാവുന്നതാണ്.
06:36	ഡെമോൺസ്ട്രേഷൻ വേണ്ടി നേരത്തെ തന്നെ ഡൌൺലോഡ് ചെയ്തിട്ടുള്ള 'GenBank' ഫയൽ ഞങ്ങൾ ഉപയോഗിക്കും.
06:43	മുമ്പു് ഉപയോഗിച്ചിരുന്ന കോഡ്യുടെ ലൈനുകൾ ലഭ്യമാക്കുന്നതിനായി അപ്പ്-ആരോ കീ അമർത്തുക.
06:49	ഫയലിന്റെ പേര് 'sequence.gb' എന്നതിലേക്ക് മാറ്റുക.
06:53	ഫയൽ ഫോർമാറ്റ്genbank.ലേക്ക് മാറ്റുക.'
06:56	ബാക്കിയുള്ള കോഡ് സമാനമാണ്.
06:58	ഔട്ട്പുട്ട് ലഭിക്കുന്നതിന് 'Enter' രണ്ടുപ്രാവശ്യം അമർത്തുക.
07:03	ഇവിടെ ഉൽപ്പെടുത്തിട്ടുള്ളത് record id,,sequence കൂടാതെ എല്ലാ റെക്കോഡിനുള്ള റെക്കോർഡിനും.
07:12	'GenBank' ഫോർമാറ്റ് ഡിഎൻഎ ശ്രേണി എന്ന നിലയിൽ രേഖപ്പെടുത്തുന്നു.
07:19	അതുപോലെSwiss-prot EMBL ഫിലെസ് അതേ കോഡ് ഉപയോഗിച്ചു് പാഴ്സ് ചെയ്യാവുന്നതാണ്.
07:27	നിങ്ങളുടെ ഫയലിൽ ഒരൊറ്റ റെക്കോർഡ് ഉണ്ടെങ്കിൽ, 'parsing.നുള്ള വരികൾ ടൈപ്പ് ചെയ്യുക.
07:34	ഇവിടെ, മുമ്പ് സംരക്ഷിച്ച 'FASTA' 'ഫയൽ ഒരു റെക്കോർഡുപയോഗിച്ച് ഉപയോഗിക്കും, അതായത്,' insulin.fasta 'ഒരു ഉദാഹരണമായി.\
07:43	parseഫംഗ്ഷനു പകരംread ഫങ്ഷൻ ഉപയോഗിച്ചുവെന്നത് ശ്രദ്ധിക്കുക. എന്റർ അമർത്തുക.
07:50	'Insulin.fasta' 'ന് വേണ്ടിയുള്ള ഉളളടക്കം ഔട്ട്പുട്ട് കാണിക്കുന്നു.
07:55	sequence record object.എന്ന സെക്യുഎൻസ് കാണിക്കുന്നു.
07:59	GI, accession number description.തുടങ്ങിയ മറ്റ് ആട്രിബ്യൂട്ടുകൾ.
08:06	നമുക്ക് ഈ റെക്കോർഡിന്റെ വ്യക്തിഗത ആട്രിബ്യൂട്ടുകൾ താഴെ കാണാം.
08:11	പ്രോംപ്റ്റില്, ടൈപ്പ് ചെയ്യുക: record dot seq എന്റർ അമർത്തുക.
08:18	ഔട്ട്പുട്ട് ഫയലിൽ ഉള്ള സീക്വൻസ് കാണിക്കുന്നു.
08:22	ഈ റെക്കോഡിനുള്ള ഐഡന്റിഫയറുകൾ കാണാൻ, ടൈപ്പ് ചെയ്യുക record dot id. അമർത്തുക 'Enter' .
08:29	ഔട്ട്പുട്ട് GI 'നമ്പർ', 'നമ്പർ', 'അക്സൈഷൻ നമ്പർ' എന്നിവയാണ്.
08:34	താങ്കളുടെ താല്പര്യപ്രകാരം, parseവിശദീകരിച്ചിരിക്കുന്ന ഫങ്ഷൻ ഉപയോഗിക്കാവുന്നതാണ്.
08:40	ഇപ്പോൾ നമുക്ക് സംഗ്രഹിക്കാം.
08:42	ഈ ട്യൂട്ടോറിയലിൽ, നമ്മൾ പഠിച്ചത്: NCBI ഡാറ്റാബേസിൽ നിന്നും FASTA GenBank ഫയലുകൾ ' 'SeqIO' മൊഡ്യൂളിലെ 'parse read ഫക്ഷൻസ്
08:55	'FASTA' , 'GenBank' തുടങ്ങിയ ഫയലുകളിൽ നിന്നും റെക്കോഡ് ഐഡി , വിവരണം, സീക്വൻസുകൾ തുടങ്ങിയ വിവരങ്ങൾ ശേഖരിക്കാൻ.
09:03	ഇപ്പോൾ, അസൈൻമെന്റ്-
09:06	'എഫ്എഎസ്എ' എൻ.സി.ബി.ഐ ഡാറ്റാബേസിൽ നിന്ന് നിങ്ങൾക്കിഷ്ടമുള്ള ന്യൂക്ലിയോടൈഡ് അനുപാതത്തിനായി ഫയലുകൾ.
09:13	സീക്വൻസുകളുടെ ഫയൽ 'റിവേഴ്സ് ഗംഭീര' s ലേക്ക് പരിവർത്തനം ചെയ്യുക.
09:17	നിങ്ങളുടെ പൂർത്തിയാക്കിയ ചുമതലയിൽ ഇനിപ്പറയുന്ന കോഡ് കോഡുകൾ ഉണ്ടായിരിക്കണം.
09:22	'FASTA' ഫയലിൽ നിന്ന് 'ന്യൂക്ലിയോടൈഡ് സീക്വൻസുകളിലേക്ക്' പാഴ്സ് 'ഫങ്ഷൻ' ലോഡ് ചെയ്യുക.
09:28	അടുത്തതായി, 'റിവേഴ്സ് പരിപൂര്ണ്ണ' രീതിയില് നിര്മ്മിച്ച സീക്വന്സ് ഒബ്ജക്റ്റുകള് ഉപയോഗിച്ച് റിവേഴ്സ് പൂര്ത്തിയാക്കലുകള് പ്രിന്റ് ചെയ്യുക.
09:37	താഴെയുള്ള ലിങ്കിലെ വീഡിയോ, സ്പോക്കൺ-ടുട്ടോറിയൽ പ്രൊജക്റ്റിനെ സംഗ്രഹിക്കുന്നു.
09:42	ഇത് ഡൌൺലോഡ് ചെയ്ത് കാണുക.
09:44	സ്പോകെൻ ട്യൂട്ടോറിയൽ പ്രൊജക്റ്റ് ടീം വർക്ക്ഷോപ്പുകൾ നടത്തുന്നു, ഓൺലൈനിൽ പരീക്ഷിക്കുന്നവർക്ക് സർട്ടിഫികറ്റുകൾ നൽകുന്നു.
09:51	കൂടുതൽ വിവരങ്ങൾക്ക്, ദയവായി ഞങ്ങൾക്ക് എഴുതുക.
09:55	സ്പോകെൻ ട്യൂട്ടോറിയൽ പ്രൊജക്റ്റ്, എൻഎംഇഐടി, എംഎച്ച്ആർഡി, ഗവർമെന്റ് ഓഫ് ഇന്ത്യ.
10:01	ഈ ദൗത്യത്തെക്കുറിച്ചുള്ള കൂടുതൽ വിവരങ്ങൾ കാണിച്ചിരിക്കുന്ന ലിങ്കിൽ ലഭ്യമാണ്.
10:06	ഇത് ഐഇറ്റി ബോംബേ യിൽ നിന്ന് വിജി നായർ ആണ്. പങ്കുചേർന്നതിന് നന്ദി.

Contributors and Content Editors

Prena, Vijinair

@@ Line 25: / Line 25: @@
 |-
 | 00:30
-| തന്നിരിക്കുന്ന ലിങ്ക് '' 'പൈത്തൺ ട്യൂട്ടോറിയലുകൾ കാണുക.
+| തന്നിരിക്കുന്ന ലിങ്ക്  പൈത്തൺ ട്യൂട്ടോറിയലുകൾ കാണുക.
 |-
@@ Line 229: / Line 229: @@
 |-
-|05: 07
+|05:07
 |പ്രദർശനത്തിനായി, ഞങ്ങൾ നേരത്തെ തന്നെ ഡൌൺലോഡ് ചെയ്ത നിരവധി റെക്കോർഡ് റെക്കോർഡുകളുള്ള 'FASTA' ഫയൽ ഉപയോഗിക്കും.
@@ Line 368: / Line 368: @@
 |-
 | 08:42
-|ഈ ട്യൂട്ടോറിയലിൽ, നമ്മൾ പഠിച്ചത്: '' '' '' 'എഫ് സി എ എഫ്' '', ജെൻബാങ്ക് ഫയലുകൾ '' 'എൻസിബി ഡാറ്റാബേസ് വെബ്സൈറ്റിൽ നിന്നും' '' പാഴ്സ് '' '' ' '' 'SeqIO' '' മൊഡ്യൂളിലെ '' 'പ്രവർത്തനങ്ങൾ വായിക്കുക
+|ഈ ട്യൂട്ടോറിയലിൽ, നമ്മൾ പഠിച്ചത്: NCBI ഡാറ്റാബേസിൽ നിന്നും FASTA  GenBank  ഫയലുകൾ '' ' ''  '' 'SeqIO' '' മൊഡ്യൂളിലെ '' 'parse   read ഫക്ഷൻസ്
 |-

Difference between revisions of "Biopython/C2/Parsing-Data/Malayalam"

Latest revision as of 16:12, 19 January 2018

Contributors and Content Editors

Navigation menu

Personal tools

Namespaces

Variants

Views

Actions

Search

Navigation

Tools