Difference between revisions of "Biopython/C2/Parsing-Data/Malayalam"
From Script | Spoken-Tutorial
(Created page with "{| Border=1 ! <center>Time</center> ! <center>Narration</center> |- | 00:01 | ഹലോ എല്ലാവരും '''Parsing Data.'''യെക്കുറിച്ചുള...") |
|||
(One intermediate revision by one other user not shown) | |||
Line 25: | Line 25: | ||
|- | |- | ||
| 00:30 | | 00:30 | ||
− | | തന്നിരിക്കുന്ന ലിങ്ക് | + | | തന്നിരിക്കുന്ന ലിങ്ക് പൈത്തൺ ട്യൂട്ടോറിയലുകൾ കാണുക. |
|- | |- | ||
Line 229: | Line 229: | ||
|- | |- | ||
− | |05: 07 | + | |05:07 |
|പ്രദർശനത്തിനായി, ഞങ്ങൾ നേരത്തെ തന്നെ ഡൌൺലോഡ് ചെയ്ത നിരവധി റെക്കോർഡ് റെക്കോർഡുകളുള്ള 'FASTA' ഫയൽ ഉപയോഗിക്കും. | |പ്രദർശനത്തിനായി, ഞങ്ങൾ നേരത്തെ തന്നെ ഡൌൺലോഡ് ചെയ്ത നിരവധി റെക്കോർഡ് റെക്കോർഡുകളുള്ള 'FASTA' ഫയൽ ഉപയോഗിക്കും. | ||
Line 368: | Line 368: | ||
|- | |- | ||
| 08:42 | | 08:42 | ||
− | |ഈ ട്യൂട്ടോറിയലിൽ, നമ്മൾ പഠിച്ചത്: | + | |ഈ ട്യൂട്ടോറിയലിൽ, നമ്മൾ പഠിച്ചത്: NCBI ഡാറ്റാബേസിൽ നിന്നും FASTA GenBank ഫയലുകൾ '' ' '' '' 'SeqIO' '' മൊഡ്യൂളിലെ '' 'parse read ഫക്ഷൻസ് |
|- | |- |
Latest revision as of 16:12, 19 January 2018
|
|
---|---|
00:01 | ഹലോ എല്ലാവരും Parsing Data.യെക്കുറിച്ചുള്ള ഈ ട്യൂട്ടോറിയലിലേക്ക് സ്വാഗതം. |
00:06 | ഈ ടുട്ടോറിയലിൽ, ഞങ്ങൾ 'FASTA' , 'GenBank' ഫയലുകൾ 'NCBI' ഡാറ്റാബേസ് വെബ് സൈറ്റിൽ നിന്നും ഡൌൺലോഡ് ചെയ്യാൻ പഠിക്കും. |
00:14 | 'ഫയൽ ഫംഗ്ഷനുകൾ' ഫങ്ഷൻ Sequence Input/Output മൊഡ്യൂൾ ഉപയോഗിച്ച് ഉപയോഗിക്കുന്നു. |
00:19 | ഈ ട്യൂട്ടോറിയൽ പിന്തുടരുന്നതിന്, നിങ്ങൾ അണ്ടർഗ്രാജുവേറ്റ് ബയോകെമിസ്റ്ററി അല്ലെങ്കിൽ ബയോഇൻഫർമാറ്റിക്സ് പരിചയത്തിലായിരിക്കണം |
00:26 | ബേസിക് പൈത്തൺ പ്രോഗ്രാമിങ്. |
00:30 | തന്നിരിക്കുന്ന ലിങ്ക് പൈത്തൺ ട്യൂട്ടോറിയലുകൾ കാണുക. |
00:34 | ഈ ട്യൂട്ടോറിയൽ രേഖപ്പെടുത്താൻ ഞാൻ ഉപയോഗിക്കുന്നു: * 'ഉബുണ്ടു ഓസ്' 'പതിപ്പ് 14.10 |
00:40 | Python version 2.7.8 |
00:44 | Ipython interpretor version 2.3.0 |
00:48 | Biopython വേർഷൻ 1.64 and * Mozilla Firefox ബ്രൌസർ 35.0. |
00:56 | ജീവശാസ്ത്രത്തിലെ ശാസ്ത്രീയ വിവരങ്ങൾ സാധാരണയായി 'FASTA' , 'GenBank' , 'EMBL' , Swiss-Prot ' |
01:07 | ഡാറ്റ ഫയലുകൾ ഡാറ്റാബേസ് വെബ്സൈറ്റുകളിൽ നിന്ന് ഡൌൺലോഡ് ചെയ്യാവുന്നതാണ്. |
01:12 | ഏതെങ്കിലും വെബ് ബ്രൌസറിൽ താഴെ കൊടുത്തിരിക്കുന്ന വെബ്സൈറ്റ് ലിങ്ക് തുറക്കുക. |
01:17 | ഒരു വെബ് പേജ് തുറക്കുന്നു. |
01:19 | മനുഷ്യന്റെ ഇൻസുലിൻ ജീൻ 'FASTA' , 'GenBank' എന്നീ ഫയലുകൾ നമുക്ക് ഡൌൺലോഡ് ചെയ്യാം. |
01:25 | തിരയൽ ബോക്സിൽ, ടൈപ്പുചെയ്യുക "human insulin", ,Search ബട്ടണിൽ ക്ലിക്കുചെയ്യുക. |
01:31 | മനുഷ്യർ ഇൻസുലിൻ ജീൻ എന്ന പേരിൽ ധാരാളം ഫയലുകൾ കാണിക്കുന്നു. |
01:35 | പ്രദർശനത്തിനായി,“Homo sapiens Insulin mRNA”. എന്ന പേരിൽ 4 ഫയലുകൾ ഞാൻ തിരഞ്ഞെടുക്കും. |
01:43 | 500 base പൈറസ് ഉള്ള ഫയലുകളെ ഞാൻ തിരഞ്ഞെടുക്കും. |
01:48 | ഫയൽ ഡൌൺലോഡ് ചെയ്യുന്നതിനായി ചെക്ക് ബോക്സിൽ ക്ലിക്കുചെയ്യുക. |
01:56 | പേജിന്റെ മുകളിൽ വലത് കോണിലുള്ള " 'അയയ്ക്കുക' '" ഓപ്ഷനിലേക്ക് കഴ്സർ കൊണ്ടുവരിക. |
02:02 | "താഴേയ്ക്കുള്ള അമ്പടയാളം ഉള്ള ചെറിയ ബട്ടണില് അമര്ത്തുക“Send to” ബട്ടണ് ചേര്ക്കുക. |
02:09 | “Choose destination”, എന്ന തലക്കെട്ടിൽFile ഓപ്ഷനിൽ ക്ലിക്ക് ചെയ്യുക. |
02:13 | ഈ ഫയൽformatഡ്രോപ്പ്-ഡൗൺ ലിസ്റ്റ് ബോക്സിൽ നൽകിയിരിക്കുന്ന ഏതൊരു ഫയൽ ഫോർമാറ്റിലും 'സേവ്' സേവ് ചെയ്യാം. |
02:21 | തന്നിരിക്കുന്ന ഐച്ഛികങ്ങളിൽ നിന്ന് 'FASTA' 'തിരഞ്ഞെടുക്കുക. |
02:25 | പിന്നെ Create file ഓപ്ഷൻ ക്ലിക്ക് ചെയ്യുക. |
02:29 | സ്ക്രീനില് ഒരു ഡയലോഗ് ബോക്സ് പ്രത്യക്ഷപ്പെടുന്നു. |
02: 32 | Open with OK. ക്ലിക്കുചെയ്യുക.' |
02:36 | text editor.ൽ ഒരു ഫയൽ തുറക്കുന്നു. |
02:39 | ഡൌൺലോഡ് ചെയ്യുന്നതിന് നാല് ഫയലുകൾ ഞങ്ങൾ തിരഞ്ഞെടുത്തിരുന്നതിനാൽ ഫയൽ 4 രേഖകൾ കാണിക്കുന്നു. |
02:46 | ഓരോ രേഖയിലും ആദ്യ വരി ഒരുidentifier line ആണ് |
02:50 | “greater than (>)” ചിഹ്നത്തോടൊപ്പം ഇത് ആരംഭിക്കുന്നു. |
02:53 | ഇത് പിന്നീട് ഒരു sequence.ആണ്. |
02:56 | home ഫോൾഡറിൽ “sequence.fasta'”.എന്ന പേരിൽ സേവ് ചെയ്യുക. |
03:01 | ടെക്സ്റ്റ് എഡിറ്റർ ക്ലോസെ ചെയുക . |
03:03 | 'GenBank' ഫോർമാറ്റിലുള്ള ഫയലുകൾ ഡൌൺലോഡ് ചെയ്യാൻ മുകളിലുള്ള അതേ നടപടികൾ പാലിക്കുക |
03:08 | നേരത്തെ തിരഞ്ഞെടുത്ത ഫയലുകളിലേയ്ക്ക് |
03:12 | 'ഫയൽ ഫോർമാറ്റ്'GenBank. എന്നായി തെരഞ്ഞെടുക്കുക. |
03:16 | ഒരു ഫയൽ സൃഷ്ടിക്കുക. ഒരു ടെക്സ്റ്റ് എഡിറ്റർ ഉപയോഗിച്ച് തുറക്കുക. |
03:21 | 'GenBank' ഫോർമാറ്റിൽ ലുള്ള ഫയല് 'FASTA' 'ഫയലിനെക്കാള് കൂടുതല് സവിശേഷതകള് ഉള്ളതായി ശ്രദ്ധിക്കുക. |
03:27 | sequence.gb എന്ന് ഫയൽ സേവ് ചെയ്യുക. ടെക്സ്റ്റ് എഡിറ്റർ അടയ്ക്കുക. |
03:34 | പ്രകടന ലക്ഷ്യത്തിന് ഒരു 'റെക്കോർഡ്' ഉപയോഗിച്ച് നമുക്ക് ഒരു ഫാസ്റ്റാ ഫയൽ വേണം. |
03:39 | ഇതിനായി, മുമ്പത്തെ തിരഞ്ഞെടുക്കൽ ചെക്ക് ബോക്സുകളിൽ വീണ്ടും ക്ലിക്ക് ചെയ്യുക. |
03:48 | ഇപ്പോൾ, “Human insulin gene complete cds” എന്ന ഫയൽ തിരഞ്ഞെടുക്കുക. |
03:54 | ചെക്ക് ബോക്സിൽ ക്ലിക്കുചെയ്യുക. |
03:57 | 'ഹോം' ഫോൾഡറിൽ ഫയൽ 'സേവ്' നേരത്തെ കാണിച്ചിരിക്കുന്ന അതേ നടപടികൾ പാലിക്കുക. |
04:01 | "insulin.fasta". ഈ ഫയൽ 'സേവ്' ചെയുക |
04:08 | ഈ ഫയലുകളിൽ സംഭരിച്ചിട്ടുള്ള ബയോളജിക്കൽ ഡാറ്റ Biopython ലൈബ്രറികൾ ഉപയോഗിച്ച് എക്സ്ട്രാക്റ്റുചെയ്ത് പരിഷ്ക്കരിക്കാൻ കഴിയും. |
04:16 | വാചകം-എഡിറ്റർ അടയ്ക്കുക. |
04:19 | ഡാറ്റാ ഫയലുകളിൽ നിന്നും ഡാറ്റ എക്സ്ട്രാചെയ്യുന്നത് Parsing. എന്നറിയപ്പെടുന്നു. |
04:23 | 'SeqIO' മൊഡ്യൂളിലെ 'ഫംഗ്ഷൻ' ഉപയോഗിച്ച് കൂടുതൽ ഫയൽ ഫോർമാറ്റുകൾ പാഴ്സ് ചെയ്യാവുന്നതാണ്. |
04:30 | 'Seqio' മൊഡ്യൂൾ ഏറ്റവും സാധാരണയായി ഉപയോഗിക്കുന്ന പ്രവർത്തനങ്ങൾ: parse, read, write and convert. |
04:38 | 'Ctrl, Alt' , 't' കീകൾ ഒരേസമയം അമർത്തി ടെർമിനൽ തുറക്കൂ. |
04:44 | "ipython"പ്രോംപ്റ്റിൽ "ipython" ടൈപ്പുചെയ്യുക. എന്റർ അമർത്തുക. |
04:51 | അടുത്തതായി, Bio പാക്കേജിൽ നിന്ന് "SeqIO" മൊഡ്യൂൾ ഇംപോർട്ട് ചെയുക |
04:56 | പ്രോംപ്റ്റിൽ,from Bio import SeqIO. ടൈപ്പ് ചെയ്യുക. എന്റർ അമർത്തുക. |
05:04 | നമ്മൾ ഏറ്റവും പ്രധാനപ്പെട്ട ഫംഗ്ഷൻ“parse”. ആരംഭിക്കും. |
05:07 | പ്രദർശനത്തിനായി, ഞങ്ങൾ നേരത്തെ തന്നെ ഡൌൺലോഡ് ചെയ്ത നിരവധി റെക്കോർഡ് റെക്കോർഡുകളുള്ള 'FASTA' ഫയൽ ഉപയോഗിക്കും. |
05:17 | ലളിതമായ 'FASTA' പാഴ്സിങിനായി, പ്രോംപ്റ്റിൽ ഇനിപ്പറയുന്നവ ടൈപ്പ് ചെയ്യുക. |
05:22 | 'Sequence.fasta' 'ഫയലിന്റെ ഉള്ളടക്കം വായിക്കാൻ ഞങ്ങൾ ഇവിടെparseഫങ്ഷൻ ഉപയോഗിക്കുന്നു. |
05:30 | ഔട്ട്പുട്ടിനായി, record id, , റെക്കോർഡിലെ സീക്വൻസും സീക്വൻസിൻറെ ദൈർഘ്യവും. |
05:41 | parse ഫങ്ഷൻ സീക്വൻ ഡേറ്റായി Sequence record objects.വായിക്കാൻ ഉപയോഗിക്കുന്നു. |
05:48 | ഇത് 'ലൂപ്പിനുള്ള' ഉപയോഗിച്ച് സാധാരണയായി ഉപയോഗിക്കുന്നു. |
05:52 | ഇത് രണ്ട് argumentsസ്വീകരിക്കാവുന്നതാണ്, ആദ്യത്തേത് ഡാറ്റ വായിക്കുന്നതിനുള്ള ഫയൽ നാമമാണ്. |
05:59 | രണ്ടാമത്തെ ഫയൽ ഫോർമാറ്റ് വ്യക്തമാക്കുന്നു. |
06:02 | ഔട്ട്പുട്ട് ലഭിക്കുന്നതിന് 'Enter' കീ രണ്ടുതവണ അമർത്തുക. |
06:07 | ഉബുണ്ടുവിൽ identifier line, , അതിനുശേഷം ഫയലിലുള്ള സീക്വൻസ്, ഫയലിൽ എല്ലാ റെക്കോർഡുകളുടേയും ശ്രേണിയുടെ നീളം എന്നിവയും കാണിക്കുന്നു. |
06:21 | 'FASTA' ഫോർമാറ്റ് അക്ഷരമാല വ്യക്തമാക്കുന്നില്ലെന്ന് ശ്രദ്ധിക്കുക. |
06:26 | അതിനാൽ, ഔട്ട്പുട്ട് ഒരു DNA sequence.എന്ന് വ്യക്തമാക്കിയിട്ടില്ല. |
06:31 | 'Genbank' ഫയൽ പാഴ്സ് ചെയ്യുന്നതിന് അതേ നടപടികൾ വീണ്ടും ആവർത്തിക്കാവുന്നതാണ്. |
06:36 | ഡെമോൺസ്ട്രേഷൻ വേണ്ടി നേരത്തെ തന്നെ ഡൌൺലോഡ് ചെയ്തിട്ടുള്ള 'GenBank' ഫയൽ ഞങ്ങൾ ഉപയോഗിക്കും. |
06:43 | മുമ്പു് ഉപയോഗിച്ചിരുന്ന കോഡ്യുടെ ലൈനുകൾ ലഭ്യമാക്കുന്നതിനായി അപ്പ്-ആരോ കീ അമർത്തുക. |
06:49 | ഫയലിന്റെ പേര് 'sequence.gb' എന്നതിലേക്ക് മാറ്റുക. |
06:53 | ഫയൽ ഫോർമാറ്റ്genbank.ലേക്ക് മാറ്റുക.' |
06:56 | ബാക്കിയുള്ള കോഡ് സമാനമാണ്. |
06:58 | ഔട്ട്പുട്ട് ലഭിക്കുന്നതിന് 'Enter' രണ്ടുപ്രാവശ്യം അമർത്തുക. |
07:03 | ഇവിടെ ഉൽപ്പെടുത്തിട്ടുള്ളത് record id,,sequence കൂടാതെ എല്ലാ റെക്കോഡിനുള്ള റെക്കോർഡിനും. |
07:12 | 'GenBank' ഫോർമാറ്റ് ഡിഎൻഎ ശ്രേണി എന്ന നിലയിൽ രേഖപ്പെടുത്തുന്നു. |
07:19 | അതുപോലെSwiss-prot EMBL ഫിലെസ് അതേ കോഡ് ഉപയോഗിച്ചു് പാഴ്സ് ചെയ്യാവുന്നതാണ്. |
07:27 | നിങ്ങളുടെ ഫയലിൽ ഒരൊറ്റ റെക്കോർഡ് ഉണ്ടെങ്കിൽ, 'parsing.നുള്ള വരികൾ ടൈപ്പ് ചെയ്യുക. |
07:34 | ഇവിടെ, മുമ്പ് സംരക്ഷിച്ച 'FASTA' 'ഫയൽ ഒരു റെക്കോർഡുപയോഗിച്ച് ഉപയോഗിക്കും, അതായത്,' insulin.fasta 'ഒരു ഉദാഹരണമായി.\ |
07:43 | parseഫംഗ്ഷനു പകരംread ഫങ്ഷൻ ഉപയോഗിച്ചുവെന്നത് ശ്രദ്ധിക്കുക. എന്റർ അമർത്തുക. |
07:50 | 'Insulin.fasta' 'ന് വേണ്ടിയുള്ള ഉളളടക്കം ഔട്ട്പുട്ട് കാണിക്കുന്നു. |
07:55 | sequence record object.എന്ന സെക്യുഎൻസ് കാണിക്കുന്നു. |
07:59 | GI, accession number description.തുടങ്ങിയ മറ്റ് ആട്രിബ്യൂട്ടുകൾ. |
08:06 | നമുക്ക് ഈ റെക്കോർഡിന്റെ വ്യക്തിഗത ആട്രിബ്യൂട്ടുകൾ താഴെ കാണാം. |
08:11 | പ്രോംപ്റ്റില്, ടൈപ്പ് ചെയ്യുക: record dot seq എന്റർ അമർത്തുക. |
08:18 | ഔട്ട്പുട്ട് ഫയലിൽ ഉള്ള സീക്വൻസ് കാണിക്കുന്നു. |
08:22 | ഈ റെക്കോഡിനുള്ള ഐഡന്റിഫയറുകൾ കാണാൻ, ടൈപ്പ് ചെയ്യുക record dot id. അമർത്തുക 'Enter' . |
08:29 | ഔട്ട്പുട്ട് GI 'നമ്പർ', 'നമ്പർ', 'അക്സൈഷൻ നമ്പർ' എന്നിവയാണ്. |
08:34 | താങ്കളുടെ താല്പര്യപ്രകാരം, parseവിശദീകരിച്ചിരിക്കുന്ന ഫങ്ഷൻ ഉപയോഗിക്കാവുന്നതാണ്. |
08:40 | ഇപ്പോൾ നമുക്ക് സംഗ്രഹിക്കാം. |
08:42 | ഈ ട്യൂട്ടോറിയലിൽ, നമ്മൾ പഠിച്ചത്: NCBI ഡാറ്റാബേസിൽ നിന്നും FASTA GenBank ഫയലുകൾ ' 'SeqIO' മൊഡ്യൂളിലെ 'parse read ഫക്ഷൻസ് |
08:55 | 'FASTA' , 'GenBank' തുടങ്ങിയ ഫയലുകളിൽ നിന്നും റെക്കോഡ് ഐഡി , വിവരണം, സീക്വൻസുകൾ തുടങ്ങിയ വിവരങ്ങൾ ശേഖരിക്കാൻ. |
09:03 | ഇപ്പോൾ, അസൈൻമെന്റ്- |
09:06 | 'എഫ്എഎസ്എ' എൻ.സി.ബി.ഐ ഡാറ്റാബേസിൽ നിന്ന് നിങ്ങൾക്കിഷ്ടമുള്ള ന്യൂക്ലിയോടൈഡ് അനുപാതത്തിനായി ഫയലുകൾ. |
09:13 | സീക്വൻസുകളുടെ ഫയൽ 'റിവേഴ്സ് ഗംഭീര' s ലേക്ക് പരിവർത്തനം ചെയ്യുക. |
09:17 | നിങ്ങളുടെ പൂർത്തിയാക്കിയ ചുമതലയിൽ ഇനിപ്പറയുന്ന കോഡ് കോഡുകൾ ഉണ്ടായിരിക്കണം. |
09:22 | 'FASTA' ഫയലിൽ നിന്ന് 'ന്യൂക്ലിയോടൈഡ് സീക്വൻസുകളിലേക്ക്' പാഴ്സ് 'ഫങ്ഷൻ' ലോഡ് ചെയ്യുക. |
09:28 | അടുത്തതായി, 'റിവേഴ്സ് പരിപൂര്ണ്ണ' രീതിയില് നിര്മ്മിച്ച സീക്വന്സ് ഒബ്ജക്റ്റുകള് ഉപയോഗിച്ച് റിവേഴ്സ് പൂര്ത്തിയാക്കലുകള് പ്രിന്റ് ചെയ്യുക. |
09:37 | താഴെയുള്ള ലിങ്കിലെ വീഡിയോ, സ്പോക്കൺ-ടുട്ടോറിയൽ പ്രൊജക്റ്റിനെ സംഗ്രഹിക്കുന്നു. |
09:42 | ഇത് ഡൌൺലോഡ് ചെയ്ത് കാണുക. |
09:44 | സ്പോകെൻ ട്യൂട്ടോറിയൽ പ്രൊജക്റ്റ് ടീം വർക്ക്ഷോപ്പുകൾ നടത്തുന്നു, ഓൺലൈനിൽ പരീക്ഷിക്കുന്നവർക്ക് സർട്ടിഫികറ്റുകൾ നൽകുന്നു. |
09:51 | കൂടുതൽ വിവരങ്ങൾക്ക്, ദയവായി ഞങ്ങൾക്ക് എഴുതുക. |
09:55 | സ്പോകെൻ ട്യൂട്ടോറിയൽ പ്രൊജക്റ്റ്, എൻഎംഇഐടി, എംഎച്ച്ആർഡി, ഗവർമെന്റ് ഓഫ് ഇന്ത്യ. |
10:01 | ഈ ദൗത്യത്തെക്കുറിച്ചുള്ള കൂടുതൽ വിവരങ്ങൾ കാണിച്ചിരിക്കുന്ന ലിങ്കിൽ ലഭ്യമാണ്. |
10:06 | ഇത് ഐഇറ്റി ബോംബേ യിൽ നിന്ന് വിജി നായർ ആണ്. പങ്കുചേർന്നതിന് നന്ദി. |