Biopython/C2/Blast/Tamil
From Script | Spoken-Tutorial
|
|
---|---|
00:01 | Biopython கருவிகளைப் பயன்படுத்தி, செய்யும் BLAST குறித்த இந்த டுடோரியலுக்கு நல்வரவு. |
00:06 | இந்த டுடோரியலில் நாம் கற்கப்போவது: Biopython கருவிகளைப் பயன்படுத்தி, query sequence'க்கு, BLASTஐ run செய்வது |
00:13 | மேலும் ஆய்வுக்கு, BLAST outputஐ parse செய்வது. |
00:17 | இந்த டுடோரியலை புரிந்து கொள்ள, இளங்கலை Biochemistry அல்லது Bioinformatics , |
00:24 | மற்றும், அடிப்படை Python programming பற்றி தெரிந்திருக்க வேண்டும். |
00:27 | கொடுக்கப்பட்டுள்ள இணைப்பில் உள்ள Python டுடோரியல்களை பார்க்கவும். |
00:31 | இந்த டுடோரியலை பதிவு செய்ய, நான் பயன்படுத்துவது: Ubuntu OS Operating System பதிப்பு 14.10 |
00:37 | Python பதிப்பு 2.7.8 |
00:41 | Ipython interpreter பதிப்பு 2.3.0 மற்றும் |
00:46 | Biopython பதிப்பு 1.64, மற்றும் ஒரு internet இணைப்பு |
00:52 | BLAST என்பது Basic Local Alignment Search Toolன் சுருக்கமாகும். |
00:57 | அது, Sequenceன் தகவலை ஒப்பிடுவதற்கான ஒரு algorithm ஆகும். |
01:02 | இந்த program, nucleotide அல்லது protein sequenceகளை, databaseல் இருக்கும் sequenceகளுடன் ஒப்பிட்டு, matchகளின், புள்ளியியல் முக்கியத்துவத்தை கணக்கிடுகிறது. |
01:14 | BLASTஐ run செய்ய இரண்டு வெவ்வேறு வழிகள் உள்ளன: |
01:17 | உங்கள் கணிணியில் உள்ள local BLAST அல்லது NCBI serverகள் வழியாக, internetன் மூலம் BLASTஐ run செய்வது. |
01:24 | Biopythonல், BLASTஐ run செய்வதில், இரண்டு படிகள் உள்ளன. |
01:28 | முதலில், உங்கள் query sequenceக்கு, BLASTஐ run செய்து, outputஐ பெறுவது. |
01:33 | இரண்டாவது, மேலும் ஆய்வுக்கு, BLAST outputஐ parse செய்வது. |
01:38 | நாம், terminalஐ திறந்து, ஒரு nucleotide sequenceக்கு, BLASTஐ run செய்வோம். |
01:43 | Terminalஐ திறக்க, Ctrl, Alt மற்றும் t keyகளை ஒன்றாக அழுத்தவும். |
01:48 | Promptல் டைப் செய்க: ipython", பின் Enterஐ அழுத்தவும். |
01:52 | இந்த டுடோரியலில், NCBI BLAST சேவையை பயன்படுத்தி, internetன் மூலம் BLASTஐ எப்படி run செய்வது என்று காட்டுகிறேன். |
02:01 | Promptல் பின்வருவனவற்றை டைப் செய்க: from Bio.Blast Import NCBIWWW, பின் Enterஐ அழுத்தவும். |
02:14 | அடுத்து, internetன் மூலம் BLASTஐ run செய்ய, Promptல் பின்வருவனவற்றை டைப் செய்க.
result= NCBIWWW.qblast("blastn","nt","186429"). |
02:20 | NCBIWWW moduleலில் இருக்கும், Qblast function ஐ, நாம் பயன்படுத்துவோம். |
02:25 | Qblast function, மூன்று argumentகளை எடுத்துக் கொள்கிறது: |
02:29 | முதல் argument, searchக்கு பயன்படுத்த வேண்டிய blast program ஆகும். |
02:33 | இரண்டாவது, search செய்ய வேண்டிய databaseகளை குறிக்கிறது. |
02:38 | மூன்றாவது argument, உங்கள் query sequence ஆகும். |
02:43 | Query sequenceக்கான input, GI எண் அல்லது ஒரு FASTA fileலின் வடிவத்திலோ இருக்கலாம். அல்லது அது ஒரு sequence record objectஆகவும் இருக்கலாம். |
02:53 | இதை செய்து காட்டுவதற்கு, ஒரு nucleotide sequenceக்கு, GI எண்ணை நான் பயன்படுத்துகிறேன். |
02:58 | Insulinனின், nucleotide sequence க்கான GI number இது. |
03:03 | Qblast function, வேறு பல option argumentகளையும் எடுத்துக் கொள்கிறது. |
03:09 | நீங்கள் BLAST web pageல் set செய்யக்கூடிய வெவ்வேறு parameterகளுக்கு, இந்த argumentகள் ஒப்பானதாக இருக்கும். |
03:15 | Qblast function, BLASTன் முடிவுகளை, xml formatல் return செய்யும். |
03:20 | Terminalலுக்கு திரும்பவும். |
03:22 | நமது query sequence, ஒரு nucleotideஆ அல்லது protein sequenceஆ என்பதை பொறுத்து, |
03:25 | அதற்கான Blast programஐ பயன்படுத்த வேண்டும். |
03:30 | நமது query , ஒரு nucleotide என்பதால், நாம் blastn programஐ பயன்படுத்துவோம், மற்றும், "nt", nucleotide databaseஐ குறிக்கிறது. |
03:39 | இதற்கான விவரங்கள், NCBI BLAST webpageல் உள்ளன. |
03:45 | Blast output, result variableலில், ஒரு xml fileலின் வடிவத்தில் சேமிக்கப்படுகிறது. |
03:51 | Enterஐ அழுத்தவும். |
03:53 | உங்கள் internetன் வேகத்தைப் பொறுத்து, BLAST searchஐ முடிக்க சில நிமிடங்கள் எடுக்கலாம். |
03:59 | மேலும் தொடருவதற்கு முன்பு, xml fileஐ, diskல் சேமிப்பது முக்கியம். |
04:05 | xml fileஐ, சேமிக்க, பின்வரும் வரிகளை டைப் செய்யவும். |
04:09 | இந்த code வரிகள், searchன் முடிவை, blast.xml என, home folderல் சேமிக்கும். |
04:18 | உங்கள் home folderக்கு சென்று, fileஐ கண்டறியவும். |
04:21 | Fileஐ க்ளிக் செய்து, அதன் contentகளை சரி பார்க்கவும். |
04:30 | ஒரு FASTA fileஐ, queryஆக பயன்படுத்த, இந்த text fileலில் காட்டப்பட்டுள்ள codeஐ பயன்படுத்தவும். |
04:36 | ஒரு FASTA fileலில் இருந்து, sequence record objectஐ, queryஆக பயன்படுத்த வேண்டுமெனில், அதற்கான code இது. |
04:42 | Terminalலுக்கு திரும்பவும். |
04:44 | அடுத்த படி, dataஐ extract செய்ய, fileஐ parse செய்வது. |
04:48 | Parsingல் முதல் படி, inputக்கு, xml fileஐ திறப்பது. |
04:53 | Promptல் பின்வருவனவற்றை டைப் செய்க. Enterஐ அழுத்தவும். |
04:57 | அடுத்து, "Bio.Blast" packageலில் இருந்து, NCBIXML moduleஐ, import செய்யவும். |
05:05 | Enterஐ அழுத்தவும். |
05:07 | Blast output ஐ, parse செய்ய, பின்வரும் வரிகளை டைப் செய்யவும். |
05:11 | BLAST outputல் இருந்து, நீங்கள் extract செய்ய வேண்டிய, அனைத்து தகவல்களையும் ஒரு BLAST record கொண்டிருக்கிறது. |
05:18 | நம் blast reportல் இருக்கும், குறிப்பிட்ட நிலைக்கு மேல் உள்ள எல்லா hitகள் பற்றிய சில தகவல்களை நாம் print செய்வோம். |
05:27 | பின்வரும் codeஐ டைப் செய்யவும். |
05:30 | ஒரு match குறிப்பிடத்தக்கதாக இருக்கவேண்டுமெனில், expect score, 0.01க்கு குறைவாக இருக்கவேண்டும். |
05:37 | ஒவ்வொரு hsp, அதாவது high scoring pairக்கும், title, length, hsp score, gaps மற்றும் expect value, நமக்கு கிடைக்கிறது. |
05:49 | Queryஐ கொண்டுள்ள stringகள், align செய்யப்பட்ட database sequence, மற்றும்,
match மற்றும் mismatch positionகளை குறிப்பிடும் stringகள் இவைகளையும் நாம் print செய்வோம். |
06:02 | Outputஐ பெற, Enter keyஐ இருமுறை அழுத்தவும். |
06:05 | Outputஐ கவனிக்கவும். |
06:09 | ஒவ்வொரு alignment க்கும், length, score, gaps, evalue மற்றும் stringகள் நம்மிடம் உள்ளன. |
06:16 | Bio.Blast packageல் இருக்கும், மற்ற functionகளை பயன்படுத்தி, தேவையான தகவல்களை நீங்கள் extract செய்யலாம். |
06:24 | நாம் இந்த டுடோரியலின் முடிவுக்கு வந்துவிட்டோம். சுருங்கசொல்ல, |
06:27 | இந்த டுடோரியலில், GI எண்ணை பயன்படுத்தி, query nucleotide sequenceக்கு , BLASTஐ run செய்யவும், |
06:36 | Bio.Blast.Record moduleஐ பயன்படுத்தி, BLAST outputஐ parse செய்யவும் கற்றோம். |
06:43 | பயிற்சியாக, உங்களுக்கு விருப்பமான protein sequenceக்கு, BLAST Searchஐ run செய்யவும். |
06:50 | Output fileஐ சேமித்து, அதில் இருக்கும் dataஐ parse செய்யவும். |
06:55 | இந்த fileலில் காட்டப்பட்டுள்ளபடி, நீங்கள் செய்த பயிற்சி பின்வரும் codeன் வரிகளைப் பெற்றிருக்க வேண்டும். |
07:01 | Codeஐ கவனிக்கவும். நமது query, protein sequenceஆக இருப்பதனால், நாம், blastp program மற்றும், "nr", அதாவது, BLAST searchக்கான, non-redundant protein databaseஐ பயன்படுத்தி இருக்கிறோம். |
07:16 | பின்வரும் இணைப்பில் உள்ள வீடியோ ஸ்போகன் டுடோரியல் திட்டத்தை சுருங்க சொல்கிறது. |
07:20 | அதை தரவிறக்கி காணவும். |
07:22 | ஸ்போகன் டுடோரியல் திட்டக்குழு செய்முறை வகுப்புகள் நடத்தி இணையத்தில் பரீட்சை எழுதி தேர்வோருக்கு சான்றிதழ்கள் தருகிறது. |
07:30 | மேலும் விவரங்களுக்கு எங்களுக்கு மின்னஞ்சல் செய்யவும். |
07:33 | இந்திய அரசாங்கத்தின், NMEICT, MHRD, ஸ்போகன் டுடோரியல் திட்டத்திற்கு ஆதரவு அளிக்கிறது. |
07:40 | மேலும் விவரங்களுக்கு, கீழ்கண்ட இணைப்பை பார்க்கவும். |
07:45 | இந்த டுடோரியலை தமிழாக்கம் செய்தது ஜெயஶீ. குரல் கொடுத்தது..... நன்றி. |