Biopython/C2/Blast/Tamil

From Script | Spoken-Tutorial
Revision as of 12:22, 15 March 2017 by Priyacst (Talk | contribs)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to: navigation, search
Time
Narration
00:01 Biopython கருவிகளைப் பயன்படுத்தி, செய்யும் BLAST குறித்த இந்த டுடோரியலுக்கு நல்வரவு.
00:06 இந்த டுடோரியலில் நாம் கற்கப்போவது: Biopython கருவிகளைப் பயன்படுத்தி, query sequence'க்கு, BLASTrun செய்வது
00:13 மேலும் ஆய்வுக்கு, BLAST outputஐ parse செய்வது.
00:17 இந்த டுடோரியலை புரிந்து கொள்ள, இளங்கலை Biochemistry அல்லது Bioinformatics ,
00:24 மற்றும், அடிப்படை Python programming பற்றி தெரிந்திருக்க வேண்டும்.
00:27 கொடுக்கப்பட்டுள்ள இணைப்பில் உள்ள Python டுடோரியல்களை பார்க்கவும்.
00:31 இந்த டுடோரியலை பதிவு செய்ய, நான் பயன்படுத்துவது: Ubuntu OS Operating System பதிப்பு 14.10
00:37 Python பதிப்பு 2.7.8
00:41 Ipython interpreter பதிப்பு 2.3.0 மற்றும்
00:46 Biopython பதிப்பு 1.64, மற்றும் ஒரு internet இணைப்பு
00:52 BLAST என்பது Basic Local Alignment Search Toolன் சுருக்கமாகும்.
00:57 அது, Sequenceன் தகவலை ஒப்பிடுவதற்கான ஒரு algorithm ஆகும்.
01:02 இந்த program, nucleotide அல்லது protein sequenceகளை, databaseல் இருக்கும் sequenceகளுடன் ஒப்பிட்டு, matchகளின், புள்ளியியல் முக்கியத்துவத்தை கணக்கிடுகிறது.
01:14 BLASTஐ run செய்ய இரண்டு வெவ்வேறு வழிகள் உள்ளன:
01:17 உங்கள் கணிணியில் உள்ள local BLAST அல்லது NCBI serverகள் வழியாக, internetன் மூலம் BLASTஐ run செய்வது.
01:24 Biopythonல், BLASTஐ run செய்வதில், இரண்டு படிகள் உள்ளன.
01:28 முதலில், உங்கள் query sequenceக்கு, BLASTஐ run செய்து, outputஐ பெறுவது.
01:33 இரண்டாவது, மேலும் ஆய்வுக்கு, BLAST outputஐ parse செய்வது.
01:38 நாம், terminalஐ திறந்து, ஒரு nucleotide sequenceக்கு, BLASTஐ run செய்வோம்.
01:43 Terminalஐ திறக்க, Ctrl, Alt மற்றும் t keyகளை ஒன்றாக அழுத்தவும்.
01:48 Promptல் டைப் செய்க: ipython", பின் Enterஐ அழுத்தவும்.
01:52 இந்த டுடோரியலில், NCBI BLAST சேவையை பயன்படுத்தி, internetன் மூலம் BLASTஐ எப்படி run செய்வது என்று காட்டுகிறேன்.
02:01 Promptல் பின்வருவனவற்றை டைப் செய்க: from Bio.Blast Import NCBIWWW, பின் Enterஐ அழுத்தவும்.
02:14 அடுத்து, internetன் மூலம் BLASTஐ run செய்ய, Promptல் பின்வருவனவற்றை டைப் செய்க.

result= NCBIWWW.qblast("blastn","nt","186429").

02:20 NCBIWWW moduleலில் இருக்கும், Qblast function ஐ, நாம் பயன்படுத்துவோம்.
02:25 Qblast function, மூன்று argumentகளை எடுத்துக் கொள்கிறது:
02:29 முதல் argument, searchக்கு பயன்படுத்த வேண்டிய blast program ஆகும்.
02:33 இரண்டாவது, search செய்ய வேண்டிய databaseகளை குறிக்கிறது.
02:38 மூன்றாவது argument, உங்கள் query sequence ஆகும்.
02:43 Query sequenceக்கான input, GI எண் அல்லது ஒரு FASTA fileலின் வடிவத்திலோ இருக்கலாம். அல்லது அது ஒரு sequence record objectஆகவும் இருக்கலாம்.
02:53 இதை செய்து காட்டுவதற்கு, ஒரு nucleotide sequenceக்கு, GI எண்ணை நான் பயன்படுத்துகிறேன்.
02:58 Insulinனின், nucleotide sequence க்கான GI number இது.
03:03 Qblast function, வேறு பல option argumentகளையும் எடுத்துக் கொள்கிறது.
03:09 நீங்கள் BLAST web pageல் set செய்யக்கூடிய வெவ்வேறு parameterகளுக்கு, இந்த argumentகள் ஒப்பானதாக இருக்கும்.
03:15 Qblast function, BLASTன் முடிவுகளை, xml formatல் return செய்யும்.
03:20 Terminalலுக்கு திரும்பவும்.
03:22 நமது query sequence, ஒரு nucleotideஆ அல்லது protein sequenceஆ என்பதை பொறுத்து,
03:25 அதற்கான Blast programஐ பயன்படுத்த வேண்டும்.
03:30 நமது query , ஒரு nucleotide என்பதால், நாம் blastn programஐ பயன்படுத்துவோம், மற்றும், "nt", nucleotide databaseஐ குறிக்கிறது.
03:39 இதற்கான விவரங்கள், NCBI BLAST webpageல் உள்ளன.
03:45 Blast output, result variableலில், ஒரு xml fileலின் வடிவத்தில் சேமிக்கப்படுகிறது.
03:51 Enterஐ அழுத்தவும்.
03:53 உங்கள் internetன் வேகத்தைப் பொறுத்து, BLAST searchஐ முடிக்க சில நிமிடங்கள் எடுக்கலாம்.
03:59 மேலும் தொடருவதற்கு முன்பு, xml fileஐ, diskல் சேமிப்பது முக்கியம்.
04:05 xml fileஐ, சேமிக்க, பின்வரும் வரிகளை டைப் செய்யவும்.
04:09 இந்த code வரிகள், searchன் முடிவை, blast.xml என, home folderல் சேமிக்கும்.
04:18 உங்கள் home folderக்கு சென்று, fileஐ கண்டறியவும்.
04:21 Fileஐ க்ளிக் செய்து, அதன் contentகளை சரி பார்க்கவும்.
04:30 ஒரு FASTA fileஐ, queryஆக பயன்படுத்த, இந்த text fileலில் காட்டப்பட்டுள்ள codeஐ பயன்படுத்தவும்.
04:36 ஒரு FASTA fileலில் இருந்து, sequence record objectஐ, queryஆக பயன்படுத்த வேண்டுமெனில், அதற்கான code இது.
04:42 Terminalலுக்கு திரும்பவும்.
04:44 அடுத்த படி, dataஐ extract செய்ய, fileஐ parse செய்வது.
04:48 Parsingல் முதல் படி, inputக்கு, xml fileஐ திறப்பது.
04:53 Promptல் பின்வருவனவற்றை டைப் செய்க. Enterஐ அழுத்தவும்.
04:57 அடுத்து, "Bio.Blast" packageலில் இருந்து, NCBIXML moduleஐ, import செய்யவும்.
05:05 Enterஐ அழுத்தவும்.
05:07 Blast output ஐ, parse செய்ய, பின்வரும் வரிகளை டைப் செய்யவும்.
05:11 BLAST outputல் இருந்து, நீங்கள் extract செய்ய வேண்டிய, அனைத்து தகவல்களையும் ஒரு BLAST record கொண்டிருக்கிறது.
05:18 நம் blast reportல் இருக்கும், குறிப்பிட்ட நிலைக்கு மேல் உள்ள எல்லா hitகள் பற்றிய சில தகவல்களை நாம் print செய்வோம்.
05:27 பின்வரும் codeஐ டைப் செய்யவும்.
05:30 ஒரு match குறிப்பிடத்தக்கதாக இருக்கவேண்டுமெனில், expect score, 0.01க்கு குறைவாக இருக்கவேண்டும்.
05:37 ஒவ்வொரு hsp, அதாவது high scoring pairக்கும், title, length, hsp score, gaps மற்றும் expect value, நமக்கு கிடைக்கிறது.
05:49 Queryஐ கொண்டுள்ள stringகள், align செய்யப்பட்ட database sequence, மற்றும்,

match மற்றும் mismatch positionகளை குறிப்பிடும் stringகள் இவைகளையும் நாம் print செய்வோம்.

06:02 Outputஐ பெற, Enter keyஐ இருமுறை அழுத்தவும்.
06:05 Outputஐ கவனிக்கவும்.
06:09 ஒவ்வொரு alignment க்கும், length, score, gaps, evalue மற்றும் stringகள் நம்மிடம் உள்ளன.
06:16 Bio.Blast packageல் இருக்கும், மற்ற functionகளை பயன்படுத்தி, தேவையான தகவல்களை நீங்கள் extract செய்யலாம்.
06:24 நாம் இந்த டுடோரியலின் முடிவுக்கு வந்துவிட்டோம். சுருங்கசொல்ல,
06:27 இந்த டுடோரியலில், GI எண்ணை பயன்படுத்தி, query nucleotide sequenceக்கு , BLASTஐ run செய்யவும்,
06:36 Bio.Blast.Record moduleஐ பயன்படுத்தி, BLAST outputஐ parse செய்யவும் கற்றோம்.
06:43 பயிற்சியாக, உங்களுக்கு விருப்பமான protein sequenceக்கு, BLAST Searchஐ run செய்யவும்.
06:50 Output fileஐ சேமித்து, அதில் இருக்கும் dataஐ parse செய்யவும்.
06:55 இந்த fileலில் காட்டப்பட்டுள்ளபடி, நீங்கள் செய்த பயிற்சி பின்வரும் codeன் வரிகளைப் பெற்றிருக்க வேண்டும்.
07:01 Codeஐ கவனிக்கவும். நமது query, protein sequenceஆக இருப்பதனால், நாம், blastp program மற்றும், "nr", அதாவது, BLAST searchக்கான, non-redundant protein databaseஐ பயன்படுத்தி இருக்கிறோம்.
07:16 பின்வரும் இணைப்பில் உள்ள வீடியோ ஸ்போகன் டுடோரியல் திட்டத்தை சுருங்க சொல்கிறது.
07:20 அதை தரவிறக்கி காணவும்.
07:22 ஸ்போகன் டுடோரியல் திட்டக்குழு செய்முறை வகுப்புகள் நடத்தி இணையத்தில் பரீட்சை எழுதி தேர்வோருக்கு சான்றிதழ்கள் தருகிறது.
07:30 மேலும் விவரங்களுக்கு எங்களுக்கு மின்னஞ்சல் செய்யவும்.
07:33 இந்திய அரசாங்கத்தின், NMEICT, MHRD, ஸ்போகன் டுடோரியல் திட்டத்திற்கு ஆதரவு அளிக்கிறது.
07:40 மேலும் விவரங்களுக்கு, கீழ்கண்ட இணைப்பை பார்க்கவும்.
07:45 இந்த டுடோரியலை தமிழாக்கம் செய்தது ஜெயஶீ. குரல் கொடுத்தது..... நன்றி.

Contributors and Content Editors

Priyacst