Biopython/C2/Writing-Sequence-Files/Tamil

From Script | Spoken-Tutorial
Revision as of 12:07, 2 May 2017 by Priyacst (Talk | contribs)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to: navigation, search
Time
Narration
00:01 வணக்கம். Sequence fileகளை எழுதுவது குறித்த இந்த டுடோரியலுக்கு நல்வரவு.
00:07 இந்த டுடோரியலில் நாம் கற்கப்போவது: Sequence Record Objectகளை உருவாக்குவது
00:13 Sequence fileகளை எழுதுவது
00:15 file formatகளுக்கு இடையே மாறுவது
00:19 மற்றும், fileன் recordகளை நீளத்தின் அடிப்படையில் sort செய்வது.
00:23 இந்த டுடோரியலை புரிந்து கொள்ள, பின்வருவன பற்றி தெரிந்திருக்க வேண்டும்.
00:27 இளங்கலை Biochemistry அல்லது Bioinformatics ,
00:31 மற்றும், அடிப்படை Python programming.
00:34 கொடுக்கப்பட்டுள்ள இணைப்பில் உள்ள Python டுடோரியல்களை பார்க்கவும்.
00:38 இந்த டுடோரியலை பதிவு செய்ய, நான் பயன்படுத்துவது: Ubuntu OS பதிப்பு 14.10
00:45 Python பதிப்பு 2.7.8
00:48 Ipython interpreter பதிப்பு 2.3.0 மற்றும் Biopython பதிப்பு 1.64.
00:55 Fileலின் contentகளை read செய்ய, parse மற்றும் read functionகளை, பயன்படுத்த முன்பு நாம் கற்றுக் கொண்டோம்.
01:03 இந்த டுடோரியலில், fileக்கு sequenceகளை எழுத, write functionஐ எப்படி பயன்படுத்துவது,
01:09 மற்றும், பல்வேறு file formatகளுக்கு இடையே ஆன inter-conversionக்கு, Convert functionஐ பயன்படுத்தக் கற்போம்.
01:16 இப்போது, write functionஐ எப்படி பயன்படுத்துவது என்று காட்டுகிறேன்.
01:20 இங்கு protein sequenceஉடன் கூடிய ஒரு text file உள்ளது.
01:24 இங்கு காட்டப்பட்டிருக்கும் sequence, insulin protein ஆகும்.
01:28 GI accession number பற்றிய தகவலையும் , descriptionஐயும் இந்த file கொண்டிருக்கும்.
01:36 இந்த sequenceக்கு, FASTA formatல், ஒரு fileஐ நாம் இப்போது உருவாக்குவோம்.
01:41 முதலாவது படி, sequence record objectஐ உருவாக்குவது.
01:45 Sequence Record Objectகள் பற்றி மேலும் தகவல்:
01:49 Sequence input/output interfaceக்கு அடிப்படை data type இதுவே.
01:55 Sequence record objectல், identifierகள் மற்றும் விளக்கங்கள் போன்ற உயர் நிலை அம்சங்களுடன், ஒரு sequence இணைக்கப்படுகிறது.
02:04 Terminalஐ திறக்க, Ctrl, Alt மற்றும் t keyகளை ஒன்றாக அழுத்தவும்.
02:10 Promptல் டைப் செய்க: ipython", பின் Enterஐ அழுத்தவும்.
02:15 பின்வரும் வரிகளை, Promptல் டைப் செய்க.
02:18 from Bio dot Seq module import Seq class.
02:24 from Bio dot SeqRecord module import Sequence Record class
02:31 அடுத்து, from Bio dot Alphabet module import generic protein class.
02:38 அடுத்து, variable record1ல், sequence record objectஐ நான் சேமிக்கிறேன்.
02:45 Text fileல் இருந்து, sequence, id மற்றும் descriptionஐ, Copy செய்து, terminalலின் மீது, அதற்கான வரிகளில் paste செய்யவும்.
02:56 Enterஐ அழுத்தவும்.
02:58 Outputஐ காண, டைப் செய்க: record1.
03:02 Enterஐ அழுத்தவும்.
03:04 Insulin protein sequenceஐ, sequence record objectஆக output காட்டுகிறது.
03:10 அது, id மற்றும் descriptionஉடன், sequenceஐயும் காட்டுகிறது.
03:21 Bio packageல் இருந்து, Seq IO moduleஐ import செய்யவும்.
03:26 அடுத்து, sequence objectஐ, FASTA fileஆக மாற்ற, write functionஉடன், command lineஐ டைப் செய்யவும்.
03:40 Write function, 3 argumentகளை எடுத்துக் கொள்கிறது.
03:44 முதலாவது, sequence record objectஐ சேமிக்கும் variable ஆகும்.
03:49 இரண்டாவது, FASTA fileஐ எழுதுவதற்கான, fileன் பெயராகும்.
03:54 மூன்றாவது, எழுதுவதற்கான file format ஆகும். Enterஐ அழுத்தவும்.
03:58 Output, ஒன்று. அதாவது, நாம் ஒரு sequence record objectஐ, ஒரு FASTA fileஆக மாற்றியிருக்கிறோம் எனக் காட்டுகிறது.
04:07 FASTA formatல் இருக்கும் file, home folderல், "example.fasta" என சேமிக்கப்படுகிறது.
04:13 எச்சரிக்கையாக இருங்கள். அதே பெயரைக் கொண்ட, ஏற்கெனவே உள்ள file மீது, output over-write ஆகிவிடும்.
04:18 Fileஐ காண, home folderல் இருக்கும் அந்த fileக்கு செல்லவும்.
04:24 இந்த fileஐ text editorல் திறக்கவும்.
04:27 Protein sequence, இப்போது FASTA formatல் உள்ளது.
04:31 Text-editorஐ மூடவும்.
04:33 பல bioinformatics கருவிகள், வெவ்வேறு input file formatகளை எடுத்துக் கொள்கின்றன.
04:38 அதனால், சில சமயங்களில், sequence file formatகளுக்கு இடையே inter-convert செய்ய வேண்டிய அவசியம் ஏற்படுகிறது.
04:44 SeqIO moduleலில், convert functionஐ பயன்படுத்தி, file conversionகளை நாம் செய்யலாம்.
04:50 செயல் விளக்கத்திற்கு, ஒரு GenBank fileஐ, ஒரு FASTA fileஆக மாற்றுகிறேன்.
04:55 என் home folderல், ஒரு GenBank file உள்ளது.
04:59 அதை text editorல் திறக்கிறேன்.
05:02 GenBank formatல், HIV genomeஐ இந்த file கொண்டுள்ளது.
05:07 இந்த GenBank fileன் முதல் பகுதியில், genomeல் உள்ள எல்லா geneகளின் விளக்கங்களும் உள்ளன.
05:14 ஒரு முழு genome sequence, இதனை பின்தொடர்கிறது.
05:18 Text-editorஐ மூடவும். Terminalலில், பின்வரும் வரிகளை டைப் செய்யவும்.
05:23 இங்கு, convert function, GenBank fileலில் இருக்கும், முழு genome sequenceஐ, FASTA fileஆக மாற்றுகிறது.
05:33 FASTA formatல் இருக்கும் புது file, இப்போது, HIV.fasta என, home folderல் சேமிக்கப்படுகிறது.
05:39 இந்த fileக்கு சென்று, அதை text editorல் திறக்கவும்.
05:46 Text-editorஐ மூடவும்.
05:49 Convert functionஐ பயன்படுத்தி, எளிதாக file formatகளை மாற்ற முடிந்தாலும், அதற்கு வரம்புகள் உள்ளன.
05:56 சில formatகளை எழுதுவதற்கு, மற்ற formatகளில் இல்லாத தகவல்கள் தேவைப்படுகின்றன.
06:02 உதாரணத்திற்கு: ஒரு GenBank fileஐ, ஒரு FASTA fileஆக மாற்ற முடியும், ஆனால், அதை reverse செய்ய முடியாது.
06:09 அதே போல், ஒரு FASTQ fileஐ, ஒரு FASTA fileஆக மாற்ற முடியும், ஆனால், அதை reverse செய்ய முடியாது.
06:15 Convert function பற்றிய மேலும் தகவல்களுக்கு, help commandஐ டைப் செய்யவும்.
06:21 Enterஐ அழுத்தவும்.
06:24 Promptக்கு திரும்ப, key boardல், 'q'ஐ அழுத்தவும்.
06:28 HIV genomeல் இருந்து, தனிப்பட்ட geneகளை, GenBank formatல் extract செய்யலாம்.
06:35 இந்த தனிப்பட்ட geneகளை, FASTA அல்லது வேறு எந்த formatலும் சேமிக்கலாம்.
06:41 இதற்கு, Promptல் பின்வரும் codeஐ டைப் செய்க.
06:47 இந்த code, எல்லா தனிப்பட்ட CDS gene sequenceகள், அதன் idகள் மற்றும், geneன் பெயர் ஆகியவற்றை, ஒரு fileலில் எழுதும்.
06:56 இந்த file, உங்கள் home folderல், “HIV_geneseq.fasta” என சேமிக்கப்படுகிறது. Enterஐ அழுத்தவும்.
07:07 Biopython கருவிகளை பயன்படுத்தி, ஒரு fileலில் உள்ள recordகளை நீளத்தின் அடிப்படையில் sort செய்யலாம்.
07:12 இங்கு, ஆறு recordகளை கொண்டுள்ள, “hemoglobin.fasta” என்ற FASTA fileஐ நான் திறந்துள்ளேன்.
07:19 ஒவ்வொரு recordஉம் வெவ்வேறு நீளத்தை கொண்டிருக்கிறது.
07:23 நீளமான recordஐ முதலில் வைத்து, ஒழுங்குபடுத்த, பின்வரும் வரிகளை டைப் செய்யவும்.
07:27 sort செய்யப்பட்ட sequenceகளை கொண்ட புது file, உங்கள் home folderல், "sorted_hemoglobin.fasta" என சேமிக்கப்படும்.
07:38 குறுகிய recordகளுக்கு, முதலில், records.sort command lineல் உள்ள argumentகளை reverse செய்யவும்.
07:46 சுருங்கசொல்ல, இந்த டுடோரியலில் நாம் கற்றது: Sequence Record Objectகளை உருவாக்குவது
07:51 Sequence Input/Output moduleன், write functionஐ பயன்படுத்தி, Sequence fileகளை எழுதுவது
07:58 Convert functionஐ பயன்படுத்தி, sequence file formatகளுக்கு இடையே மாறுவது
08:03 மற்றும், fileலில் உள்ள recordகளை நீளத்தின் அடிப்படையில் sort செய்வது.
08:07 பயிற்சியாக-HIV genomic sequenceல் இருந்து, gene "HIV1gp3"ஐ, positionகள் 4587ல் இருந்து 5165 வரை extract செய்யவும்.
08:21 இந்த டுடோரியலின் code fileகளினுள், “HIV.gb” file சேர்க்கப்படுகிறது.
08:28 நீங்கள் செய்த பயிற்சி பின்வரும் codeஐ பெற்றிருக்கும்.
08:43 இந்த வீடியோ ஸ்போகன் டுடோரியல் திட்டத்தை சுருங்க சொல்கிறது. அதை தரவிறக்கி காணவும்.
08:49 ஸ்போகன் டுடோரியல் திட்டக்குழு செய்முறை வகுப்புகள் நடத்தி இணையத்தில் பரீட்சை எழுதி தேர்வோருக்கு சான்றிதழ்கள் தருகிறது.
08:57 மேலும் விவரங்களுக்கு எங்களுக்கு மின்னஞ்சல் செய்யவும்.
09:00 இந்திய அரசாங்கத்தின் National Mission on Education through ICT, MHRD இதற்கு ஆதரவு அளிக்கிறது.
09:06 மேலும் விவரங்களுக்கு, கீழ்கண்ட இணைப்பை பார்க்கவும்.
09:10 இந்த டுடோரியலை தமிழாக்கம் செய்தது ஜெயஶீ. குரல் கொடுத்தது ஐஐடி பாம்பேயில் இருந்து பிரியா. நன்றி.

Contributors and Content Editors

Priyacst