Biopython/C2/Writing-Sequence-Files/Tamil
From Script | Spoken-Tutorial
|
|
---|---|
00:01 | வணக்கம். Sequence fileகளை எழுதுவது குறித்த இந்த டுடோரியலுக்கு நல்வரவு. |
00:07 | இந்த டுடோரியலில் நாம் கற்கப்போவது: Sequence Record Objectகளை உருவாக்குவது |
00:13 | Sequence fileகளை எழுதுவது |
00:15 | file formatகளுக்கு இடையே மாறுவது |
00:19 | மற்றும், fileன் recordகளை நீளத்தின் அடிப்படையில் sort செய்வது. |
00:23 | இந்த டுடோரியலை புரிந்து கொள்ள, பின்வருவன பற்றி தெரிந்திருக்க வேண்டும். |
00:27 | இளங்கலை Biochemistry அல்லது Bioinformatics , |
00:31 | மற்றும், அடிப்படை Python programming. |
00:34 | கொடுக்கப்பட்டுள்ள இணைப்பில் உள்ள Python டுடோரியல்களை பார்க்கவும். |
00:38 | இந்த டுடோரியலை பதிவு செய்ய, நான் பயன்படுத்துவது: Ubuntu OS பதிப்பு 14.10 |
00:45 | Python பதிப்பு 2.7.8 |
00:48 | Ipython interpreter பதிப்பு 2.3.0 மற்றும் Biopython பதிப்பு 1.64 |
00:55 | Fileலின் contentகளை read செய்ய, parse மற்றும் read functionகளை, பயன்படுத்த முன்பு நாம் கற்றுக் கொண்டோம். |
01:03 | இந்த டுடோரியலில், fileக்கு sequenceகளை எழுத, write functionஐ எப்படி பயன்படுத்துவது, |
01:09 | மற்றும், பல்வேறு file formatகளுக்கு இடையே ஆன inter-conversionக்கு, Convert functionஐ பயன்படுத்தக் கற்போம். |
01:16 | இப்போது, write functionஐ எப்படி பயன்படுத்துவது என்று காட்டுகிறேன். |
01:20 | இங்கு protein sequenceஉடன் கூடிய ஒரு text file உள்ளது. |
01:24 | இங்கு காட்டப்பட்டிருக்கும் sequence, insulin protein ஆகும். |
01:28 | GI accession number பற்றிய தகவலையும் , descriptionஐயும் இந்த file கொண்டிருக்கும். |
01:36 | இந்த sequenceக்கு, FASTA formatல், ஒரு fileஐ நாம் இப்போது உருவாக்குவோம். |
01:41 | முதலாவது படி, sequence record objectஐ உருவாக்குவது. |
01:45 | Sequence Record Objectகள் பற்றி மேலும் தகவல்: |
01:49 | Sequence input/output interfaceக்கு அடிப்படை data type இதுவே. |
01:55 | Sequence record objectல், identifierகள் மற்றும் விளக்கங்கள் போன்ற உயர் நிலை அம்சங்களுடன், ஒரு sequence இணைக்கப்படுகிறது. |
02:04 | Terminalஐ திறக்க, Ctrl, Alt மற்றும் t keyகளை ஒன்றாக அழுத்தவும். |
02:10 | Promptல் டைப் செய்க: ipython", பின் Enterஐ அழுத்தவும். |
02:15 | பின்வரும் வரிகளை, Promptல் டைப் செய்க. |
02:18 | from Bio dot Seq module import Seq class. |
02:24 | from Bio dot SeqRecord module import Sequence Record class |
02:31 | அடுத்து, from Bio dot Alphabet module import generic protein class. |
02:38 | அடுத்து, variable record1ல், sequence record objectஐ நான் சேமிக்கிறேன். |
02:45 | Text fileல் இருந்து, sequence, id மற்றும் descriptionஐ, Copy செய்து, terminalலின் மீது, அதற்கான வரிகளில் paste செய்யவும். |
02:56 | Enterஐ அழுத்தவும். |
02:58 | Outputஐ காண, டைப் செய்க: record1. |
03:02 | Enterஐ அழுத்தவும். |
03:04 | Insulin protein sequenceஐ, sequence record objectஆக output காட்டுகிறது. |
03:10 | அது, id மற்றும் descriptionஉடன், sequenceஐயும் காட்டுகிறது. |
03:21 | Bio packageல் இருந்து, Seq IO moduleஐ import செய்யவும். |
03:26 | அடுத்து, sequence objectஐ, FASTA fileஆக மாற்ற, write functionஉடன், command lineஐ டைப் செய்யவும். |
03:40 | Write function, 3 argumentகளை எடுத்துக் கொள்கிறது. |
03:44 | முதலாவது, sequence record objectஐ சேமிக்கின்ற variable ஆகும். |
03:49 | இரண்டாவது, FASTA fileஐ எழுதுவதற்கான, fileன் பெயராகும். |
03:54 | மூன்றாவது, எழுதுவதற்கான file format ஆகும். Enterஐ அழுத்தவும். |
03:58 | Output, ஒன்று. அதாவது, நாம் ஒரு sequence record objectஐ, ஒரு FASTA fileஆக மாற்றியிருக்கிறோம் எனக் காட்டுகிறது. |
04:07 | FASTA formatல் இருக்கும் file, home folderல், "example.fasta" என சேமிக்கப்படுகிறது. |
04:13 | எச்சரிக்கையாக இருங்கள். அதே பெயரைக் கொண்ட, ஏற்கெனவே உள்ள file மீது, output over-write ஆகிவிடும். |
04:18 | Fileஐ காண, home folderல் இருக்கும் அந்த fileக்கு செல்லவும். |
04:24 | இந்த fileஐ text editorல் திறக்கவும். |
04:27 | Protein sequence, இப்போது FASTA formatல் உள்ளது. |
04:31 | Text-editorஐ மூடவும். |
04:33 | பல bioinformatics கருவிகள், வெவ்வேறு input file formatகளை எடுத்துக் கொள்கின்றன. |
04:38 | அதனால், சில சமயங்களில், sequence file formatகளுக்கு இடையே inter-convert செய்ய வேண்டிய அவசியம் ஏற்படுகிறது. |
04:44 | SeqIO moduleலில், convert functionஐ பயன்படுத்தி, file conversionகளை நாம் செய்யலாம். |
04:50 | செயல் விளக்கத்திற்கு, ஒரு GenBank fileஐ, ஒரு FASTA fileஆக மாற்றுகிறேன். |
04:55 | என் home folderல், ஒரு GenBank file உள்ளது. |
04:59 | அதை text editorல் திறக்கிறேன். |
05:02 | GenBank formatல், HIV genomeஐ இந்த file கொண்டுள்ளது. |
05:07 | இந்த GenBank fileன் முதல் பகுதியில், genomeல் உள்ள எல்லா geneகளின் விளக்கங்களும் உள்ளன. |
05:14 | ஒரு முழு genome sequence, இதனை பின்தொடர்கிறது. |
05:18 | Text-editorஐ மூடவும். Terminalலில், பின்வரும் வரிகளை டைப் செய்யவும். |
05:23 | இங்கு, convert function, GenBank fileலில் இருக்கும், முழு genome sequenceஐ, FASTA fileஆக மாற்றுகிறது. |
05:33 | FASTA formatல் இருக்கும் புது file, இப்போது, HIV.fasta என, home folderல் சேமிக்கப்படுகிறது. |
05:39 | இந்த fileக்கு சென்று, அதை text editorல் திறக்கவும். |
05:46 | Text-editorஐ மூடவும். |
05:49 | Convert functionஐ பயன்படுத்தி, எளிதாக file formatகளை மாற்ற முடிந்தாலும், அதற்கு வரம்புகள் உள்ளன. |
05:56 | சில formatகளை எழுதுவதற்கு, மற்ற formatகளில் இல்லாத தகவல்கள் தேவைப்படுகின்றன. |
06:02 | உதாரணத்திற்கு: ஒரு GenBank fileஐ, ஒரு FASTA fileஆக மாற்ற முடியும், ஆனால், அதை reverse செய்ய முடியாது. |
06:09 | அதே போல், ஒரு FASTQ fileஐ, ஒரு FASTA fileஆக மாற்ற முடியும், ஆனால், அதை reverse செய்ய முடியாது. |
06:15 | Convert function பற்றிய மேலும் தகவல்களுக்கு, help commandஐ டைப் செய்யவும். |
06:21 | Enterஐ அழுத்தவும். |
06:24 | Promptக்கு திரும்ப, key boardல், 'q'ஐ அழுத்தவும். |
06:28 | HIV genomeல் இருந்து, தனிப்பட்ட geneகளை, GenBank formatல் extract செய்யலாம். |
06:35 | இந்த தனிப்பட்ட geneகளை, FASTA அல்லது வேறு எந்த formatலும் சேமிக்கலாம். |
06:41 | இதற்கு, Promptல் பின்வரும் codeஐ டைப் செய்க. |
06:47 | இந்த code, எல்லா தனிப்பட்ட CDS gene sequenceகள், அதன் idகள் மற்றும், geneன் பெயர் ஆகியவற்றை, ஒரு fileலில் எழுதும். |
06:56 | இந்த file, உங்கள் home folderல், “HIV_geneseq.fasta” என சேமிக்கப்படுகிறது. Enterஐ அழுத்தவும். |
07:07 | Biopython கருவிகளை பயன்படுத்தி, ஒரு fileலில் உள்ள recordகளை நீளத்தின் அடிப்படையில் sort செய்யலாம். |
07:12 | இங்கு, ஆறு recordகளை கொண்டுள்ள, “hemoglobin.fasta” என்ற FASTA fileஐ நான் திறந்துள்ளேன். |
07:19 | ஒவ்வொரு recordஉம் வெவ்வேறு நீளத்தை கொண்டிருக்கிறது. |
07:23 | நீளமான recordஐ முதலில் வைத்து, ஒழுங்குபடுத்த, பின்வரும் வரிகளை டைப் செய்யவும். |
07:27 | sort செய்யப்பட்ட sequenceகளை கொண்ட புது file, உங்கள் home folderல், "sorted_hemoglobin.fasta" என சேமிக்கப்படும். |
07:38 | குறுகிய recordகளுக்கு, முதலில், records.sort command lineல் உள்ள argumentகளை
reverse செய்யவும். |
07:46 | சுருங்கசொல்ல, இந்த டுடோரியலில் நாம் கற்றது: Sequence Record Objectகளை உருவாக்குவது |
07:51 | Sequence Input/Output moduleன், write functionஐ பயன்படுத்தி, Sequence fileகளை எழுதுவது. |
07:58 | Convert functionஐ பயன்படுத்தி, sequence file formatகளுக்கு இடையே மாறுவது. |
08:03 | மற்றும், fileலில் உள்ள recordகளை நீளத்தின் அடிப்படையில் sort செய்வது. |
08:07 | பயிற்சியாக-HIV genomic sequenceல் இருந்து, gene "HIV1gp3"ஐ, positionகள் 4587ல் இருந்து 5165 வரை extract செய்வது. |
08:21 | இந்த டுடோரியலின் code fileகளினுள், “HIV.gb” file சேர்க்கப்படுகிறது. |
08:28 | நீங்கள் செய்த பயிற்சி பின்வரும் codeஐ பெற்றிருக்கும். |
08:43 | பின்வரும் இணைப்பில் உள்ள வீடியோ ஸ்போகன் டுடோரியல் திட்டத்தை சுருங்க சொல்கிறது. அதை தரவிறக்கி காணவும். |
08:49 | ஸ்போகன் டுடோரியல் திட்டக்குழு செய்முறை வகுப்புகள் நடத்தி இணையத்தில் பரீட்சை எழுதி தேர்வோருக்கு சான்றிதழ்கள் தருகிறது. |
08:57 | மேலும் விவரங்களுக்கு எங்களுக்கு மின்னஞ்சல் செய்யவும். |
09:00 | இதற்கு ஆதரவு இந்திய அரசாங்கத்தின் National Mission on Education through ICT, MHRD மூலம் கிடைக்கிறது. |
09:06 | மேலும் விவரங்களுக்கு, கீழ்கண்ட இணைப்பை பார்க்கவும். |
09:10 | இந்த டுடோரியலை தமிழாக்கம் செய்தது ஜெயஶீ. குரல் கொடுத்தது..... நன்றி. |