Biopython/C2/Writing-Sequence-Files/Bengali
From Script | Spoken-Tutorial
Revision as of 20:49, 21 May 2017 by Satarupadutta (Talk | contribs)
Time | Narration |
00:01 | Writing Sequence Files এর টিউটোরিয়ালে আপনাদের স্বাগত। |
00:07 | এখানে আমরা শিখব Sequence Record Objects বানানো। |
00:13 | সিকোয়েন্স ফাইল্স লেখা। |
00:15 | ফাইল ফরম্যাট বদলানো। |
00:19 | এবং দৈর্ঘ্যের ভিত্তিতে ফাইলে রেকর্ড সর্ট করা। |
00:23 | টিউটোরিয়ালটি অনুসরণ করতে |
00:27 | স্নাতক স্তরের বায়োকেমিস্ট্রি বা বায়োইনফরমেটিক্স |
00:31 | এবং মৌলিক Python প্রোগ্রামিং সম্পর্কে জানতে হবে। |
00:34 | প্রদত্ত লিঙ্কে Python টিউটোরিয়াল দেখুন। |
00:38 | টিউটোরিয়ালটি রেকর্ড করতে ব্যবহার করছি: উবুন্টু OS সংস্করণ 14.10 |
00:45 | Python সংস্করণ 2.7.8 |
00:48 | Ipython interpretor সংস্করণ 2.3.0 এবং Biopython সংস্করণ 1.64. |
00:55 | আমরা ফাইলের বিষয়বস্তু পড়তে আগেই parse এবং read ফাংশন সম্পর্কে শিখেছি। |
01:03 | এখানে আমরা শিখব একটি ফাইলে ক্রম লিখতে write ফাংশনের ব্যবহার। |
01:09 | এবং বিভিন্ন ফাইল ফরম্যাটের মধ্যে অন্তর-রূপান্তরণ করতে Convert ফাংশনের ব্যবহার। |
01:16 | এখন আমি write ফাংশনের ব্যবহার দেখাবো। |
01:20 | এখানে প্রোটিন ক্রম সহ টেক্সট ফাইল রয়েছে। |
01:24 | প্রদর্শিত ক্রম হল insulin protein. |
01:28 | ফাইলটি কিছু তথ্য যেমন GI accession number এবং description ও রাখে। |
01:36 | এখন আমরা FASTA ফরম্যাটে এই ক্রমের জন্য ফাইল বানাবো। |
01:41 | প্রথম ধাপ হল sequence record object বানানো। |
01:45 | sequence record object সম্পর্কে আরো তথ্য: |
01:49 | এটি sequence input/output interface এর মৌলিক ডেটা টাইপ। |
01:55 | sequence record object এ, একটি ক্রম উচ্চ পর্যায়ের বৈশিষ্ট্য যেমন identifiers এবং descriptions এর সাথে যুক্ত করা হয়। |
02:04 | Ctrl, Alt এবং T কী একসাথে টিপে টার্মিনাল খুলুন। |
02:10 | প্রম্পটে লিখুন: ipython, Enter টিপুন। |
02:15 | প্রম্পটে, নিম্নোক্ত লাইন লিখুন: |
02:18 | from Bio dot Seq module import Seq class |
02:24 | from Bio dot SeqRecord module import Sequence Record class |
02:31 | এরপর from Bio dot Alphabet module import generic protein class |
02:38 | এরপর ভ্যারিয়েবল record1 এ sequence record object সংরক্ষণ করব। |
02:45 | টেক্সট ফাইলে sequence, id এবং description কপি করুন এবং টার্মিনালে সংশ্লিষ্ট লাইন্সে পেস্ট করুন। |
02:56 | Enter টিপুন। |
02:58 | আউটপুট দেখতে লিখুন: record1 |
03:02 | Enter টিপুন। |
03:04 | আউটপুট insulin protein ক্রমকে sequence record অবজেক্ট হিসাবে দেখায়। |
03:10 | এটি id এবং description সহ ক্রম দেখায়। |
03:13 | উপরোক্ত sequence record অবজেক্ট FASTA ফাইলে বদলাতে write ফাংশন ব্যবহার করব। |
03:21 | Bio প্যাকেজ থেকে SeqIO module ইম্পোর্ট করুন। |
03:26 | এরপর sequence অবজেক্ট FASTA ফাইলে বদলাতে write ফাংশন সহ command line লিখুন। |
03:40 | write ফাংশন 3 টি আর্গুমেন্ট নেয়। |
03:44 | প্রথমটি হল sequence record object সংরক্ষণ করার ভ্যারিয়েবল। |
03:49 | দ্বিতীয়টি FASTA ফাইল লিখতে ফাইলের নাম। |
03:54 | তৃতীয়টি লিখতে ফাইল ফরম্যাট। এন্টার টিপুন। |
03:58 | আউটপুট 1 দেখায় যার মানে আমরা sequence record object কে FASTA ফাইলে বদলেছি। |
04:07 | FASTA ফরম্যাটে ফাইল example.fasta হিসাবে home ফোল্ডারে সংরক্ষিত হয়। |
04:13 | আউটপুট একই নামের আগের যে কোনো বিদ্যমান ফাইলে ওভাররাইট হবে। |
04:18 | ফাইলটি দেখতে home ফোল্ডারে ফাইলে যান। |
04:24 | ফাইলটি টেক্সট এডিটরে খুলুন। |
04:27 | প্রোটিন ক্রম এখন FASTA ফরম্যাটে রয়েছে। |
04:31 | টেক্সট এডিটর বন্ধ করুন। |
04:33 | অনেক bioinformatics টুল বিভিন্ন ইনপুট ফাইল ফরম্যাট নেয়। |
04:38 | তাই মাঝে মাঝে sequence ফাইল ফরম্যাটে অন্তর-রূপান্তরণ করা প্রয়োজন। |
04:44 | আমরা SeqIO module এ convert ফাংশন দ্বারা ফাইল রূপান্তর করতে পারি। |
04:50 | এটি দেখতে GenBank ফাইলটি FASTA ফাইলে বদলাবো। |
04:55 | home ফোল্ডার থেকে GenBank ফাইল নিন। |
04:59 | এটি টেক্সট এডিটরে খুলুন। |
05:02 | ফাইল GenBank ফরম্যাটে HIV genome রাখে। |
05:07 | এই GenBank ফাইল, ফাইলের প্রথম অংশে genome এ সকল genes এর বর্ণন রাখে। |
05:14 | এরপর সম্পূর্ণ genome ক্রম আসে। |
05:18 | টেক্সট এডিটর বন্ধ করুন। টার্মিনাল এ নিম্ন লাইন লিখুন। |
05:23 | এখানে convert ফাংশন GenBank ফাইলে উপস্থিত সম্পূর্ণ genome কে FASTA ফাইলে বদলায়। এন্টার টিপুন। |
05:33 | নতুন ফাইল FASTA ফরম্যাটে home ফোল্ডারে HIV.fasta হিসাবে সংরক্ষণ হয়। |
05:39 | ফাইলে যান এবং টেক্সট এডিটর খুলুন। |
05:46 | টেক্সট এডিটর বন্ধ করুন। |
05:49 | যদিও আমরা convert ফাংশন দ্বারা ফাইল ফরম্যাট সহজে বদলাতে পারি, কিন্তু এর সীমাবদ্ধতা রয়েছে। |
05:56 | কিছু ফরম্যাট লিখতে তথ্য প্রয়োজন যা অন্য ফাইল ফরম্যাট রাখে না। |
06:02 | উদাহরণস্বরূপ: GenBank ফাইলকে FASTA ফাইলে বদলাতে পারি, কিন্তু বিপরীত করতে পারি না। |
06:09 | একইভাবে FASTQ ফাইল FASTA ফাইলে বদলাতে পারি, কিন্তু বিপরীত করতে পারি না। |
06:15 | convert ফাংশন সম্পর্কে অধিক জানতে লিখুন help কমান্ড। |
06:21 | এন্টার টিপুন। |
06:24 | প্রম্পটে ফিরে যেতে কীবোর্ডে q টিপুন। |
06:28 | আমরা GenBank ফরম্যাটে HIV genome থেকে পৃথক genes ও এক্সট্র্যাক্ট করতে পারি। |
06:35 | এটি পৃথক genes, FASTA বা অন্য কোন ফরম্যাটে সংরক্ষণ করা যেতে পারে। |
06:41 | এর জন্য, প্রম্পটে নিম্ন কোড লিখুন। |
06:47 | এই কোড ফাইলে সকল পৃথক CDS জিন সিকোয়েন্স, তাদের ids এবং gene এর নাম লিখবে। |
06:56 | ফাইলটি আপনার home ফোল্ডারে HIV_geneseq.fasta হিসেবে সংরক্ষিত হয়। এন্টার টিপুন। |
07:07 | Biopython টুল্স দ্বারা আমরা ফাইলে রেকর্ডের দৈর্ঘ্য সর্ট করতে পারি। |
07:12 | এখানে FASTA ফাইল hemoglobin.fasta খুলেছি যা ছটি রেকর্ড রাখে। |
07:19 | প্রতিটি রেকর্ড ভিন্ন ভিন্ন দৈর্ঘ্যের। |
07:23 | সবচেয়ে দীর্ঘতম রেকর্ড ব্যবস্থিত জন্য নিম্ন লাইন লিখুন। |
07:27 | সর্ট করা সিকোয়েন্স সহ নতুন ফাইল home ফোল্ডারে sorted_hemoglobin.fasta হিসাবে সংরক্ষণ করা হবে। |
07:38 | প্রথমে ছোট রেকর্ডের জন্য records.sort কমান্ড লাইনে আর্গুমেন্টস রিভার্স করুন। |
07:45 | সংক্ষিপ্তকরণ করি। এই টিউটোরিয়ালে সিকোয়েন্স রেকর্ড অবজেক্ট বানানো শিখেছি। |
07:51 | Sequence Input/Output মডিউলের write ফাংশন দ্বারা সিকোয়েন্স ফাইল লিখুন। |
07:58 | convert ফাংশন দ্বারা সিকোয়েন্স ফাইল ফরম্যাটের রূপান্তরণ। |
08:03 | এবং দৈর্ঘ্য দ্বারা ফাইলে রেকর্ড সর্ট করুন। |
08:07 | অনুশীলনী: |
08:09 | HIV এর genomic ক্রম থেকে 4587 থেকে 5165 স্থান পর্যন্ত জিন HIV1gp3 এক্সট্র্যাক্ট করুন। |
08:21 | HIV.gb ফাইল এই টিউটোরিয়ালের কোড ফাইলসে অন্তর্ভুক্ত হয়েছে। |
08:28 | আপনার সম্পন্ন কাজটি নিম্ন কোডটি রাখবে। |
08:43 | এই লিঙ্কে উপলব্ধ ভিডিওটি প্রকল্পকে সারসংক্ষেপে বোঝায়। |
08:48 | এটি ডাউনলোড করে দেখুন। স্পোকেন টিউটোরিয়াল প্রকল্প দল কর্মশালার আয়োজন করে এবং অনলাইন পরীক্ষা পাস করলে প্রশংসাপত্র দেয়। |
08:57 | অধিক জানতে আমাদের সাথে যোগাযোগ করুন। |
09:00 | স্পোকেন টিউটোরিয়াল প্রকল্প ভারত সরকারের NMEICT, MHRD দ্বারা সমর্থিত। |
09:06 | এই বিষয়ে বিস্তারিত তথ্য এই লিঙ্কে প্রাপ্তিসাধ্য। |
09:10 | আইআইটি বোম্বে থেকে আমি বিদায় নিচ্ছি। অংশগ্রহণের জন্য ধন্যবাদ। |