Biopython/C2/Writing-Sequence-Files/Bengali

From Script | Spoken-Tutorial
Jump to: navigation, search
Time Narration
00:01 Writing Sequence Files এর টিউটোরিয়ালে আপনাদের স্বাগত।
00:07 এখানে আমরা শিখব Sequence Record Objects বানানো।
00:13 সিকোয়েন্স ফাইল্স লেখা।
00:15 ফাইল ফরম্যাট বদলানো।
00:19 এবং দৈর্ঘ্যের ভিত্তিতে ফাইলে রেকর্ড সর্ট করা।
00:23 টিউটোরিয়ালটি অনুসরণ করতে
00:27 স্নাতক স্তরের বায়োকেমিস্ট্রি বা বায়োইনফরমেটিক্স
00:31 এবং মৌলিক Python প্রোগ্রামিং সম্পর্কে জানতে হবে।
00:34 প্রদত্ত লিঙ্কে Python টিউটোরিয়াল দেখুন।
00:38 টিউটোরিয়ালটি রেকর্ড করতে ব্যবহার করছি: উবুন্টু OS সংস্করণ 14.10
00:45 Python সংস্করণ 2.7.8
00:48 Ipython interpretor সংস্করণ 2.3.0 এবং Biopython সংস্করণ 1.64.
00:55 আমরা ফাইলের বিষয়বস্তু পড়তে আগেই parse এবং read ফাংশন সম্পর্কে শিখেছি।
01:03 এখানে আমরা শিখব একটি ফাইলে ক্রম লিখতে write ফাংশনের ব্যবহার।
01:09 এবং বিভিন্ন ফাইল ফরম্যাটের মধ্যে অন্তর-রূপান্তরণ করতে Convert ফাংশনের ব্যবহার।
01:16 এখন আমি write ফাংশনের ব্যবহার দেখাবো।
01:20 এখানে প্রোটিন ক্রম সহ টেক্সট ফাইল রয়েছে।
01:24 প্রদর্শিত ক্রম হল insulin protein.
01:28 ফাইলটি কিছু তথ্য যেমন GI accession number এবং description ও রাখে।
01:36 এখন আমরা FASTA ফরম্যাটে এই ক্রমের জন্য ফাইল বানাবো।
01:41 প্রথম ধাপ হল sequence record object বানানো।
01:45 sequence record object সম্পর্কে আরো তথ্য:
01:49 এটি sequence input/output interface এর মৌলিক ডেটা টাইপ।
01:55 sequence record object এ, একটি ক্রম উচ্চ পর্যায়ের বৈশিষ্ট্য যেমন identifiers এবং descriptions এর সাথে যুক্ত করা হয়।
02:04 Ctrl, Alt এবং T কী একসাথে টিপে টার্মিনাল খুলুন।
02:10 প্রম্পটে লিখুন: ipython, Enter টিপুন।
02:15 প্রম্পটে, নিম্নোক্ত লাইন লিখুন:
02:18 from Bio dot Seq module import Seq class
02:24 from Bio dot SeqRecord module import Sequence Record class
02:31 এরপর from Bio dot Alphabet module import generic protein class
02:38 এরপর ভ্যারিয়েবল record1 এ sequence record object সংরক্ষণ করব।
02:45 টেক্সট ফাইলে sequence, id এবং description কপি করুন এবং টার্মিনালে সংশ্লিষ্ট লাইন্সে পেস্ট করুন।
02:56 Enter টিপুন।
02:58 আউটপুট দেখতে লিখুন: record1
03:02 Enter টিপুন।
03:04 আউটপুট insulin protein ক্রমকে sequence record অবজেক্ট হিসাবে দেখায়।
03:10 এটি id এবং description সহ ক্রম দেখায়।
03:13 উপরোক্ত sequence record অবজেক্ট FASTA ফাইলে বদলাতে write ফাংশন ব্যবহার করব।
03:21 Bio প্যাকেজ থেকে SeqIO module ইম্পোর্ট করুন।
03:26 এরপর sequence অবজেক্ট FASTA ফাইলে বদলাতে write ফাংশন সহ command line লিখুন।
03:40 write ফাংশন 3 টি আর্গুমেন্ট নেয়।
03:44 প্রথমটি হল sequence record object সংরক্ষণ করার ভ্যারিয়েবল।
03:49 দ্বিতীয়টি FASTA ফাইল লিখতে ফাইলের নাম।
03:54 তৃতীয়টি লিখতে ফাইল ফরম্যাট। এন্টার টিপুন।
03:58 আউটপুট 1 দেখায় যার মানে আমরা sequence record object কে FASTA ফাইলে বদলেছি।
04:07 FASTA ফরম্যাটে ফাইল example.fasta হিসাবে home ফোল্ডারে সংরক্ষিত হয়।
04:13 আউটপুট একই নামের আগের যে কোনো বিদ্যমান ফাইলে ওভাররাইট হবে।
04:18 ফাইলটি দেখতে home ফোল্ডারে ফাইলে যান।
04:24 ফাইলটি টেক্সট এডিটরে খুলুন।
04:27 প্রোটিন ক্রম এখন FASTA ফরম্যাটে রয়েছে।
04:31 টেক্সট এডিটর বন্ধ করুন।
04:33 অনেক bioinformatics টুল বিভিন্ন ইনপুট ফাইল ফরম্যাট নেয়।
04:38 তাই মাঝে মাঝে sequence ফাইল ফরম্যাটে অন্তর-রূপান্তরণ করা প্রয়োজন।
04:44 আমরা SeqIO module এ convert ফাংশন দ্বারা ফাইল রূপান্তর করতে পারি।
04:50 এটি দেখতে GenBank ফাইলটি FASTA ফাইলে বদলাবো।
04:55 home ফোল্ডার থেকে GenBank ফাইল নিন।
04:59 এটি টেক্সট এডিটরে খুলুন।
05:02 ফাইল GenBank ফরম্যাটে HIV genome রাখে।
05:07 এই GenBank ফাইল, ফাইলের প্রথম অংশে genome এ সকল genes এর বর্ণন রাখে।
05:14 এরপর সম্পূর্ণ genome ক্রম আসে।
05:18 টেক্সট এডিটর বন্ধ করুন। টার্মিনাল এ নিম্ন লাইন লিখুন।
05:23 এখানে convert ফাংশন GenBank ফাইলে উপস্থিত সম্পূর্ণ genome কে FASTA ফাইলে বদলায়। এন্টার টিপুন।
05:33 নতুন ফাইল FASTA ফরম্যাটে home ফোল্ডারে HIV.fasta হিসাবে সংরক্ষণ হয়।
05:39 ফাইলে যান এবং টেক্সট এডিটর খুলুন।
05:46 টেক্সট এডিটর বন্ধ করুন।
05:49 যদিও আমরা convert ফাংশন দ্বারা ফাইল ফরম্যাট সহজে বদলাতে পারি, কিন্তু এর সীমাবদ্ধতা রয়েছে।
05:56 কিছু ফরম্যাট লিখতে তথ্য প্রয়োজন যা অন্য ফাইল ফরম্যাট রাখে না।
06:02 উদাহরণস্বরূপ: GenBank ফাইলকে FASTA ফাইলে বদলাতে পারি, কিন্তু বিপরীত করতে পারি না।
06:09 একইভাবে FASTQ ফাইল FASTA ফাইলে বদলাতে পারি, কিন্তু বিপরীত করতে পারি না।
06:15 convert ফাংশন সম্পর্কে অধিক জানতে লিখুন help কমান্ড।
06:21 এন্টার টিপুন।
06:24 প্রম্পটে ফিরে যেতে কীবোর্ডে q টিপুন।
06:28 আমরা GenBank ফরম্যাটে HIV genome থেকে পৃথক genes ও এক্সট্র্যাক্ট করতে পারি।
06:35 এটি পৃথক genes, FASTA বা অন্য কোন ফরম্যাটে সংরক্ষণ করা যেতে পারে।
06:41 এর জন্য, প্রম্পটে নিম্ন কোড লিখুন।
06:47 এই কোড ফাইলে সকল পৃথক CDS জিন সিকোয়েন্স, তাদের ids এবং gene এর নাম লিখবে।
06:56 ফাইলটি আপনার home ফোল্ডারে HIV_geneseq.fasta হিসেবে সংরক্ষিত হয়। এন্টার টিপুন।
07:07 Biopython টুল্স দ্বারা আমরা ফাইলে রেকর্ডের দৈর্ঘ্য সর্ট করতে পারি।
07:12 এখানে FASTA ফাইল hemoglobin.fasta খুলেছি যা ছটি রেকর্ড রাখে।
07:19 প্রতিটি রেকর্ড ভিন্ন ভিন্ন দৈর্ঘ্যের।
07:23 সবচেয়ে দীর্ঘতম রেকর্ড ব্যবস্থিত জন্য নিম্ন লাইন লিখুন।
07:27 সর্ট করা সিকোয়েন্স সহ নতুন ফাইল home ফোল্ডারে sorted_hemoglobin.fasta হিসাবে সংরক্ষণ করা হবে।
07:38 প্রথমে ছোট রেকর্ডের জন্য records.sort কমান্ড লাইনে আর্গুমেন্টস রিভার্স করুন।
07:45 সংক্ষিপ্তকরণ করি। এই টিউটোরিয়ালে সিকোয়েন্স রেকর্ড অবজেক্ট বানানো শিখেছি।
07:51 Sequence Input/Output মডিউলের write ফাংশন দ্বারা সিকোয়েন্স ফাইল লিখুন।
07:58 convert ফাংশন দ্বারা সিকোয়েন্স ফাইল ফরম্যাটের রূপান্তরণ।
08:03 এবং দৈর্ঘ্য দ্বারা ফাইলে রেকর্ড সর্ট করুন।
08:07 অনুশীলনী:
08:09 HIV এর genomic ক্রম থেকে 4587 থেকে 5165 স্থান পর্যন্ত জিন HIV1gp3 এক্সট্র্যাক্ট করুন।
08:21 HIV.gb ফাইল এই টিউটোরিয়ালের কোড ফাইলসে অন্তর্ভুক্ত হয়েছে।
08:28 আপনার সম্পন্ন কাজটি নিম্ন কোডটি রাখবে।
08:43 এই লিঙ্কে উপলব্ধ ভিডিওটি প্রকল্পকে সারসংক্ষেপে বোঝায়।
08:48 এটি ডাউনলোড করে দেখুন। স্পোকেন টিউটোরিয়াল প্রকল্প দল কর্মশালার আয়োজন করে এবং অনলাইন পরীক্ষা পাস করলে প্রশংসাপত্র দেয়।
08:57 অধিক জানতে আমাদের সাথে যোগাযোগ করুন।
09:00 স্পোকেন টিউটোরিয়াল প্রকল্প ভারত সরকারের NMEICT, MHRD দ্বারা সমর্থিত।
09:06 এই বিষয়ে বিস্তারিত তথ্য এই লিঙ্কে প্রাপ্তিসাধ্য।
09:10 আইআইটি বোম্বে থেকে আমি বিদায় নিচ্ছি। অংশগ্রহণের জন্য ধন্যবাদ।

Contributors and Content Editors

Satarupadutta