Biopython/C2/Writing-Sequence-Files/Bengali

Time	Narration
00:01	Writing Sequence Files এর টিউটোরিয়ালে আপনাদের স্বাগত।
00:07	এখানে আমরা শিখব Sequence Record Objects বানানো।
00:13	সিকোয়েন্স ফাইল্স লেখা।
00:15	ফাইল ফরম্যাট বদলানো।
00:19	এবং দৈর্ঘ্যের ভিত্তিতে ফাইলে রেকর্ড সর্ট করা।
00:23	টিউটোরিয়ালটি অনুসরণ করতে
00:27	স্নাতক স্তরের বায়োকেমিস্ট্রি বা বায়োইনফরমেটিক্স
00:31	এবং মৌলিক Python প্রোগ্রামিং সম্পর্কে জানতে হবে।
00:34	প্রদত্ত লিঙ্কে Python টিউটোরিয়াল দেখুন।
00:38	টিউটোরিয়ালটি রেকর্ড করতে ব্যবহার করছি: উবুন্টু OS সংস্করণ 14.10
00:45	Python সংস্করণ 2.7.8
00:48	Ipython interpretor সংস্করণ 2.3.0 এবং Biopython সংস্করণ 1.64.
00:55	আমরা ফাইলের বিষয়বস্তু পড়তে আগেই parse এবং read ফাংশন সম্পর্কে শিখেছি।
01:03	এখানে আমরা শিখব একটি ফাইলে ক্রম লিখতে write ফাংশনের ব্যবহার।
01:09	এবং বিভিন্ন ফাইল ফরম্যাটের মধ্যে অন্তর-রূপান্তরণ করতে Convert ফাংশনের ব্যবহার।
01:16	এখন আমি write ফাংশনের ব্যবহার দেখাবো।
01:20	এখানে প্রোটিন ক্রম সহ টেক্সট ফাইল রয়েছে।
01:24	প্রদর্শিত ক্রম হল insulin protein.
01:28	ফাইলটি কিছু তথ্য যেমন GI accession number এবং description ও রাখে।
01:36	এখন আমরা FASTA ফরম্যাটে এই ক্রমের জন্য ফাইল বানাবো।
01:41	প্রথম ধাপ হল sequence record object বানানো।
01:45	sequence record object সম্পর্কে আরো তথ্য:
01:49	এটি sequence input/output interface এর মৌলিক ডেটা টাইপ।
01:55	sequence record object এ, একটি ক্রম উচ্চ পর্যায়ের বৈশিষ্ট্য যেমন identifiers এবং descriptions এর সাথে যুক্ত করা হয়।
02:04	Ctrl, Alt এবং T কী একসাথে টিপে টার্মিনাল খুলুন।
02:10	প্রম্পটে লিখুন: ipython, Enter টিপুন।
02:15	প্রম্পটে, নিম্নোক্ত লাইন লিখুন:
02:18	from Bio dot Seq module import Seq class
02:24	from Bio dot SeqRecord module import Sequence Record class
02:31	এরপর from Bio dot Alphabet module import generic protein class
02:38	এরপর ভ্যারিয়েবল record1 এ sequence record object সংরক্ষণ করব।
02:45	টেক্সট ফাইলে sequence, id এবং description কপি করুন এবং টার্মিনালে সংশ্লিষ্ট লাইন্সে পেস্ট করুন।
02:56	Enter টিপুন।
02:58	আউটপুট দেখতে লিখুন: record1
03:02	Enter টিপুন।
03:04	আউটপুট insulin protein ক্রমকে sequence record অবজেক্ট হিসাবে দেখায়।
03:10	এটি id এবং description সহ ক্রম দেখায়।
03:13	উপরোক্ত sequence record অবজেক্ট FASTA ফাইলে বদলাতে write ফাংশন ব্যবহার করব।
03:21	Bio প্যাকেজ থেকে SeqIO module ইম্পোর্ট করুন।
03:26	এরপর sequence অবজেক্ট FASTA ফাইলে বদলাতে write ফাংশন সহ command line লিখুন।
03:40	write ফাংশন 3 টি আর্গুমেন্ট নেয়।
03:44	প্রথমটি হল sequence record object সংরক্ষণ করার ভ্যারিয়েবল।
03:49	দ্বিতীয়টি FASTA ফাইল লিখতে ফাইলের নাম।
03:54	তৃতীয়টি লিখতে ফাইল ফরম্যাট। এন্টার টিপুন।
03:58	আউটপুট 1 দেখায় যার মানে আমরা sequence record object কে FASTA ফাইলে বদলেছি।
04:07	FASTA ফরম্যাটে ফাইল example.fasta হিসাবে home ফোল্ডারে সংরক্ষিত হয়।
04:13	আউটপুট একই নামের আগের যে কোনো বিদ্যমান ফাইলে ওভাররাইট হবে।
04:18	ফাইলটি দেখতে home ফোল্ডারে ফাইলে যান।
04:24	ফাইলটি টেক্সট এডিটরে খুলুন।
04:27	প্রোটিন ক্রম এখন FASTA ফরম্যাটে রয়েছে।
04:31	টেক্সট এডিটর বন্ধ করুন।
04:33	অনেক bioinformatics টুল বিভিন্ন ইনপুট ফাইল ফরম্যাট নেয়।
04:38	তাই মাঝে মাঝে sequence ফাইল ফরম্যাটে অন্তর-রূপান্তরণ করা প্রয়োজন।
04:44	আমরা SeqIO module এ convert ফাংশন দ্বারা ফাইল রূপান্তর করতে পারি।
04:50	এটি দেখতে GenBank ফাইলটি FASTA ফাইলে বদলাবো।
04:55	home ফোল্ডার থেকে GenBank ফাইল নিন।
04:59	এটি টেক্সট এডিটরে খুলুন।
05:02	ফাইল GenBank ফরম্যাটে HIV genome রাখে।
05:07	এই GenBank ফাইল, ফাইলের প্রথম অংশে genome এ সকল genes এর বর্ণন রাখে।
05:14	এরপর সম্পূর্ণ genome ক্রম আসে।
05:18	টেক্সট এডিটর বন্ধ করুন। টার্মিনাল এ নিম্ন লাইন লিখুন।
05:23	এখানে convert ফাংশন GenBank ফাইলে উপস্থিত সম্পূর্ণ genome কে FASTA ফাইলে বদলায়। এন্টার টিপুন।
05:33	নতুন ফাইল FASTA ফরম্যাটে home ফোল্ডারে HIV.fasta হিসাবে সংরক্ষণ হয়।
05:39	ফাইলে যান এবং টেক্সট এডিটর খুলুন।
05:46	টেক্সট এডিটর বন্ধ করুন।
05:49	যদিও আমরা convert ফাংশন দ্বারা ফাইল ফরম্যাট সহজে বদলাতে পারি, কিন্তু এর সীমাবদ্ধতা রয়েছে।
05:56	কিছু ফরম্যাট লিখতে তথ্য প্রয়োজন যা অন্য ফাইল ফরম্যাট রাখে না।
06:02	উদাহরণস্বরূপ: GenBank ফাইলকে FASTA ফাইলে বদলাতে পারি, কিন্তু বিপরীত করতে পারি না।
06:09	একইভাবে FASTQ ফাইল FASTA ফাইলে বদলাতে পারি, কিন্তু বিপরীত করতে পারি না।
06:15	convert ফাংশন সম্পর্কে অধিক জানতে লিখুন help কমান্ড।
06:21	এন্টার টিপুন।
06:24	প্রম্পটে ফিরে যেতে কীবোর্ডে q টিপুন।
06:28	আমরা GenBank ফরম্যাটে HIV genome থেকে পৃথক genes ও এক্সট্র্যাক্ট করতে পারি।
06:35	এটি পৃথক genes, FASTA বা অন্য কোন ফরম্যাটে সংরক্ষণ করা যেতে পারে।
06:41	এর জন্য, প্রম্পটে নিম্ন কোড লিখুন।
06:47	এই কোড ফাইলে সকল পৃথক CDS জিন সিকোয়েন্স, তাদের ids এবং gene এর নাম লিখবে।
06:56	ফাইলটি আপনার home ফোল্ডারে HIV_geneseq.fasta হিসেবে সংরক্ষিত হয়। এন্টার টিপুন।
07:07	Biopython টুল্স দ্বারা আমরা ফাইলে রেকর্ডের দৈর্ঘ্য সর্ট করতে পারি।
07:12	এখানে FASTA ফাইল hemoglobin.fasta খুলেছি যা ছটি রেকর্ড রাখে।
07:19	প্রতিটি রেকর্ড ভিন্ন ভিন্ন দৈর্ঘ্যের।
07:23	সবচেয়ে দীর্ঘতম রেকর্ড ব্যবস্থিত জন্য নিম্ন লাইন লিখুন।
07:27	সর্ট করা সিকোয়েন্স সহ নতুন ফাইল home ফোল্ডারে sorted_hemoglobin.fasta হিসাবে সংরক্ষণ করা হবে।
07:38	প্রথমে ছোট রেকর্ডের জন্য records.sort কমান্ড লাইনে আর্গুমেন্টস রিভার্স করুন।
07:45	সংক্ষিপ্তকরণ করি। এই টিউটোরিয়ালে সিকোয়েন্স রেকর্ড অবজেক্ট বানানো শিখেছি।
07:51	Sequence Input/Output মডিউলের write ফাংশন দ্বারা সিকোয়েন্স ফাইল লিখুন।
07:58	convert ফাংশন দ্বারা সিকোয়েন্স ফাইল ফরম্যাটের রূপান্তরণ।
08:03	এবং দৈর্ঘ্য দ্বারা ফাইলে রেকর্ড সর্ট করুন।
08:07	অনুশীলনী:
08:09	HIV এর genomic ক্রম থেকে 4587 থেকে 5165 স্থান পর্যন্ত জিন HIV1gp3 এক্সট্র্যাক্ট করুন।
08:21	HIV.gb ফাইল এই টিউটোরিয়ালের কোড ফাইলসে অন্তর্ভুক্ত হয়েছে।
08:28	আপনার সম্পন্ন কাজটি নিম্ন কোডটি রাখবে।
08:43	এই লিঙ্কে উপলব্ধ ভিডিওটি প্রকল্পকে সারসংক্ষেপে বোঝায়।
08:48	এটি ডাউনলোড করে দেখুন। স্পোকেন টিউটোরিয়াল প্রকল্প দল কর্মশালার আয়োজন করে এবং অনলাইন পরীক্ষা পাস করলে প্রশংসাপত্র দেয়।
08:57	অধিক জানতে আমাদের সাথে যোগাযোগ করুন।
09:00	স্পোকেন টিউটোরিয়াল প্রকল্প ভারত সরকারের NMEICT, MHRD দ্বারা সমর্থিত।
09:06	এই বিষয়ে বিস্তারিত তথ্য এই লিঙ্কে প্রাপ্তিসাধ্য।
09:10	আইআইটি বোম্বে থেকে আমি বিদায় নিচ্ছি। অংশগ্রহণের জন্য ধন্যবাদ।

Contributors and Content Editors

Satarupadutta

Biopython/C2/Writing-Sequence-Files/Bengali

Contributors and Content Editors

Navigation menu

Personal tools

Namespaces

Variants

Views

Actions

Search

Navigation

Tools