Biopython/C2/Blast/Bengali

From Script | Spoken-Tutorial
Jump to: navigation, search
Time
Narration
00:01 Biopython টুল্স ব্যবহার করে BLAST এর টিউটোরিয়ালে আপনাদের স্বাগত।
00:06 এখানে Biopython টুল্স ব্যবহার করে query sequence এর জন্য BLAST রান করা শিখব।
00:13 এবং আরো বিশ্লেষণের জন্য BLAST আউটপুট parse করা।
00:17 টিউটোরিয়ালটি অনুসরণ করতে স্নাতক স্তরের বায়োকেমিস্ট্রি বা বায়োইনফরমেটিক্স
00:24 এবং মৌলিক Python প্রোগ্রামিং সম্পর্কে জানতে হবে।
00:27 প্রদত্ত লিঙ্কে Python টিউটোরিয়াল দেখুন।
00:31 টিউটোরিয়ালটি রেকর্ড করতে ব্যবহার করছি: উবুন্টু OS সংস্করণ 14.10
00:37 Python সংস্করণ 2.7.8
00:41 Ipython interpretor সংস্করণ 2.3.0
00:46 Biopython সংস্করণ 1.64 এবং একটি কার্যকর ইন্টারনেট সংযোগ।
00:52 BLAST এর মানে Basic Local Alignment Search Tool.
00:57 এটি ক্রমের তথ্য তুলনা করার একটি অ্যালগরিদম।
01:02 প্রোগ্রাম ডেটাবেসের ক্রমের তুলনা nucleotide বা protein ক্রমের সাথে করে এবং মিলগুলির পরিসংখ্যানগত গুরুত্ব গণনা করে।
01:14 BLAST রান করার দুটি ভিন্ন উপায় রয়েছে:
01:17 আপনার মেশিনে লোকাল BLAST বা NCBI সার্ভার দ্বারা ইন্টারনেটে BLAST রান করা।
01:24 Biopython এ BLAST রান করার দুটি ধাপ রয়েছে।
01:28 প্রথমে, ক্যোয়ারীর ক্রমের জন্য BLAST রান করে কিছু আউটপুট পান।
01:33 দ্বিতীয়, আরো বিশ্লেষণের জন্য BLAST আউটপুট parse করুন।
01:38 আমরা টার্মিনাল খুলে নিউক্লিওটাইড ক্রমের জন্য BLAST রান করব।
01:43 Ctrl, Alt এবং T কী একসাথে টিপে টার্মিনাল খুলুন।
01:48 প্রম্পটে লিখুন: ipython এবং এন্টার টিপুন।
01:52 এই টিউটোরিয়ালে NCBI BLAST সার্ভিস ব্যবহার করে ইন্টারনেটে BLAST রান করা দেখবো।
02:01 প্রম্পটে নিম্ন লিখুন: from Bio.Blast Import NCBIWWW, Enter টিপুন।
02:14 এরপর ইন্টারনেটে BLAST রান করতে প্রম্পটে নিম্ন লিখুন।
02:20 NCBIWWW মডিউল এ qblast function ফাংশন ব্যবহার করব।
02:25 qblast ফাংশন তিনটি আর্গুমেন্ট নেয়:
02:29 প্রথম আর্গুমেন্ট blast program খুঁজতে ব্যবহৃত হয়।
02:33 দ্বিতীয়ত, সেই ডেটাবেস নির্দিষ্ট করা যার বিরুদ্ধে খোঁজা হচ্ছে।
02:38 তৃতীয় আর্গুমেন্ট হল query sequence.
02:43 ক্যোয়ারির ক্রমের জন্য ইনপুট GI নম্বর বা FASTA ফাইলের আকারে হতে পারে। বা এটি sequence record object ও হতে পারে।
02:53 এটি দেখাতে nucleotide sequence এর জন্য GI নম্বর ব্যবহার করছি।
02:58 GI নম্বর insulin এর nucleotide sequence এর জন্য।
03:03 qblast ফাংশন অন্য বিকল্প আর্গুমেন্টও নেয়।
03:09 এই আর্গুমেন্ট বিভিন্ন আর্গুমেন্টের সমান যা BLAST পেজে সেট করতে পারেন।
03:15 qblast ফাংশন xml ফরম্যাটে BLAST ফলাফল রিটার্ন করবে।
03:20 টার্মিনালে ফিরে যান।
03:22 query sequence, nucleotide না protein sequence, এর উপর ভিত্তি করে উপযুক্ত Blast প্রোগ্রাম ব্যবহার করতে হবে।
03:30 যেহেতু কোয়েরি হল nucleotide, আমরা blastn প্রোগ্রাম ব্যবহার করব এবং nt, nucleotide ডাটাবেস বোঝায়।
03:39 এই সম্পর্কে বর্ণন NCBI BLAST ওয়েবপেজে উপলব্ধ।
03:45 blast আউটপুট xml ফাইলের আকারে, result নামে ভ্যারিয়েবলে সংরক্ষিত হয়।
03:51 এন্টার টিপুন।
03:53 ইন্টারনেটের গতির উপর নির্ভর করে, এটি BLAST এর খোঁজ পুরো করতে কিছু সময় নেবে।
03:59 এগোনোর আগে xml ফাইল ডিস্কে সংরক্ষণ করা গুরুত্বপূর্ণ।
04:05 xml ফাইলটি সংরক্ষণ করতে নিম্ন লাইনটি লিখুন।
04:09 কোডের এই লাইন home ফোল্ডারে blast.xml হিসাবে খোঁজের ফলাফল সংরক্ষণ করবে।
04:18 home ফোল্ডারে যান এবং ফাইলটি খুঁজুন।
04:21 ফাইলে টিপুন এবং ফাইলের বিষয়বস্তু যাচাই করুন।
04:30 আপনি FASTA ফাইল query হিসাবে ব্যবহার করতে চাইলে এই টেক্সট ফাইলে প্রদর্শিত কোড ব্যবহার করুন।
04:36 আপনি query এর মত একটি FASTA ফাইল থেকে sequence record object ব্যবহার করতে চাইলে, এটি সেই কোড।
04:42 টার্মিনাল ফিরে যান।
04:44 পরের ধাপ, ডেটা এক্সট্র্যাক্ট করতে ফাইল parse করা।
04:48 পার্সিং এ প্রথম ধাপ হল ইনপুটের জন্য xml ফাইল খোলা।
04:53 প্রম্পটে নিম্ন লিখুন। এন্টার টিপুন।
04:57 এরপর Bio.Blast প্যাকেজ থেকে NCBIXML মডিউল ইম্পোর্ট করুন।
05:05 Enter টিপুন।
05:07 Blast আউটপুট parse করতে নিম্ন লাইনটি লিখুন।
05:11 BLAST record সকল তথ্য রাখে যা BLAST আউটপুট থেকে এক্সট্র্যাক্ট করতে চান।
05:18 এখন BLAST record এ সকল hits এর কিছু তথ্য প্রিন্ট করি যা একটি নির্দিষ্ট থ্রেশহোল্ডের চেয়ে বড়।
05:27 নীচের কোড লিখুন।
05:30 match গুরুত্বপূর্ণ হওয়ার জন্য অপেক্ষিত স্কোর 0.01 চেয়ে কম হওয়া উচিত।
05:37 প্রতিটি hsp অর্থাৎ হাই স্কোরিং পেয়ার এর জন্য আমরা title, length, hsp score, gaps এবং expect value পাই।
05:49 আমরা ক্যোয়ারী রাখা স্ট্রিংস, এলাইন করা ডেটাবেস সিকোয়েন্স এবং স্ট্রিং যা ম্যাচ এবং মিসম্যাচ স্থিতি নির্দিষ্ট করে সেটিও প্রিন্ট করব।
06:02 আউটপুট পেতে দুইবার এন্টার কী টিপুন।
06:05 আউটপুট দেখুন।
06:09 প্রতিটি এলাইনমেন্টের জন্য length, score, gaps, e value এবং strings রয়েছে।
06:16 Bio.Blast প্যাকেজে উপলব্ধ অন্যান্য ফাংশন দ্বারা প্রয়োজনীয় তথ্য এক্সটার্ক্ট করতে পারেন।
06:24 আমরা টিউটোরিয়ালের শেষে এসেছি।
06:26 সংক্ষেপে, এখানে GI নম্বর দ্বারা কোয়েরি নিউক্লিওটাইডের ক্রমের জন্য BLAST ফাংশন রান করা
06:36 এবং Bio.Blast.Record মডিউল দ্বারা BLAST আউটপুট parse করা শিখেছি।
06:43 অনুশীলনী রূপে, আপনার পছন্দের প্রোটিন ক্রমের জন্য BLAST Search রান করুন।
06:50 আউটপুট ফাইল সংরক্ষণ করে ফাইলে থাকা ডেটা parse করুন।
06:55 আপনার সম্পন্ন কাজ এই ফাইলে দেখানোর মত কোডের নিম্ন লাইনে রাখা উচিত।
07:01 কোড দেখুন। যেহেতু query হল protein sequence, আমরা blastp প্রোগ্রাম এবং nr যা BLAST এর জন্য নন-রিডান্ডেন্ট প্রোটিন ডাটাবেস তা ব্যবহার করেছি।
07:16 এই লিঙ্কে উপলব্ধ ভিডিওটি প্রকল্পকে সারসংক্ষেপে বোঝায়।
07:20 এটি ডাউনলোড করে দেখুন।
07:22 স্পোকেন টিউটোরিয়াল প্রকল্প দল কর্মশালার আয়োজন করে এবং অনলাইন পরীক্ষা পাস করলে প্রশংসাপত্র দেয়।
07:30 অধিক জানতে আমাদের সাথে যোগাযোগ করুন।
07:33 স্পোকেন টিউটোরিয়াল প্রকল্প ভারত সরকারের NMEICT, MHRD দ্বারা সমর্থিত।
07:40 এই বিষয়ে বিস্তারিত তথ্য এই লিঙ্কে প্রাপ্তিসাধ্য।
07:45 আইআইটি বোম্বে থেকে আমি বিদায় নিচ্ছি। অংশগ্রহণের জন্য ধন্যবাদ।

Contributors and Content Editors

Satarupadutta