Biopython/C2/Blast/Bengali
From Script | Spoken-Tutorial
|
|
---|---|
00:01 | Biopython টুল্স ব্যবহার করে BLAST এর টিউটোরিয়ালে আপনাদের স্বাগত। |
00:06 | এখানে Biopython টুল্স ব্যবহার করে query sequence এর জন্য BLAST রান করা শিখব। |
00:13 | এবং আরো বিশ্লেষণের জন্য BLAST আউটপুট parse করা। |
00:17 | টিউটোরিয়ালটি অনুসরণ করতে স্নাতক স্তরের বায়োকেমিস্ট্রি বা বায়োইনফরমেটিক্স |
00:24 | এবং মৌলিক Python প্রোগ্রামিং সম্পর্কে জানতে হবে। |
00:27 | প্রদত্ত লিঙ্কে Python টিউটোরিয়াল দেখুন। |
00:31 | টিউটোরিয়ালটি রেকর্ড করতে ব্যবহার করছি: উবুন্টু OS সংস্করণ 14.10 |
00:37 | Python সংস্করণ 2.7.8 |
00:41 | Ipython interpretor সংস্করণ 2.3.0 |
00:46 | Biopython সংস্করণ 1.64 এবং একটি কার্যকর ইন্টারনেট সংযোগ। |
00:52 | BLAST এর মানে Basic Local Alignment Search Tool. |
00:57 | এটি ক্রমের তথ্য তুলনা করার একটি অ্যালগরিদম। |
01:02 | প্রোগ্রাম ডেটাবেসের ক্রমের তুলনা nucleotide বা protein ক্রমের সাথে করে এবং মিলগুলির পরিসংখ্যানগত গুরুত্ব গণনা করে। |
01:14 | BLAST রান করার দুটি ভিন্ন উপায় রয়েছে: |
01:17 | আপনার মেশিনে লোকাল BLAST বা NCBI সার্ভার দ্বারা ইন্টারনেটে BLAST রান করা। |
01:24 | Biopython এ BLAST রান করার দুটি ধাপ রয়েছে। |
01:28 | প্রথমে, ক্যোয়ারীর ক্রমের জন্য BLAST রান করে কিছু আউটপুট পান। |
01:33 | দ্বিতীয়, আরো বিশ্লেষণের জন্য BLAST আউটপুট parse করুন। |
01:38 | আমরা টার্মিনাল খুলে নিউক্লিওটাইড ক্রমের জন্য BLAST রান করব। |
01:43 | Ctrl, Alt এবং T কী একসাথে টিপে টার্মিনাল খুলুন। |
01:48 | প্রম্পটে লিখুন: ipython এবং এন্টার টিপুন। |
01:52 | এই টিউটোরিয়ালে NCBI BLAST সার্ভিস ব্যবহার করে ইন্টারনেটে BLAST রান করা দেখবো। |
02:01 | প্রম্পটে নিম্ন লিখুন: from Bio.Blast Import NCBIWWW, Enter টিপুন। |
02:14 | এরপর ইন্টারনেটে BLAST রান করতে প্রম্পটে নিম্ন লিখুন। |
02:20 | NCBIWWW মডিউল এ qblast function ফাংশন ব্যবহার করব। |
02:25 | qblast ফাংশন তিনটি আর্গুমেন্ট নেয়: |
02:29 | প্রথম আর্গুমেন্ট blast program খুঁজতে ব্যবহৃত হয়। |
02:33 | দ্বিতীয়ত, সেই ডেটাবেস নির্দিষ্ট করা যার বিরুদ্ধে খোঁজা হচ্ছে। |
02:38 | তৃতীয় আর্গুমেন্ট হল query sequence. |
02:43 | ক্যোয়ারির ক্রমের জন্য ইনপুট GI নম্বর বা FASTA ফাইলের আকারে হতে পারে। বা এটি sequence record object ও হতে পারে। |
02:53 | এটি দেখাতে nucleotide sequence এর জন্য GI নম্বর ব্যবহার করছি। |
02:58 | GI নম্বর insulin এর nucleotide sequence এর জন্য। |
03:03 | qblast ফাংশন অন্য বিকল্প আর্গুমেন্টও নেয়। |
03:09 | এই আর্গুমেন্ট বিভিন্ন আর্গুমেন্টের সমান যা BLAST পেজে সেট করতে পারেন। |
03:15 | qblast ফাংশন xml ফরম্যাটে BLAST ফলাফল রিটার্ন করবে। |
03:20 | টার্মিনালে ফিরে যান। |
03:22 | query sequence, nucleotide না protein sequence, এর উপর ভিত্তি করে উপযুক্ত Blast প্রোগ্রাম ব্যবহার করতে হবে। |
03:30 | যেহেতু কোয়েরি হল nucleotide, আমরা blastn প্রোগ্রাম ব্যবহার করব এবং nt, nucleotide ডাটাবেস বোঝায়। |
03:39 | এই সম্পর্কে বর্ণন NCBI BLAST ওয়েবপেজে উপলব্ধ। |
03:45 | blast আউটপুট xml ফাইলের আকারে, result নামে ভ্যারিয়েবলে সংরক্ষিত হয়। |
03:51 | এন্টার টিপুন। |
03:53 | ইন্টারনেটের গতির উপর নির্ভর করে, এটি BLAST এর খোঁজ পুরো করতে কিছু সময় নেবে। |
03:59 | এগোনোর আগে xml ফাইল ডিস্কে সংরক্ষণ করা গুরুত্বপূর্ণ। |
04:05 | xml ফাইলটি সংরক্ষণ করতে নিম্ন লাইনটি লিখুন। |
04:09 | কোডের এই লাইন home ফোল্ডারে blast.xml হিসাবে খোঁজের ফলাফল সংরক্ষণ করবে। |
04:18 | home ফোল্ডারে যান এবং ফাইলটি খুঁজুন। |
04:21 | ফাইলে টিপুন এবং ফাইলের বিষয়বস্তু যাচাই করুন। |
04:30 | আপনি FASTA ফাইল query হিসাবে ব্যবহার করতে চাইলে এই টেক্সট ফাইলে প্রদর্শিত কোড ব্যবহার করুন। |
04:36 | আপনি query এর মত একটি FASTA ফাইল থেকে sequence record object ব্যবহার করতে চাইলে, এটি সেই কোড। |
04:42 | টার্মিনাল ফিরে যান। |
04:44 | পরের ধাপ, ডেটা এক্সট্র্যাক্ট করতে ফাইল parse করা। |
04:48 | পার্সিং এ প্রথম ধাপ হল ইনপুটের জন্য xml ফাইল খোলা। |
04:53 | প্রম্পটে নিম্ন লিখুন। এন্টার টিপুন। |
04:57 | এরপর Bio.Blast প্যাকেজ থেকে NCBIXML মডিউল ইম্পোর্ট করুন। |
05:05 | Enter টিপুন। |
05:07 | Blast আউটপুট parse করতে নিম্ন লাইনটি লিখুন। |
05:11 | BLAST record সকল তথ্য রাখে যা BLAST আউটপুট থেকে এক্সট্র্যাক্ট করতে চান। |
05:18 | এখন BLAST record এ সকল hits এর কিছু তথ্য প্রিন্ট করি যা একটি নির্দিষ্ট থ্রেশহোল্ডের চেয়ে বড়। |
05:27 | নীচের কোড লিখুন। |
05:30 | match গুরুত্বপূর্ণ হওয়ার জন্য অপেক্ষিত স্কোর 0.01 চেয়ে কম হওয়া উচিত। |
05:37 | প্রতিটি hsp অর্থাৎ হাই স্কোরিং পেয়ার এর জন্য আমরা title, length, hsp score, gaps এবং expect value পাই। |
05:49 | আমরা ক্যোয়ারী রাখা স্ট্রিংস, এলাইন করা ডেটাবেস সিকোয়েন্স এবং স্ট্রিং যা ম্যাচ এবং মিসম্যাচ স্থিতি নির্দিষ্ট করে সেটিও প্রিন্ট করব। |
06:02 | আউটপুট পেতে দুইবার এন্টার কী টিপুন। |
06:05 | আউটপুট দেখুন। |
06:09 | প্রতিটি এলাইনমেন্টের জন্য length, score, gaps, e value এবং strings রয়েছে। |
06:16 | Bio.Blast প্যাকেজে উপলব্ধ অন্যান্য ফাংশন দ্বারা প্রয়োজনীয় তথ্য এক্সটার্ক্ট করতে পারেন। |
06:24 | আমরা টিউটোরিয়ালের শেষে এসেছি। |
06:26 | সংক্ষেপে, এখানে GI নম্বর দ্বারা কোয়েরি নিউক্লিওটাইডের ক্রমের জন্য BLAST ফাংশন রান করা |
06:36 | এবং Bio.Blast.Record মডিউল দ্বারা BLAST আউটপুট parse করা শিখেছি। |
06:43 | অনুশীলনী রূপে, আপনার পছন্দের প্রোটিন ক্রমের জন্য BLAST Search রান করুন। |
06:50 | আউটপুট ফাইল সংরক্ষণ করে ফাইলে থাকা ডেটা parse করুন। |
06:55 | আপনার সম্পন্ন কাজ এই ফাইলে দেখানোর মত কোডের নিম্ন লাইনে রাখা উচিত। |
07:01 | কোড দেখুন। যেহেতু query হল protein sequence, আমরা blastp প্রোগ্রাম এবং nr যা BLAST এর জন্য নন-রিডান্ডেন্ট প্রোটিন ডাটাবেস তা ব্যবহার করেছি। |
07:16 | এই লিঙ্কে উপলব্ধ ভিডিওটি প্রকল্পকে সারসংক্ষেপে বোঝায়। |
07:20 | এটি ডাউনলোড করে দেখুন। |
07:22 | স্পোকেন টিউটোরিয়াল প্রকল্প দল কর্মশালার আয়োজন করে এবং অনলাইন পরীক্ষা পাস করলে প্রশংসাপত্র দেয়। |
07:30 | অধিক জানতে আমাদের সাথে যোগাযোগ করুন। |
07:33 | স্পোকেন টিউটোরিয়াল প্রকল্প ভারত সরকারের NMEICT, MHRD দ্বারা সমর্থিত। |
07:40 | এই বিষয়ে বিস্তারিত তথ্য এই লিঙ্কে প্রাপ্তিসাধ্য। |
07:45 | আইআইটি বোম্বে থেকে আমি বিদায় নিচ্ছি। অংশগ্রহণের জন্য ধন্যবাদ। |