Biopython/C2/Parsing-Data/Assamese

From Script | Spoken-Tutorial
Revision as of 11:16, 3 April 2019 by Mousumi (Talk | contribs)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to: navigation, search
Time
Narration
00:01 Parsing Data এৰ টিউটোৰিয়েলত আপোনাক স্বাগতম।
00:06 ইয়াতে শিকিম NCBI ডাটাবেস ওয়েবসাইটৰ পৰা FASTA আৰু GenBank ফাইল ডাউনলোড কৰা আৰু
00:14 Sequence Input/Output মডিউলত ফাংশনৰ দ্বাৰা ডেটা ফাইল Parse কৰা।
00:19 টিউটোৰিয়েলটো অনুসৰণ কৰিবলৈ অস্নাতকৰ বায়োকেমিস্ট্ৰ বা বায়োইনফৰমেটিক্স
00:26 আৰু মৌলিক Python প্ৰোগ্ৰামিং সম্পর্কে জানোব লাগিব।
00:30 প্ৰদত্ত লিঙ্কত Python টিউটোৰিয়েল চাওক।
00:34 টিউটোৰিয়েলটো ৰেকর্ড কৰিবলৈ ব্যবহাৰ কৰিছো: উবুন্টু OS সংস্কৰণ 14.10
00:40 Python সংস্কৰণ 2.7.8
00:44 Ipython interpretor সংস্কৰণ 2.3.0
00:48 Biopython সংস্কৰণ 1.64 আৰু Mozilla Firefox ব্ৰাউজাৰ 35.0.
00:56 বায়োলজিত বৈজ্ঞানিক তথ্য সাধাৰণতে টেক্সট ফাইল যেনে FASTA, GenBank, Swiss-Prot, EMBL ইত্যাদিত সংৰক্ষিত হয়।
01:07 ডেটা ফাইল ডাটাবেস ওয়েবসাইটৰ পৰা ডাউনলোড কৰা যাব পাৰে।
01:12 যি কোনো ওয়েব ব্ৰাউজাৰত, তলত দিয়া ওয়েবসাইটৰ লিঙ্কটো খুলক।
01:17 এটা ওয়েব পৃষ্ঠা খোলে।
01:19 এতিয়া মানুহৰ insulin gene এৰ বাবে FASTA আৰু GenBank ফাইল ডাউনলোড কৰো।
01:25 সার্চ বাক্সত লিখক: human insulin, Search বোতামত ক্লিক কৰক।
01:31 ওয়েব পৃষ্ঠা মানুহৰ insulin gene এৰ অনেক ফাইল দেখায়।
01:35 প্ৰদর্শন কৰিবলৈ মই Homo sapiens Insulin mRNA নামৰ 4টা ফাইল চয়ন কৰিম।
01:43 মই 500 এৰ কম বেস পেয়ার্স ৰাখা ফাইলবোৰ চয়ন কৰিম।
01:48 ডাউনলোডৰ বাবে ফাইল চয়ন কৰিবলৈ চেক-বাক্সত ক্লিক কৰক।
01:56 কার্সাৰ Send to বিকল্পত লৈ যাওক যি পৃষ্ঠাৰ উপৰৰ সোফালে আছে।
02:02 ডাউন এৰোৰ সৈতে সৰু চয়নিত বোতামত ক্লিক কৰক যি Send To বোতামৰ উচৰত আছে।
02:09 Choose destinationত, File বিকল্পত ক্লিক কৰক।
02:13 আপোনি এই ফাইলক যি কোনো ফাইল ফৰম্যাটত সংৰক্ষণ কৰিব পাৰে, যি format ড্ৰপ-ডাউন তালিকা বাক্সত সূচীবদ্ধ।
02:21 প্ৰদত্ত বিকল্প পৰা FASTA চয়ন কৰক।
02:25 তাৰপিছত Create File বিকল্পত ক্লিক কৰক।
02:29 স্ক্ৰীনত এটা ডায়ালগ বাক্স দেখায়।
02:32 Open with চয়ন কৰক, OK ত লিক কৰক।
02:36 টেক্সট এডিটৰত এটা ফাইল খোলে।
02:39 ফাইলটোৱে 4টা ৰেকর্ড দেখায়, কাৰণ ডাউনলোড কৰিবলৈ মই চাৰিটা ফাইল চয়ন কৰিছো।
02:46 প্ৰত্যেক ৰেকর্ডৰ প্ৰথম লাইন হল identifier লাইন।
02:50 এইটোৱে (>) চিহ্ন দি আৰম্ভ কৰে।
02:53 ইয়াৰ পিছত sequence আছে।
02:56 ফাইলটো হোম ফোল্ডাৰত sequence.fasta হিসাবে সংৰক্ষণ কৰক।
03:01 টেক্সট এডিটৰ বন্ধ কৰক।
03:03 পূর্বে চয়নিত একেই ফাইলসৰ বাবে GenBank ফৰম্যাটত ফাইল ডাউনলোড কৰিবলৈ উপৰৰ মতে ধাপবোৰ অনুসৰণ কৰক।
03:12 file format ত GenBank চয়ন কৰক।
03:16 এটা ফাইল বনাওক। টেক্সট এডিটৰৰ সৈতে খুলক।
03:21 লক্ষ্য কৰক GenBank ফৰম্যাটত থকা সিকোয়েন্স ফাইলটোত FASTA ফাইলৰ তুলনাত অধিক বৈশিষ্ট্য আছে।
03:27 ফাইলটোক home ফোল্ডাৰত sequence.gb হিসাবে সংৰক্ষণ কৰক। টেক্সট এডিটৰক বন্ধ কৰক।
03:34 প্ৰদর্শন কৰিবলৈ একক ৰেকর্ড সহ এটা FASTA ফাইলৰ প্ৰয়োজন।
03:39 ইয়াৰ বাবে চেক বাক্সত আকৌ এবাৰ ক্লিক কৰি আগৰ চয়নটো মুছি পেলাওক।
03:48 এতিয়া Human insulin gene complete cds ফাইলটো চয়ন কৰক।
03:54 চেক-বক্সে ক্লিক কৰক।
03:57 home ফোল্ডাৰত ফাইল সংৰক্ষণ কৰিলবৈ আগেই দেখোৱা একেই ধাপ অনুসৰণ কৰক।
04:01 ফাইলটো insulin.fasta হিসাবে সংৰক্ষণ কৰক।
04:08 এই ফাইলত সংৰক্ষিত বায়োলজিকাল ডেটা Biopython লাইব্ৰৰীৰ মাধ্যমেৰে এক্সট্র্যাক্ট আৰু সংশোধন কৰা যাব পাৰে।
04:16 টেক্সট এডিটৰ বন্ধ কৰক।
04:19 ডেটা ফাইলৰ পৰা ডেটা এক্সট্র্যাক্ট কৰাক Parsing বোলে।
04:23 অধিকতৰ ফাইল ফৰম্যাট SeqIO মডিউলত উপলব্ধ ফাংশন দ্বাৰা পার্স কৰা যায়।
04:30 SeqIO মডিউলৰ অধিকতৰ ব্যবহৃত ফাংশন হল: parse, read, write আৰু convert
04:38 Ctrl, Alt আৰু T কী একেসৈতে টিপি টার্মিনেল খুলক।
04:44 প্ৰম্পটত ipython লিখি Ipython আৰম্ভ কৰক। এন্টাৰ টিপক।
04:51 ইয়াৰ পিছত, Bio প্যাকেজৰ পৰা SeqIO মডিউল ইম্পোর্ট কৰক।
04:56 প্ৰম্পটত লিখক: from Bio import SeqIO, এন্টাৰ টিপক।
05:04 মই সবতচে গুৰুত্বপূর্ণ ফাংশন parse দিয়ে আৰম্ভ কৰিম।
05:07 প্ৰদর্শন কৰিবলৈ মই সেই FASTA ফাইল ব্যবহাৰ কৰিম যত অনেক ৰেকর্ড আছে যাক ডেটাবেসৰ পৰা আগেই ডাউনলোড কৰিছো।
05:17 সহজ FASTA পার্সিংয়ৰ বাবে প্ৰম্পটত নিম্ন লিখক।
05:22 ইয়াতে sequence.fasta ফাইলৰ বিষয় বস্তু পড়িবলৈ parse ফাংশন ব্যবহাৰ কৰিছো।
05:30 আউটপুটৰ বাবে record id, ৰেকর্ডত উপস্থিত সিকোয়েন্স আৰু সিকোয়েন্সৰ দৈর্ঘ্য প্ৰিন্ট কৰে।
05:41 আৰু লক্ষ্য কৰক যে, সিকোয়েন্স ডেটাক Sequence record objects হিসাবে পড়িবলৈ parse ফাংশন ব্যবহৃত হয়।
05:48 এইটো সাধাৰণতে for লুপৰ বাবে ব্যবহৃত হয়।
05:52 এইটোৱে দুটা আর্গুমেন্ট গ্ৰহণ কৰিব পাৰে, প্ৰথমটো হল ডেটা পড়িবলৈ ফাইলৰ নাম।
05:59 দ্বিতীয়টোৱে ফাইল ফৰম্যাট নির্দিষ্ট কৰে।
06:02 আউটপুট পাবলৈ এন্টাৰ কী দুইবাৰ টিপক।
06:07 আউটপুটে identifier line এৰ পিছত ফাইলত অন্তর্ভুক্ত সিকোয়েন্স আৰু ফাইলত সকলো ৰেকর্ডৰ বাবে সিকোয়েন্স দৈর্ঘ্যও দেখায়।
06:21 লক্ষ্য কৰক যে FASTA ফৰম্যাটে অাখৰ নির্দিষ্ট নকৰে।
06:26 সেয়ে আউটপুটে এইটোক DNA সিকোয়েন্স হিসাবে নির্দিষ্ট নকৰে।
06:31 একেই ধাপবোৰ GenBank ফাইল পার্সিং কৰিবলৈ পুনৰাবৃত্তি কৰা যায়।
06:36 প্ৰদর্শন কৰিবলৈ GenBank ফাইল ব্যবহাৰ কৰিম যাক আগেই ডাটাবেসৰ পৰা ডাউনলোড কৰিছো।
06:43 কোডৰ লাইন যাক আগেই ব্যবহাৰ কৰিছিলো তাক পাবলৈ আপ এৰো কী টিপক।
06:49 ফাইলৰ নাম সলায় sequence.gb কৰক।
06:53 ফাইল ফৰম্যাটক genbank কৰক।
06:56 বাকি কোডক একেই ৰাখক।
06:58 আউটপুট পাবলৈ এন্টাৰ কী দুইবাৰ টিপক।
07:03 ইয়াতেও আউটপুটত, ফাইলত থকা সকলো ৰেকর্ডৰ বাবে record id, sequence আৰু সিকোয়েন্স এৰ দৈর্ঘ্য দেখায়।
07:12 লক্ষ্য কৰক যে GenBank ফৰম্যাটে সিকোয়েন্সক DNA সিকোয়েন্সৰ মতে নির্দিষ্ট কৰে।
07:19 একেইভাবে, Swiss-prot আৰু EMBL ফাইলক উপৰৰ নিচিনা একেই কোড ব্যবহাৰ কৰি পার্স কৰা যায়।
07:27 আপোনাৰ ফাইলত একক ৰেকর্ড থাকিলে parsing এৰ বাবে নিম্নোক্ত কোড লিখক।
07:34 ইয়াতে, মই একক ৰেকর্ড সহ পূর্বে সংৰক্ষিত FASTA ফাইল ব্যবহাৰ কৰিম, উদাহৰণস্বৰুপে insulin.fasta.
07:43 লক্ষ্য কৰক মই parse ফাংশনৰ সলনি read ফাংশন ব্যবহাৰ কৰিছো। এন্টাৰ টিপক।
07:50 আউটপুটে insulin.fasta ফাইলৰ বাবে কন্টেন্ট দেখায়।
07:55 এইটোৱে sequence record object এৰ মতে সিকোয়েন্স দেখায়
07:59 আৰু অন্যান্য এট্ৰিবিউট যেনে GI, accession number আৰু description দেখায়।
08:06 মই নিম্নৰ মতে এই ৰেকর্ডৰ স্বতন্ত্র এট্ৰিবিউট দেখিব পাৰো।
08:11 প্ৰম্পটত লিখক: record dot seq এন্টাৰ টিপক।
08:18 আউটপুটে ফাইলত উপস্থিত সিকোয়েন্স দেখায়।
08:22 এই ৰেকর্ডৰ বাবে আইডেন্টিফায়ার্স চাবলৈ লিখক: record dot id এন্টাৰ টিপক।
08:29 আউটপুটে GI নম্বৰ আৰু এক্সেশন নম্বৰ ইত্যাদি দেখায়।
08:34 আপোনি পছন্দৰ ডেটা ফাইল parse কৰিবলৈ উপৰত বর্ণিত ফাংশন ব্যবহাৰ কৰিব পাৰে।
08:40 এতিয়া, সংক্ষিপ্তকৰণ কৰো।
08:42 ইয়াতে NCBI ডেটাবেস ওয়েবসাইটৰ পৰা FASTA আৰু GenBank ফাইল ডাউনলোড কৰা আৰু SeqIO মডিউলৰ পৰা parse আৰু read ফাংশন ব্যবহাৰ কৰা শিকিছো।
08:55 FASTA আৰু GenBank ফাইলৰ পৰা ডেটা যেনে record ids, ডিস্ক্রিপশন আৰু সিকোয়েন্স এক্সট্র্যাক্ট কৰা।
09:03 অনুশীলনী হিসাবে-
09:06 NCBI ডেটাবেসৰ পৰা পছন্দৰ নিউক্লিওটাইড সিকোয়েন্সৰ বাবে FASTA ফাইল ডাউনলোড কৰক।
09:13 সিকোয়েন্সৰ ফাইলক তাৰ reverse complements ত সলাওক।
09:17 আপোনাৰ সম্পন্ন কামটোৰ কোডত নিম্নোক্ত লাইন থাকিব লাগে।
09:22 FASTA ফাইলৰ পৰা নিউক্লিওটাইড সিকোয়েন্স লোড কৰিবলৈ parse ফাংশন ব্যবহাৰ কৰক।
09:28 ইয়াৰ পিছত, reverse complement মেথডত নির্মিত সিকোয়েন্স অবজেক্টৰ দ্বাৰা ৰিভার্স কমপ্লিমেন্ট প্ৰিন্ট  কৰক।
09:37 এই লিঙ্কত উপলব্ধ ভিডিওটোৱে প্ৰকল্পক সাৰসংক্ষেপে বোঝায়।
09:42 এইটোক ডাউনলোড কৰি চাওক।
09:44 স্পোকেন টিউটোৰিয়েল প্ৰকল্প দলে কর্মশালাৰ আয়োজন কৰে আৰু অনলাইন পৰীক্ষা পাস কৰিলে প্ৰশংসাপত্ৰ দিয়ে।
09:51 অধিক জানিবলৈ আমালৈ যোগাযোগ কৰক।
09:55 স্পোকেন টিউটোৰিয়েল প্ৰকল্প ভাৰত সৰকাৰৰ NMEICT, MHRD দ্বাৰা সমর্থিত।
10:01 এই বিষয়ত বিস্তাৰিত তথ্য এই লিঙ্কত প্ৰাপ্তিসাধ্য।
10:06 আইআইটি বোম্বেৰ পৰা মই বিদায় লৈছো। অংশগ্ৰহণৰ বাবে ধন্যবাদ।

Contributors and Content Editors

Mousumi