Biopython/C2/Parsing-Data/Assamese
From Script | Spoken-Tutorial
|
|
---|---|
00:01 | Parsing Data এৰ টিউটোৰিয়েলত আপোনাক স্বাগতম। |
00:06 | ইয়াতে শিকিম NCBI ডাটাবেস ওয়েবসাইটৰ পৰা FASTA আৰু GenBank ফাইল ডাউনলোড কৰা আৰু |
00:14 | Sequence Input/Output মডিউলত ফাংশনৰ দ্বাৰা ডেটা ফাইল Parse কৰা। |
00:19 | টিউটোৰিয়েলটো অনুসৰণ কৰিবলৈ অস্নাতকৰ বায়োকেমিস্ট্ৰ বা বায়োইনফৰমেটিক্স |
00:26 | আৰু মৌলিক Python প্ৰোগ্ৰামিং সম্পর্কে জানোব লাগিব। |
00:30 | প্ৰদত্ত লিঙ্কত Python টিউটোৰিয়েল চাওক। |
00:34 | টিউটোৰিয়েলটো ৰেকর্ড কৰিবলৈ ব্যবহাৰ কৰিছো: উবুন্টু OS সংস্কৰণ 14.10 |
00:40 | Python সংস্কৰণ 2.7.8 |
00:44 | Ipython interpretor সংস্কৰণ 2.3.0 |
00:48 | Biopython সংস্কৰণ 1.64 আৰু Mozilla Firefox ব্ৰাউজাৰ 35.0. |
00:56 | বায়োলজিত বৈজ্ঞানিক তথ্য সাধাৰণতে টেক্সট ফাইল যেনে FASTA, GenBank, Swiss-Prot, EMBL ইত্যাদিত সংৰক্ষিত হয়। |
01:07 | ডেটা ফাইল ডাটাবেস ওয়েবসাইটৰ পৰা ডাউনলোড কৰা যাব পাৰে। |
01:12 | যি কোনো ওয়েব ব্ৰাউজাৰত, তলত দিয়া ওয়েবসাইটৰ লিঙ্কটো খুলক। |
01:17 | এটা ওয়েব পৃষ্ঠা খোলে। |
01:19 | এতিয়া মানুহৰ insulin gene এৰ বাবে FASTA আৰু GenBank ফাইল ডাউনলোড কৰো। |
01:25 | সার্চ বাক্সত লিখক: human insulin, Search বোতামত ক্লিক কৰক। |
01:31 | ওয়েব পৃষ্ঠা মানুহৰ insulin gene এৰ অনেক ফাইল দেখায়। |
01:35 | প্ৰদর্শন কৰিবলৈ মই Homo sapiens Insulin mRNA নামৰ 4টা ফাইল চয়ন কৰিম। |
01:43 | মই 500 এৰ কম বেস পেয়ার্স ৰাখা ফাইলবোৰ চয়ন কৰিম। |
01:48 | ডাউনলোডৰ বাবে ফাইল চয়ন কৰিবলৈ চেক-বাক্সত ক্লিক কৰক। |
01:56 | কার্সাৰ Send to বিকল্পত লৈ যাওক যি পৃষ্ঠাৰ উপৰৰ সোফালে আছে। |
02:02 | ডাউন এৰোৰ সৈতে সৰু চয়নিত বোতামত ক্লিক কৰক যি Send To বোতামৰ উচৰত আছে। |
02:09 | Choose destinationত, File বিকল্পত ক্লিক কৰক। |
02:13 | আপোনি এই ফাইলক যি কোনো ফাইল ফৰম্যাটত সংৰক্ষণ কৰিব পাৰে, যি format ড্ৰপ-ডাউন তালিকা বাক্সত সূচীবদ্ধ। |
02:21 | প্ৰদত্ত বিকল্প পৰা FASTA চয়ন কৰক। |
02:25 | তাৰপিছত Create File বিকল্পত ক্লিক কৰক। |
02:29 | স্ক্ৰীনত এটা ডায়ালগ বাক্স দেখায়। |
02:32 | Open with চয়ন কৰক, OK ত লিক কৰক। |
02:36 | টেক্সট এডিটৰত এটা ফাইল খোলে। |
02:39 | ফাইলটোৱে 4টা ৰেকর্ড দেখায়, কাৰণ ডাউনলোড কৰিবলৈ মই চাৰিটা ফাইল চয়ন কৰিছো। |
02:46 | প্ৰত্যেক ৰেকর্ডৰ প্ৰথম লাইন হল identifier লাইন। |
02:50 | এইটোৱে (>) চিহ্ন দি আৰম্ভ কৰে। |
02:53 | ইয়াৰ পিছত sequence আছে। |
02:56 | ফাইলটো হোম ফোল্ডাৰত sequence.fasta হিসাবে সংৰক্ষণ কৰক। |
03:01 | টেক্সট এডিটৰ বন্ধ কৰক। |
03:03 | পূর্বে চয়নিত একেই ফাইলসৰ বাবে GenBank ফৰম্যাটত ফাইল ডাউনলোড কৰিবলৈ উপৰৰ মতে ধাপবোৰ অনুসৰণ কৰক। |
03:12 | file format ত GenBank চয়ন কৰক। |
03:16 | এটা ফাইল বনাওক। টেক্সট এডিটৰৰ সৈতে খুলক। |
03:21 | লক্ষ্য কৰক GenBank ফৰম্যাটত থকা সিকোয়েন্স ফাইলটোত FASTA ফাইলৰ তুলনাত অধিক বৈশিষ্ট্য আছে। |
03:27 | ফাইলটোক home ফোল্ডাৰত sequence.gb হিসাবে সংৰক্ষণ কৰক। টেক্সট এডিটৰক বন্ধ কৰক। |
03:34 | প্ৰদর্শন কৰিবলৈ একক ৰেকর্ড সহ এটা FASTA ফাইলৰ প্ৰয়োজন। |
03:39 | ইয়াৰ বাবে চেক বাক্সত আকৌ এবাৰ ক্লিক কৰি আগৰ চয়নটো মুছি পেলাওক। |
03:48 | এতিয়া Human insulin gene complete cds ফাইলটো চয়ন কৰক। |
03:54 | চেক-বক্সে ক্লিক কৰক। |
03:57 | home ফোল্ডাৰত ফাইল সংৰক্ষণ কৰিলবৈ আগেই দেখোৱা একেই ধাপ অনুসৰণ কৰক। |
04:01 | ফাইলটো insulin.fasta হিসাবে সংৰক্ষণ কৰক। |
04:08 | এই ফাইলত সংৰক্ষিত বায়োলজিকাল ডেটা Biopython লাইব্ৰৰীৰ মাধ্যমেৰে এক্সট্র্যাক্ট আৰু সংশোধন কৰা যাব পাৰে। |
04:16 | টেক্সট এডিটৰ বন্ধ কৰক। |
04:19 | ডেটা ফাইলৰ পৰা ডেটা এক্সট্র্যাক্ট কৰাক Parsing বোলে। |
04:23 | অধিকতৰ ফাইল ফৰম্যাট SeqIO মডিউলত উপলব্ধ ফাংশন দ্বাৰা পার্স কৰা যায়। |
04:30 | SeqIO মডিউলৰ অধিকতৰ ব্যবহৃত ফাংশন হল: parse, read, write আৰু convert |
04:38 | Ctrl, Alt আৰু T কী একেসৈতে টিপি টার্মিনেল খুলক। |
04:44 | প্ৰম্পটত ipython লিখি Ipython আৰম্ভ কৰক। এন্টাৰ টিপক। |
04:51 | ইয়াৰ পিছত, Bio প্যাকেজৰ পৰা SeqIO মডিউল ইম্পোর্ট কৰক। |
04:56 | প্ৰম্পটত লিখক: from Bio import SeqIO, এন্টাৰ টিপক। |
05:04 | মই সবতচে গুৰুত্বপূর্ণ ফাংশন parse দিয়ে আৰম্ভ কৰিম। |
05:07 | প্ৰদর্শন কৰিবলৈ মই সেই FASTA ফাইল ব্যবহাৰ কৰিম যত অনেক ৰেকর্ড আছে যাক ডেটাবেসৰ পৰা আগেই ডাউনলোড কৰিছো। |
05:17 | সহজ FASTA পার্সিংয়ৰ বাবে প্ৰম্পটত নিম্ন লিখক। |
05:22 | ইয়াতে sequence.fasta ফাইলৰ বিষয় বস্তু পড়িবলৈ parse ফাংশন ব্যবহাৰ কৰিছো। |
05:30 | আউটপুটৰ বাবে record id, ৰেকর্ডত উপস্থিত সিকোয়েন্স আৰু সিকোয়েন্সৰ দৈর্ঘ্য প্ৰিন্ট কৰে। |
05:41 | আৰু লক্ষ্য কৰক যে, সিকোয়েন্স ডেটাক Sequence record objects হিসাবে পড়িবলৈ parse ফাংশন ব্যবহৃত হয়। |
05:48 | এইটো সাধাৰণতে for লুপৰ বাবে ব্যবহৃত হয়। |
05:52 | এইটোৱে দুটা আর্গুমেন্ট গ্ৰহণ কৰিব পাৰে, প্ৰথমটো হল ডেটা পড়িবলৈ ফাইলৰ নাম। |
05:59 | দ্বিতীয়টোৱে ফাইল ফৰম্যাট নির্দিষ্ট কৰে। |
06:02 | আউটপুট পাবলৈ এন্টাৰ কী দুইবাৰ টিপক। |
06:07 | আউটপুটে identifier line এৰ পিছত ফাইলত অন্তর্ভুক্ত সিকোয়েন্স আৰু ফাইলত সকলো ৰেকর্ডৰ বাবে সিকোয়েন্স দৈর্ঘ্যও দেখায়। |
06:21 | লক্ষ্য কৰক যে FASTA ফৰম্যাটে অাখৰ নির্দিষ্ট নকৰে। |
06:26 | সেয়ে আউটপুটে এইটোক DNA সিকোয়েন্স হিসাবে নির্দিষ্ট নকৰে। |
06:31 | একেই ধাপবোৰ GenBank ফাইল পার্সিং কৰিবলৈ পুনৰাবৃত্তি কৰা যায়। |
06:36 | প্ৰদর্শন কৰিবলৈ GenBank ফাইল ব্যবহাৰ কৰিম যাক আগেই ডাটাবেসৰ পৰা ডাউনলোড কৰিছো। |
06:43 | কোডৰ লাইন যাক আগেই ব্যবহাৰ কৰিছিলো তাক পাবলৈ আপ এৰো কী টিপক। |
06:49 | ফাইলৰ নাম সলায় sequence.gb কৰক। |
06:53 | ফাইল ফৰম্যাটক genbank কৰক। |
06:56 | বাকি কোডক একেই ৰাখক। |
06:58 | আউটপুট পাবলৈ এন্টাৰ কী দুইবাৰ টিপক। |
07:03 | ইয়াতেও আউটপুটত, ফাইলত থকা সকলো ৰেকর্ডৰ বাবে record id, sequence আৰু সিকোয়েন্স এৰ দৈর্ঘ্য দেখায়। |
07:12 | লক্ষ্য কৰক যে GenBank ফৰম্যাটে সিকোয়েন্সক DNA সিকোয়েন্সৰ মতে নির্দিষ্ট কৰে। |
07:19 | একেইভাবে, Swiss-prot আৰু EMBL ফাইলক উপৰৰ নিচিনা একেই কোড ব্যবহাৰ কৰি পার্স কৰা যায়। |
07:27 | আপোনাৰ ফাইলত একক ৰেকর্ড থাকিলে parsing এৰ বাবে নিম্নোক্ত কোড লিখক। |
07:34 | ইয়াতে, মই একক ৰেকর্ড সহ পূর্বে সংৰক্ষিত FASTA ফাইল ব্যবহাৰ কৰিম, উদাহৰণস্বৰুপে insulin.fasta. |
07:43 | লক্ষ্য কৰক মই parse ফাংশনৰ সলনি read ফাংশন ব্যবহাৰ কৰিছো। এন্টাৰ টিপক। |
07:50 | আউটপুটে insulin.fasta ফাইলৰ বাবে কন্টেন্ট দেখায়। |
07:55 | এইটোৱে sequence record object এৰ মতে সিকোয়েন্স দেখায় |
07:59 | আৰু অন্যান্য এট্ৰিবিউট যেনে GI, accession number আৰু description দেখায়। |
08:06 | মই নিম্নৰ মতে এই ৰেকর্ডৰ স্বতন্ত্র এট্ৰিবিউট দেখিব পাৰো। |
08:11 | প্ৰম্পটত লিখক: record dot seq এন্টাৰ টিপক। |
08:18 | আউটপুটে ফাইলত উপস্থিত সিকোয়েন্স দেখায়। |
08:22 | এই ৰেকর্ডৰ বাবে আইডেন্টিফায়ার্স চাবলৈ লিখক: record dot id এন্টাৰ টিপক। |
08:29 | আউটপুটে GI নম্বৰ আৰু এক্সেশন নম্বৰ ইত্যাদি দেখায়। |
08:34 | আপোনি পছন্দৰ ডেটা ফাইল parse কৰিবলৈ উপৰত বর্ণিত ফাংশন ব্যবহাৰ কৰিব পাৰে। |
08:40 | এতিয়া, সংক্ষিপ্তকৰণ কৰো। |
08:42 | ইয়াতে NCBI ডেটাবেস ওয়েবসাইটৰ পৰা FASTA আৰু GenBank ফাইল ডাউনলোড কৰা আৰু SeqIO মডিউলৰ পৰা parse আৰু read ফাংশন ব্যবহাৰ কৰা শিকিছো। |
08:55 | FASTA আৰু GenBank ফাইলৰ পৰা ডেটা যেনে record ids, ডিস্ক্রিপশন আৰু সিকোয়েন্স এক্সট্র্যাক্ট কৰা। |
09:03 | অনুশীলনী হিসাবে- |
09:06 | NCBI ডেটাবেসৰ পৰা পছন্দৰ নিউক্লিওটাইড সিকোয়েন্সৰ বাবে FASTA ফাইল ডাউনলোড কৰক। |
09:13 | সিকোয়েন্সৰ ফাইলক তাৰ reverse complements ত সলাওক। |
09:17 | আপোনাৰ সম্পন্ন কামটোৰ কোডত নিম্নোক্ত লাইন থাকিব লাগে। |
09:22 | FASTA ফাইলৰ পৰা নিউক্লিওটাইড সিকোয়েন্স লোড কৰিবলৈ parse ফাংশন ব্যবহাৰ কৰক। |
09:28 | ইয়াৰ পিছত, reverse complement মেথডত নির্মিত সিকোয়েন্স অবজেক্টৰ দ্বাৰা ৰিভার্স কমপ্লিমেন্ট প্ৰিন্ট কৰক। |
09:37 | এই লিঙ্কত উপলব্ধ ভিডিওটোৱে প্ৰকল্পক সাৰসংক্ষেপে বোঝায়। |
09:42 | এইটোক ডাউনলোড কৰি চাওক। |
09:44 | স্পোকেন টিউটোৰিয়েল প্ৰকল্প দলে কর্মশালাৰ আয়োজন কৰে আৰু অনলাইন পৰীক্ষা পাস কৰিলে প্ৰশংসাপত্ৰ দিয়ে। |
09:51 | অধিক জানিবলৈ আমালৈ যোগাযোগ কৰক। |
09:55 | স্পোকেন টিউটোৰিয়েল প্ৰকল্প ভাৰত সৰকাৰৰ NMEICT, MHRD দ্বাৰা সমর্থিত। |
10:01 | এই বিষয়ত বিস্তাৰিত তথ্য এই লিঙ্কত প্ৰাপ্তিসাধ্য। |
10:06 | আইআইটি বোম্বেৰ পৰা মই বিদায় লৈছো। অংশগ্ৰহণৰ বাবে ধন্যবাদ। |