Python-3.4.3/C3/Statistics/Bengali

From Script | Spoken-Tutorial
Jump to: navigation, search
Time
Narration
00:01 "Statistics” using Python এর স্পোকেন টিউটোরিয়ালে আপনাদের স্বাগত।
00:07 এই টিউটোরিয়ালের শেষে আপনি নিম্ন শিখতে সক্ষম হবেন - Python এ statistical অপারেশন করা।
00:14 সংখ্যার সেটের Sum করা এবং তাদের mean, median এবং standard deviation সন্ধান করা।
00:22 টিউটোরিয়ালটি রেকর্ড করতে ব্যবহার করছি Ubuntu Linux 16.04 অপারেটিং সিস্টেম
00:29 Python 3.4.3 এবং IPython 5.1.0
00:36 টিউটোরিয়ালটি অনুশীলন করতে আপনার ফাইল থেকে ডেটা লোড করার পদ্ধতি জানতে হবে।
00:42 Lists এর ব্যবহার এবং Arrays এর অংশ কিভাবে অ্যাক্সেস করে।
00:47 না হলে এই ওয়েবসাইটে পাইথনের প্রাক-প্রয়োজনীয় টিউটোরিয়াল দেখুন।
00:53 এই টিউটোরিয়ালের জন্য, আমরা student_record.txt ডাটা ফাইল ব্যবহার করব যা আমরা আগের টিউটোরিয়ালে ব্যবহার করেছি।
01:03 আপনি এই ফাইল এই টিউটোরিয়ালের Code Files লিঙ্কেও পেতে পারি।
01:08 এটি Home directory তে ডাউনলোড করুন এবং এটি ব্যবহার করুন।
01:12 আমরা এই array structured file এ mathematical এবং logical অপারেশন ব্যবহার করব। এর জন্য আমাদের Numpy সংস্থাপন করা প্রয়োজন।
01:22 NumPy অর্থাৎ Numerical Python
01:26 এটি একটি গ্রন্থাগার যা mathematical এবং numerical রুটিনের জন্য pre-compiled functions সমন্বিত।
01:33 NumPy আলাদাভাবে সংস্থাপন করতে হবে।
01:37 প্রথমে Ctrl + Alt + T কী একসাথে টিপে টার্মিনাল খুলুন।
01:45 সর্বশেষ pip সংস্থাপন করি।

pip কমান্ডের ব্যবহার python libraries সংস্থাপন করতে ব্যবহৃত হয়।

01:53 লিখুন, sudo apt-get install python3 hyphen pip এবং এন্টার টিপুন।
02:03 সংস্থাপনের জন্য আপনার root অ্যাক্সেস থাকা দরকার কারণ এটি admin password এর জন্য জিজ্ঞাসা করে।
02:15 এরপর আমাদের numpy library সংস্থাপিত করতে হবে কারণ আমরা টিউটোরিয়াল জুড়ে numpy library ব্যবহার করব।
02:24 লিখুন, sudo pip3 install numpy is equal to is equal to 1.13.3 এবং এন্টার টিপুন।
02:38 সংস্থাপন সফলভাবে শেষ হয়েছে। আমরা কোনো এরর ছাড়াই terminal prompt দেখতে পারি।
02:47 এরপর আমরা loadtxt() ফাংশন সম্পর্কে শিখব।
02:52 array হিসাবে ডেটা পেতে, আমরা loadtxt() ফাংশনটি ব্যবহার করি।
02:58 loadtxt() ফাংশনের জন্য আমাদের প্রথমে numpy library ইম্পোর্ট করতে হবে।
03:04 টার্মিনালে ফিরে যান. এখন লিখুন ipython3 এবং এন্টার টিপুন।
03:12 লিখুন import numpy as np এবং এন্টার টিপুন। যেখানে np numpy এর জন্য উপনাম রয়েছে এবং এটি যে কোনো নাম হতে পারে।
03:24 একটি array হিসাবে student_record.txt ফাইল থেকে ডেটা লোড করি।
03:32 লিখুন, L is equal to np dot loadtxt বন্ধনীতে উদ্ধৃতিতে student_record.txt comma usecols is equal to বন্ধনীতে 3 comma 4 comma 5 comma 6 comma 7 comma delimiter is equal to উদ্ধৃতিতে সেমিকোলন এবং এন্টার টিপুন।
04:04 লিখুন L এবং এন্টার টিপুন।
04:07 আমরা array হিসাবে আউটপুট পাই।
04:11 loadtxt একটি বাহ্যিক ফাইল থেকে ডেটা লোড করে।
04:16 Delimiter ক্যারেক্টারের ধরণ নির্দিষ্ট করে যার থেকে ডেটা ফীল্ড পৃথক হয়। usecols ব্যবহৃত কলাম নির্দিষ্ট করে।
04:27 loadtxt, delimiter এবং usecols হল কীওয়ার্ড।
04:33 সুতরাং student_record.txt থেকে columns 3,4,5,6,7 এখানে লোড করা হয়েছে।
04:42 column numbers এর মাঝে comma যুক্ত করা হয়েছে কারণ usecols একটি ক্রম।
04:49 যেমনকি আমরা দেখতে পাচ্ছি L একটি অ্যারে। আমরা shape দ্বারা এই array এর আকার পেতে পারি।
04:58 লিখুন L dot shape এবং এন্টার টিপুন।
05:04 আমরা যথাক্রমে rows এবং columns এর সংখ্যা সহ tuple পাই।
05:11 এই উদাহরণে, array L এ এক লক্ষ পঁচাশি হাজার ছয়শত সাতটি সারি এবং 5 টি কলাম রয়েছে।
05:22 student_record.txt ফাইলে ফিরে যাই।
05:28 এগুলির উপর statistical ক্রিয়াকলাপ প্রয়োগ করা শুরু করি। আপনি প্রথম শিক্ষার্থীর জন্য সকল বিষয়ের অঙ্কের যোগফল কিভাবে পেতে পারেন?
05:39 টার্মিনালে ফিরে যান। array তে প্রথম সারি অ্যাক্সেস করতে আমরা লিখব L বর্গাকার বন্ধনীতে 0 এবং এন্টার টিপব।
05:54 এখন এর যোগফলের জন্য লিখুন, totalmarks is equal to sum বন্ধনীতে L বর্গাকার বন্ধনীতে 0 এবং এন্টার টিপুন।
06:09 লিখুন totalmarks এবং এন্টার টিপুন। আমরা প্রথম শিক্ষার্থীর সকল বিষয়ের নম্বর পেয়েছি।
06:19 এখন mean পেতে আমরা অ্যারের দৈর্ঘ্য দ্বারা totalmarks কে ভাগ করতে পারি।
06:26 লিখুন, totalmarks divided by len বন্ধনীতে L বর্গাকার বন্ধনীতে 0 এবং এন্টার টিপুন।
06:40 বা function mean ব্যবহার করুন। লিখুন np dot mean বন্ধনীতে L বর্গাকার বন্ধনীতে 0 এবং এন্টার টিপুন।
06:55 কিন্তু আমাদের কাছে বড় data set রয়েছে। এবং এক এক করে প্রতিটি শিক্ষার্থীর mean এর গণনা করতে সময় নেয়।
07:04 এখানে কাজ কমানোর কি কোনো উপায় রয়েছে?

এই জন্য, আমরা mean এর ডকুমেন্টেশন দেখবো।

07:12 লিখুন np dot mean questionmark এবং এন্টার টিপুন। আরো তথ্যের জন্য টেক্সট পড়ুন।
07:23 documentation থেকে প্রস্থান করতে q লিখুন।
07:28 উপরের উদাহরণে, L matrix এর মত two dimensional array রয়েছে।
07:35 আমরা অ্যারের প্রতিটি axis এ mean এর গণনা করতে পারি।
07:41 rows এর axis 0 এবং কলাম 1 দ্বারা উল্লেখ করা হয়।
07:48 সকল columns এ mean গণনা করতে, আমাদের axis এর জন্য অতিরিক্ত parameter 1 পাস করতে হবে।
07:57 টার্মিনালে ফিরে যান।
08:00 এখন প্রতিটি বিষয়ের জন্য সমস্ত শিক্ষার্থী দ্বারা প্রাপ্ত অঙ্কের mean গণনা করি।
08:07 লিখুন np dot mean বন্ধনীতে L comma 0 এবং এন্টার টিপুন।
08:18 এরপর সকল শিক্ষার্থীর জন্য ইংরেজী অঙ্কের median গণনা করব।
08:25 লিখুন L বর্গাকার বন্ধনীতে colon comma 0 এবং এন্টার টিপুন।
08:35 লক্ষ্য করুন colon comma zero, array তে প্রথম column প্রদর্শন করে যা হল English Mark.
08:45 median পেতে আমরা function median ব্যবহার করব।
08:51 লিখুন np dot median বন্ধনীতে L বর্গাকার বন্ধনীতে colon comma 0 এন্টার টিপুন।
09:04 সকল বিষয়ের জন্য, আমরা এখানে দেখানো হিসাবে median function দ্বারা সকল rows জুড়ে median গণনা করতে পারি।
09:13 লিখুন np dot median বন্ধনীতে L comma 0 এন্টার টিপুন।
09:24 একইভাবে standard deviation গণনা করতে আমরা function std ব্যবহার করব।
09:31 ইংরেজী বিষয়ের জন্য Standard deviation নিম্ন লিখতে পাওয়া যেতে পারে np dot std বন্ধনীতে L বর্গাকার বন্ধনীতে colon comma 0 এন্টার টিপুন।
09:50 এবং সকল rows এর জন্য, আমরা লিখব np dot std বন্ধনীতে L comma 0 এবং এন্টার টিপুন।
10:03 এখানে ভিডিওটি থামান, নিম্ন অনুশীলনী অভ্যাস করুন এবং ভিডিওটি আবার শুরু করুন।
10:09 ফাইল football.txt রেফার করুন যা এই টিউটোরিয়ালের Code Files লিঙ্কে উপলব্ধ।
10:18 ফাইলটি ডাউনলোড করুন এবং বর্তমান working directory তে সংরক্ষণ করুন।
10:23 এখন working directory হল Home directory.
10:28 football.txt তে, প্রথম কলাম হল player name,
10:34 দ্বিতীয়টি হল ঘরের খেলায় goals এবং তৃতীয়টি হল বাইরের খেলায় goals.
10:42 প্রতিটি প্লেয়ারের জন্য মোট গোল,

ঘরের বা বাইরের খেলায় গোলের Mean,

10:50 ঘরের এবং বাইরের খেলার গোলের Standard deviation নির্ণয় করা।
10:55 টার্মিনালে যান।
10:58 সমাধান হল, প্রথমে লিখুন, L is equal to np dot loadtxt বন্ধনীতে উদ্ধৃতিতে football.txt comma usecols is equal to বন্ধনীতে 1 comma 2 comma delimiter is equal to উদ্ধৃতিতে comma. এন্টার টিপুন।
11:31 np dot sum বন্ধনীতে L comma 1 এবং এন্টার টিপুন।
11:39 দ্বিতীয়টির উত্তর হল, np dot mean বন্ধনীতে L comma 0 এবং এন্টার টিপুন।
11:50 তৃতীয় হল, np dot std বন্ধনীতে L comma 0 এবং এন্টার টিপুন।
11:59 এটি আমাদের টিউটোরিয়ালের শেষে নিয়ে আসে।

এখানে আমরা Python এ মানক statistical operations করা শিখেছি যেমন sum, mean, median এবং standard deviation.

12:18 আপনার সমাধানের জন্য এখানে কিছু স্ব মূল্যায়ন প্রশ্ন রয়েছে।
12:23 প্রদত্ত two dimensional list অনুযায়ী, আপনি প্রতিটি সারির জন্য mean এর গণনা কিভাবে করবেন?
12:32 দ্বিতীয়। প্রদত্ত লিস্টের median গণনা করুন।
12:37 তৃতীয়। এখানে 6 টি কলামের একটি ফাইল রয়েছে। কিন্তু আমরা শুধুমাত্র 2,3,4,5 কলাম থেকে টেক্সট লোড করতে চাই। আমরা কিভাবে এটি নির্দিষ্ট করব?
12:51 এবং উত্তর হল,

প্রতিটি সারির mean পেতে, আমরা function mean এ দ্বিতীয় প্যারামিটার হিসাবে শুধুমাত্র 1 পাস করব।

13:02 np.mean বন্ধনীতে two_dimensional_list comma 1
13:11 আমরা লিস্টের median গণনা করতে function median ব্যবহার করি. np.median বন্ধনীতে student_marks.
13:24 তৃতীয়, ফাইলের বিশিষ্ট columns নির্দিষ্ট করতে, আমরা প্যারামিটার usecols is equal বন্ধনীতে 2, 3, 4, 5 ব্যবহার করব।
13:39 সময়ের সাথে আপনার প্রশ্ন এই ফোরামে পোস্ট করুন।
13:43 এই ফোরামে Python সম্পর্কিত আপনার সাধারণ প্রশ্ন পোস্ট করুন।
13:48 FOSSEE দল TBC প্রকল্প সমন্বয় করে।
13:53 স্পোকেন টিউটোরিয়াল প্রকল্প ভারত সরকারের NMEICT, MHRD দ্বারা সমর্থিত। আরো জনাতে এই লিঙ্কে যান।
14:05 আই আই টী বোম্বে থেকে আমি কৌশিক দত্ত বিদায় নিচ্ছি। অংশগ্রহনের জন্য ধন্যবাদ।

Contributors and Content Editors

Kaushik Datta