Python/C3/Statistics/Tamil

From Script | Spoken-Tutorial
Revision as of 00:07, 12 December 2012 by Priyacst (Talk | contribs)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to: navigation, search
Timing Narration
0:00 Hello friends! 'Statistics' using Python tutorial க்கு நல்வரவு!
0:06 இந்த டுடோரியலின் முடிவில், நீங்கள் பின் வருவனவற்றை செய்ய முடியும்.
  1. Python இல் statistical operations செய்தல்,
  2. ஒரு set of numbers ஐ கூட்டுதல்,
  3. அவற்றின் mean, median மற்றும் standard deviation ஐ கண்டுபிடித்தல்.
0:17 இந்த tutorial ஐ ஆரம்பிக்கும் முன், நாம் நீங்கள் பின் வரும் டுடோரியல்களை முடித்திருக்க பரிந்துரைக்கிறோம்.
0:21 "Loading Data from files" "Getting started with Lists" மற்றும் "Accessing Pieces of Arrays".
0:29 இப்போது, terminal லில் type செய்க: ipython space hyphen pylab.
0:38 இந்த tutorial லில் நாம் பயன்படுத்தப்போகும் data file இந்த path இல் உள்ளது: slash home slash fossee slash sslc2 dot txt.
0:47 அதில் ஒரு State Secondary Board Examination இல் மாணவர்களின் செயல்பாடு மற்றும் அவர்களது record கள் ஆகியன உள்ளன.
0:53 இதில் 180,000 வரிகள் record உள்ளன.
0:57 நாம் இதை படித்து data வை process செய்ய வேண்டும்.
1:02 நாம் file இன் content ஐ அதை double click செய்து காணலாம்.
1:06 அது மிகப்பெரிய file ஆக இருப்பதால் திறக்க கொஞ்சம் நேரமாகலாம்.
1:11 தயை செய்து இதன் data வை எடிட் செய்யாதீர்கள்; அதில் ஒரு குறிப்பிட்ட structure இருக்கிறது.
1:15 நாம் file இன் content ஐ அதில் cat command. ஐ இயக்கி காணலாம்.
1:18 ஆகவே type செய்க: cat space slash home slash fossee slash sslc2 dot txt. என்டர் செய்க.
1:31 file லின் ஒவ்வொரு வரியிலும் semi-colon களால் பிரிக்கப்பட்ட 11 field கள் உள்ளன.
1:38 இந்த file லில் இருந்து ஒரு sample வரியை பாருங்கள்.
1:43 A semicolon 015163 semicolon JOSEPH RAJ S semicolon 083 semicolon 042 semicolon 47 semicolon 00 semicolon 72 semicolon 244 மற்றும் வரிசையாக மூன்று semicolon கள்.
2:11 பின் வருவனவே எல்லா வரிகளிலும் field களாக உள்ளன.
2:16 * Region Code இங்கே இது 'A' * Roll Number 015163 * Name JOSEPH RAJ S * 5 subject களில் Marks : ** English 083 ** Hindi 042 ** Maths 47 **

Science 35 **Social Science 72 மற்றும் Total marks 244

2:42 இந்த data ஐ ஒரு array ஆக லோட் செய்து பின் பல function களை அதில் இயக்கலாம்.
2:48 data ஐ ஒரு array ஆக லோட் செய்ய நாம் பயன்ப்டுத்துவது loadtxt command
2:53 ஆகவே terminal லில் type செய்க: L is equal to loadtxt within brackets , single quotes slash home slash fossee slash sslc2 dot txt comma usecols is equal to within brackets 3,4,5,6,7 comma delimiter is equal to within single quotes semicolon) பின் என்டர் செய்க.
3:45 நாம் output ஐ ஒரு array dot loadtxt function ஆக பெறுகிறோம்.
3:57 இப்போது ஒரு error கிடைத்துள்ளது.
3:58 நாம் type செய்ய வேண்டியது loadtxt bracket களுக்கு முன்னால்.
4:09 Delimiter எந்த வகை character என குறிப்பிடுகிறது. பயன்படுத்த வேண்டிய column களை usecols குறிப்பிடுகிறது.
4:19 ஆகவே within brackets 3,4,5,6,7 இந்த column களை ஏற்றுகிறது.
4:26 'comma' சேர்க்கப்பட்டது ஏன் எனில் usecols ஒரு sequence ஆகும்.
4:31 நாம் காணும்படி L என்பது ஒரு array
4:35 நாம் இந்த array இன் shape ஐ terminal ஐ பயன்படுத்தி காணலாம். type செய்க: L dot shape பின் என்டர் செய்க.
4:43 நமக்கு கிடைப்பது ஒரு tuple. அதில் முறையே numbers of rows மற்றும் columns குறிப்பிட்டுள்ளது.
4:50 இவற்றின் மீது statistical operation களை இயக்கலாம்.
4:55 நாம் அடிப்படையான கூட்டலில் ஆரம்பிக்கலாம்.
4:59 முதல் student எல்லா subject களிலும் வாங்கிய mark களின் மொத்தத்தை கண்டுபிடித்தல் எப்படி?
5:04 நமக்கு accessing pieces of arrays பற்றி தெரிந்தபடி முதல் வரியை அணுகலாம். terminal லில் type செய்க: L square brackets 0 comma colon.
5:19 இப்போது இதை கூட்ட நாம் இப்படி சொல்லலாம்: totalmarks is equal to sum within brackets L within square brackets 0 comma colon. என்டர் செய்க. பின் totalmarks. பின் மீண்டும் Enter.
5:47 இப்போது mean ஐ கண்டு பிடிக்க நாம் totalmarks ஐ length ஆல் வகுக்கலாம்.
5:52 ஆகவே type செய்க: totalmarks slash len within brackets L in square brackets 0 comma colon.
6:10 அல்லது எளிதாக function mean ஐ பயன்படுத்தவும்.
6:13 அதற்கு type செய்க: mean within brackets L மற்றும் in square brackets 0 comma colon பின் என்டர் செய்க.
6:31 ஆனால் நம்மிடம் உள்ளது மிகப்பெரிய data set. ஆகவே ஒவ்வொரு மாணவனுக்கு இதை செய்வது கடினம்.
6:38 இந்த வேலையை குறைக்க வழி உள்ளதா?
6:40 இதற்கு நாம் mean குறித்த documentation ஐ பார்க்கலாம்.
6:42 ஆகவே அதற்கு terminal லில் type செய்க: mean question mark .
6:49 நமக்கு தெரியும், L என்பது ஒரு two dimensional array.
6:52 நாம் array வின் ஒவ்வொரு அச்சின் குறுக்கேயும் mean ஐ கணக்கிடலாம்.
6:57 வரியின் இந்த அச்சு 0 எண்ணாலும், column களின் அச்சு 1 ஆலும் குறிப்பிடப்படுகிறது.
7:02 ஆகவே எல்லா column களின் குறுக்கே mean ஐ கணக்கிட, நாம் கூடுதல் parameter 1 ஐ அச்சுக்கு கொடுக்கலாம்.
7:07 ஆகவே type செய்க: mean within brackets L comma 1 பின் என்டர் செய்க.
7:17 L இங்கே ஒரு two dimensional array.
7:20 அதே போல ஒவ்வொரு subject இலும் எல்லா மாணவர்களும் வாங்கிய மார்க்கின் average கணக்கிட mean within brackets L comma 0 ஐ பயன்படுத்தலாம்.
7:36 அடுத்து, நாம் எல்லா மாணவர்களுக்குமான English mark களின் median ஐ கண்டுபிடிக்கலாம்.
7:41 நாம் இப்படி அதை அணுகலாம்: L in square brackets colon comma zero பின் என்டர் செய்க.
7:53 median ஐ பெற நாம் function median ஐ பயன்படுத்தலாம்.
7:57 ஆகவே type செய்க: median within brackets L square brackets colon comma 0 .
8:17 எல்லா subject களுக்கும் நாம் இதே syntax ஐ mean ஐ கண்டுபிடிக்க பயன்படுத்தலாம் மற்றும் median ஐ பயன்படுத்தி எல்லா row களுக்கும் இடையில் median ஐயும் கண்டுபிடிக்கலாம்.
8:25 ஆகவே type செய்க: median in brackets L comma 0 பின் என்டர் செய்க.
8:35 அதே போல English க்கு standard deviation ஐ கண்டுபிடிக்க நாம் function std ஐ பயன்படுத்தலாம்.
8:41 ஆகவே type செய்க: std, in brackets L மற்றும் in square brackets colon comma 0 பின் என்டர் செய்க
8:57 மற்றும் எல்லா row களுக்கும், நாம் std within brackets L comma 0 செய்யலாம்.
9:08 video வை இங்கே நிறுத்தி பயிற்சியை செய்து முடித்து பின் தொடரவும்.
9:13 path slash home slash fossee slash football dot txt இல் கொடுக்கப்பட்ட file football dot txt இல் ஒரு column player name, இரண்டாவது goals at home மற்றும் மூன்றாவது goals away.
9:28 1.ஒவ்வொரு player க்கும் total goals ஐ கண்டுபிடிக்கவும்.
9:33 2. home மற்றும் away goals இன் mean.
9:37 3. home மற்றும் away goals இன் Standard deviation.
9:46 இதுவே தேவையான data.
9:49 அதற்கு football dot txt file ஐ திறப்போம்.
9:54 solution உங்கள் screen இல் உள்ளது
10:00 இத்துடன் இந்த டுடோரியல் முடிகிறது.
10:03 இந்த டுடோரியலில், நாம் கற்றவை,
10:07 1. Python இல் standard statistical operations ஆன sum , mean median மற்றும் standard deviation ஆகியவற்றை செய்தல்
10:14 2. text loading மற்றும் the statistical operation களை real world problem களை தீர்க்க Combine செய்தல்.
10:24 நீங்கள் தீர்வு காண இதோ சில self assessment கேள்விகள்
10:27 1. ஒரு two dimensional list கொடுக்கப்பட்டது; two_dimensional_list is equal to within square brackets [3,5,8,2,1],within another square brackets [4,3,6,2,1] நாம் இந்த இரண்டு வரிகளின் mean ஐ கணக்கிடுவது எப்படி?
10:49 2. கொடுத்த லிஸ்டில் median ஐ கண்டுபிடி: student_marks is equal to within square brackets 74,78,56,87,91,82
11:03 மற்றும் மூன்றாவது கேள்வி ஒரு file இல் 6 column கள் இருக்க, நாம் column கள் 2,3,4,5. இன் text மட்டும் ஏற்ற வேண்டுமானால் அதை எப்படி specify செய்வது?
11:16 விடைகள் இதோ
11:20 1. ஒவ்வொரு வரியின் mean ஐ பெற, நாம் 1 ஐ function mean க்கு இரண்டாவது parameter ஆக பாஸ் செய்வோம்.
11:29 ஆகவே நாம் type செய்ய வேண்டியது: mean within brackets two_dimensional_list comma 1
11:37 2. நாம் கொடுத்த லிஸ்டில் median ஐ கண்டுபிடிக்க function median ஐ பயன்படுத்துவோம்.
11:42 type செய்க median within brackets student_marks.
11:47 மற்றும் கடைசியாக, பைலின் குறிப்பிட்ட column களை மட்டும் ஏற்ற , நாம் usecols is equal to 2,3,4,5 என்ற parameter ஐ பயன்படுத்தலாம்.
12:01 நீங்கள் இந்த டுடோரியலை ரசித்திருப்பீர்கள், பயனுள்ளதாக இருக்கும் என்று நம்புகிறேன்.
12:05 நன்றி!

Contributors and Content Editors

Priyacst