Python/C3/Statistics/Tamil
From Script | Spoken-Tutorial
Timing | Narration |
---|---|
0:00 | Hello friends! 'Statistics' using Python tutorial க்கு நல்வரவு! |
0:06 | இந்த டுடோரியலின் முடிவில், நீங்கள் பின் வருவனவற்றை செய்ய முடியும்.
|
0:17 | இந்த tutorial ஐ ஆரம்பிக்கும் முன், நாம் நீங்கள் பின் வரும் டுடோரியல்களை முடித்திருக்க பரிந்துரைக்கிறோம். |
0:21 | "Loading Data from files" "Getting started with Lists" மற்றும் "Accessing Pieces of Arrays". |
0:29 | இப்போது, terminal லில் type செய்க: ipython space hyphen pylab. |
0:38 | இந்த tutorial லில் நாம் பயன்படுத்தப்போகும் data file இந்த path இல் உள்ளது: slash home slash fossee slash sslc2 dot txt. |
0:47 | அதில் ஒரு State Secondary Board Examination இல் மாணவர்களின் செயல்பாடு மற்றும் அவர்களது record கள் ஆகியன உள்ளன. |
0:53 | இதில் 180,000 வரிகள் record உள்ளன. |
0:57 | நாம் இதை படித்து data வை process செய்ய வேண்டும். |
1:02 | நாம் file இன் content ஐ அதை double click செய்து காணலாம். |
1:06 | அது மிகப்பெரிய file ஆக இருப்பதால் திறக்க கொஞ்சம் நேரமாகலாம். |
1:11 | தயை செய்து இதன் data வை எடிட் செய்யாதீர்கள்; அதில் ஒரு குறிப்பிட்ட structure இருக்கிறது. |
1:15 | நாம் file இன் content ஐ அதில் cat command. ஐ இயக்கி காணலாம். |
1:18 | ஆகவே type செய்க: cat space slash home slash fossee slash sslc2 dot txt. என்டர் செய்க. |
1:31 | file லின் ஒவ்வொரு வரியிலும் semi-colon களால் பிரிக்கப்பட்ட 11 field கள் உள்ளன. |
1:38 | இந்த file லில் இருந்து ஒரு sample வரியை பாருங்கள். |
1:43 | A semicolon 015163 semicolon JOSEPH RAJ S semicolon 083 semicolon 042 semicolon 47 semicolon 00 semicolon 72 semicolon 244 மற்றும் வரிசையாக மூன்று semicolon கள். |
2:11 | பின் வருவனவே எல்லா வரிகளிலும் field களாக உள்ளன. |
2:16 | * Region Code இங்கே இது 'A' * Roll Number 015163 * Name JOSEPH RAJ S * 5 subject களில் Marks : ** English 083 ** Hindi 042 ** Maths 47 **
Science 35 **Social Science 72 மற்றும் Total marks 244 |
2:42 | இந்த data ஐ ஒரு array ஆக லோட் செய்து பின் பல function களை அதில் இயக்கலாம். |
2:48 | data ஐ ஒரு array ஆக லோட் செய்ய நாம் பயன்ப்டுத்துவது loadtxt command |
2:53 | ஆகவே terminal லில் type செய்க: L is equal to loadtxt within brackets , single quotes slash home slash fossee slash sslc2 dot txt comma usecols is equal to within brackets 3,4,5,6,7 comma delimiter is equal to within single quotes semicolon) பின் என்டர் செய்க. |
3:45 | நாம் output ஐ ஒரு array dot loadtxt function ஆக பெறுகிறோம். |
3:57 | இப்போது ஒரு error கிடைத்துள்ளது. |
3:58 | நாம் type செய்ய வேண்டியது loadtxt bracket களுக்கு முன்னால். |
4:09 | Delimiter எந்த வகை character என குறிப்பிடுகிறது. பயன்படுத்த வேண்டிய column களை usecols குறிப்பிடுகிறது. |
4:19 | ஆகவே within brackets 3,4,5,6,7 இந்த column களை ஏற்றுகிறது. |
4:26 | 'comma' சேர்க்கப்பட்டது ஏன் எனில் usecols ஒரு sequence ஆகும். |
4:31 | நாம் காணும்படி L என்பது ஒரு array |
4:35 | நாம் இந்த array இன் shape ஐ terminal ஐ பயன்படுத்தி காணலாம். type செய்க: L dot shape பின் என்டர் செய்க. |
4:43 | நமக்கு கிடைப்பது ஒரு tuple. அதில் முறையே numbers of rows மற்றும் columns குறிப்பிட்டுள்ளது. |
4:50 | இவற்றின் மீது statistical operation களை இயக்கலாம். |
4:55 | நாம் அடிப்படையான கூட்டலில் ஆரம்பிக்கலாம். |
4:59 | முதல் student எல்லா subject களிலும் வாங்கிய mark களின் மொத்தத்தை கண்டுபிடித்தல் எப்படி? |
5:04 | நமக்கு accessing pieces of arrays பற்றி தெரிந்தபடி முதல் வரியை அணுகலாம். terminal லில் type செய்க: L square brackets 0 comma colon. |
5:19 | இப்போது இதை கூட்ட நாம் இப்படி சொல்லலாம்: totalmarks is equal to sum within brackets L within square brackets 0 comma colon. என்டர் செய்க. பின் totalmarks. பின் மீண்டும் Enter. |
5:47 | இப்போது mean ஐ கண்டு பிடிக்க நாம் totalmarks ஐ length ஆல் வகுக்கலாம். |
5:52 | ஆகவே type செய்க: totalmarks slash len within brackets L in square brackets 0 comma colon. |
6:10 | அல்லது எளிதாக function mean ஐ பயன்படுத்தவும். |
6:13 | அதற்கு type செய்க: mean within brackets L மற்றும் in square brackets 0 comma colon பின் என்டர் செய்க. |
6:31 | ஆனால் நம்மிடம் உள்ளது மிகப்பெரிய data set. ஆகவே ஒவ்வொரு மாணவனுக்கு இதை செய்வது கடினம். |
6:38 | இந்த வேலையை குறைக்க வழி உள்ளதா? |
6:40 | இதற்கு நாம் mean குறித்த documentation ஐ பார்க்கலாம். |
6:42 | ஆகவே அதற்கு terminal லில் type செய்க: mean question mark . |
6:49 | நமக்கு தெரியும், L என்பது ஒரு two dimensional array. |
6:52 | நாம் array வின் ஒவ்வொரு அச்சின் குறுக்கேயும் mean ஐ கணக்கிடலாம். |
6:57 | வரியின் இந்த அச்சு 0 எண்ணாலும், column களின் அச்சு 1 ஆலும் குறிப்பிடப்படுகிறது. |
7:02 | ஆகவே எல்லா column களின் குறுக்கே mean ஐ கணக்கிட, நாம் கூடுதல் parameter 1 ஐ அச்சுக்கு கொடுக்கலாம். |
7:07 | ஆகவே type செய்க: mean within brackets L comma 1 பின் என்டர் செய்க. |
7:17 | L இங்கே ஒரு two dimensional array. |
7:20 | அதே போல ஒவ்வொரு subject இலும் எல்லா மாணவர்களும் வாங்கிய மார்க்கின் average கணக்கிட mean within brackets L comma 0 ஐ பயன்படுத்தலாம். |
7:36 | அடுத்து, நாம் எல்லா மாணவர்களுக்குமான English mark களின் median ஐ கண்டுபிடிக்கலாம். |
7:41 | நாம் இப்படி அதை அணுகலாம்: L in square brackets colon comma zero பின் என்டர் செய்க. |
7:53 | median ஐ பெற நாம் function median ஐ பயன்படுத்தலாம். |
7:57 | ஆகவே type செய்க: median within brackets L square brackets colon comma 0 . |
8:17 | எல்லா subject களுக்கும் நாம் இதே syntax ஐ mean ஐ கண்டுபிடிக்க பயன்படுத்தலாம் மற்றும் median ஐ பயன்படுத்தி எல்லா row களுக்கும் இடையில் median ஐயும் கண்டுபிடிக்கலாம். |
8:25 | ஆகவே type செய்க: median in brackets L comma 0 பின் என்டர் செய்க. |
8:35 | அதே போல English க்கு standard deviation ஐ கண்டுபிடிக்க நாம் function std ஐ பயன்படுத்தலாம். |
8:41 | ஆகவே type செய்க: std, in brackets L மற்றும் in square brackets colon comma 0 பின் என்டர் செய்க |
8:57 | மற்றும் எல்லா row களுக்கும், நாம் std within brackets L comma 0 செய்யலாம். |
9:08 | video வை இங்கே நிறுத்தி பயிற்சியை செய்து முடித்து பின் தொடரவும். |
9:13 | path slash home slash fossee slash football dot txt இல் கொடுக்கப்பட்ட file football dot txt இல் ஒரு column player name, இரண்டாவது goals at home மற்றும் மூன்றாவது goals away. |
9:28 | 1.ஒவ்வொரு player க்கும் total goals ஐ கண்டுபிடிக்கவும். |
9:33 | 2. home மற்றும் away goals இன் mean. |
9:37 | 3. home மற்றும் away goals இன் Standard deviation. |
9:46 | இதுவே தேவையான data. |
9:49 | அதற்கு football dot txt file ஐ திறப்போம். |
9:54 | solution உங்கள் screen இல் உள்ளது |
10:00 | இத்துடன் இந்த டுடோரியல் முடிகிறது. |
10:03 | இந்த டுடோரியலில், நாம் கற்றவை, |
10:07 | 1. Python இல் standard statistical operations ஆன sum , mean median மற்றும் standard deviation ஆகியவற்றை செய்தல் |
10:14 | 2. text loading மற்றும் the statistical operation களை real world problem களை தீர்க்க Combine செய்தல். |
10:24 | நீங்கள் தீர்வு காண இதோ சில self assessment கேள்விகள் |
10:27 | 1. ஒரு two dimensional list கொடுக்கப்பட்டது; two_dimensional_list is equal to within square brackets [3,5,8,2,1],within another square brackets [4,3,6,2,1] நாம் இந்த இரண்டு வரிகளின் mean ஐ கணக்கிடுவது எப்படி? |
10:49 | 2. கொடுத்த லிஸ்டில் median ஐ கண்டுபிடி: student_marks is equal to within square brackets 74,78,56,87,91,82 |
11:03 | மற்றும் மூன்றாவது கேள்வி ஒரு file இல் 6 column கள் இருக்க, நாம் column கள் 2,3,4,5. இன் text மட்டும் ஏற்ற வேண்டுமானால் அதை எப்படி specify செய்வது? |
11:16 | விடைகள் இதோ |
11:20 | 1. ஒவ்வொரு வரியின் mean ஐ பெற, நாம் 1 ஐ function mean க்கு இரண்டாவது parameter ஆக பாஸ் செய்வோம். |
11:29 | ஆகவே நாம் type செய்ய வேண்டியது: mean within brackets two_dimensional_list comma 1 |
11:37 | 2. நாம் கொடுத்த லிஸ்டில் median ஐ கண்டுபிடிக்க function median ஐ பயன்படுத்துவோம். |
11:42 | type செய்க median within brackets student_marks. |
11:47 | மற்றும் கடைசியாக, பைலின் குறிப்பிட்ட column களை மட்டும் ஏற்ற , நாம் usecols is equal to 2,3,4,5 என்ற parameter ஐ பயன்படுத்தலாம். |
12:01 | நீங்கள் இந்த டுடோரியலை ரசித்திருப்பீர்கள், பயனுள்ளதாக இருக்கும் என்று நம்புகிறேன். |
12:05 | நன்றி! |