Python-3.4.3/C3/Statistics/Telugu
|
|
00:01 | ప్రియమైన స్నేహితులారా, Python లో Statistics గురించి వివరించే ఈ ట్యుటోరియల్ కు స్వాగతం. |
00:07 | ఈ ట్యుటోరియల్ యొక్క చివరకు, మీరు -Python లో statistical ఆపరేషన్స్ ను చేయడం |
00:14 | సంఖ్యల యొక్క ఒక సమితి ని సంకలనం(sum)చేయడం మరియు వాటి సగటు, మద్యస్థం మరియు ప్రామాణిక విచలనం లను కనుగొనడం లను చేయగలుగుతారు. |
00:22 | ఈ ట్యుటోరియల్ ను రికార్డ్ చేయడానికి, నేను Ubuntu Linux 16.04 ఆపరేటింగ్ సిస్టమ్ |
00:29 | Python 3.4.3 IPython 5.1.0 లను ఉపయోగిస్తున్నాను. |
00:36 | ఈ ట్యుటోరియల్ ను సాధన చేయటానికి, మీకు ఫైల్స్ నుండి డేటాను లోడ్ చేయడం |
00:42 | లిస్ట్స్ ను ఉపయోగించడం మరియు Arrays యొక్క భాగాలను యాక్సెస్ చేయడం ఎలా చేయాలో తెలిసి ఉండాలి. |
00:47 | ఒకవేళ లేకపోతే, ముందస్తు అవసరాలపై Python ట్యుటోరియల్స్ ను ఈ వెబ్సైట్ పై చూడండి. |
00:53 | ఈ ట్యుటోరియల్ కొరకు, మనం మునుపటి ట్యుటోరియల్లో ఉపయోగించిన డేటా ఫైల్ student_record.txt ను ఉపయోగిస్తాము. |
01:03 | మీరు ఈ ఫైల్ను ఈ ట్యుటోరియల్ యొక్క కోడ్ ఫైల్స్ లింక్లో కూడా కనుగొనవచ్చు. |
01:08 | దయచేసి దీన్ని హోమ్ డైరెక్టరీ లో డౌన్లోడ్ చేసి ఉపయోగించండి. |
01:12 | మనం ఈ array structured file పై గణిత మరియు తార్కిక ఆపరేషన్లను ఉపయోగిస్తాము.
దీని కొరకు, మనం Numpy ను ఇన్స్టాల్ చేయాలి. |
01:22 | NumPy, అంటే Numerical Python. |
01:26 | ఇది గణిత మరియు సంఖ్యా అభ్యాసం కొరకు pre-compiled functions లను కలిగిఉన్న ఒక లైబ్రరీ. |
01:33 | NumPy ను విడిగా ఇన్స్టాల్ చేయాలి. |
01:37 | ముందుగా మనం Ctrl + Alt + T కీలను ఒకేసారి కలిపి నొక్కడం ద్వారా terminal ను తెరుద్దాం. |
01:45 | మనం సరికొత్త (లేటెస్ట్) pip ను ఇన్స్టాల్ చేద్దాం.
python libraries ను ఇన్స్టాల్ చేయడానికి pip కమాండ్ ఉపయోగించబడుతుంది. |
01:53 | sudo apt-get install python3 hyphen pip అని టైప్ చేసి Enter నొక్కండి. |
02:03 | మీకు ఇన్స్టలేషన్ కొరకు root యాక్సెస్ ఉండాలి ఎందుకంటే అది admin password ను అడుగుతుంది గనక. |
02:15 | తరువాత, మనం ట్యుటోరియల్ అంతటా numpy లైబ్రరీ ను ఉపయోగిస్తున్నందున మనం numpy లైబ్రరీ ను ఇన్స్టాల్ చేయాలి. |
02:24 | sudo pip3 install numpy is equal to is equal to 1.13.3 అని టైప్ చేసి Enter నొక్కండి. |
02:38 | ఇన్స్టాలేషన్ విజయవంతంగా పూర్తయింది. మనం ఎటువంటి ఎర్రర్ లేకుండా terminal prompt ను చూడవచ్చు. |
02:47 | తరువాత మనం loadtxt () ఫంక్షన్ గురించి నేర్చుకుంటాము. |
02:52 | డేటాను ఒక అర్రే గా పొందడానికి, మనం loadtxt() function ను ఉపయోగిస్తాము. |
02:58 | loadtxt() function కొరకు, మనం మొదట numpy library ను దిగుమతి చేసుకోవాలి. |
03:04 | Terminal కు తిరిగి మారండి. ఇప్పుడు, ipython3 అని టైప్ చేసి, Enter నొక్కండి. |
03:12 | import numpy as np అని టైప్ చేసి Enter నొక్కండి.
అక్కడ np అనేది numpy కు మారుపేరు( అలియాస్) ఇంకా అది ఏ పేరైనా కావచ్చు. |
03:24 | Student_record.txt ఫైల్ నుండి డేటాను మనం ఒక అర్రే గా లోడ్ చేద్దాం. |
03:32 | L is equal to np dot loadtxt పరన్తసిస్ ల లోపల కోట్స్ లోపల student_record.txt కామా usecols is equal to పరన్తసిస్ ల లోపల 3 కామా4 కామా 5 కామా 6 కామా 7 కామా delimiter is equal to కోట్స్ లోపల semicolon అని టైప్ చేసి Enter నొక్కండి. |
04:04 | L అని టైప్ చేసి Enter నొక్కండి. |
04:07 | మనం అవుట్పుట్ ను అర్రే రూపంలో పొందుతాము. |
04:11 | loadtxt, డేటాను ఒక ఎక్సటర్నల్ ఫైల్ నుండి లోడ్ చేస్తుంది. |
04:16 | Delimiter అనేది డేటా యొక్కfields ద్వారా వేరు చేయబడిన క్యారక్టర్ యొక్క రకాన్ని నిర్దేశిస్తుంది.
usecols అనేది ఉపయోగించాల్సిన columns ను నిర్దేశిస్తుంది. |
04:27 | loadtxt, delimiter మరియు usecols అనేవి keywords. |
04:33 | కనుక,student_record.txt నుండి columns 3,4,5,6,7 అనేవి ఇక్కడ లోడ్ అవుతాయి. |
04:42 | column numbers మధ్య కామా జోడించబడింది ఎందుకంటే usecols అనేది ఒక sequence కనుక. |
04:49 | మనం చూస్తున్నట్లుగా L అనేది ఒక array. shape ను ఉపయోగించి మనం ఈ array యొక్క ఆకారాన్ని పొందవచ్చు. |
04:58 | L dot shape అని టైప్ చేసి Enter నొక్కండి. |
05:04 | rows మరియు columns యొక్క సంఖ్యలను వరుసగా ఇచ్చే ఒక tuple ను మనం పొందుతాము. |
05:11 | ఈ ఉదాహరణలో, array L అనేది లక్ష ఎనభై ఐదు వేల ఆరు వందల అరవై ఏడు అడ్డువరుసలను మరియు 5 నిలువువరుసలను కలిగి ఉంది. |
05:22 | మనం student_record.txt ఫైల్కు తిరిగి వెళ్దాం. |
05:28 | వీటిపై మనం గణాంక కార్యకలాపాలను వర్తింపజేయడం ప్రారంభిద్దాం.
మొదటి విద్యార్థి కొరకు అన్ని సబ్జెక్టుల యొక్క మార్కుల మొత్తాన్ని మీరు ఎలా కనుగొంటారు? |
05:39 | terminal కు తిరిగి మారండి.
ఒక array లోని మొదటి రో ను యాక్సెస్ చేయడానికి, మనం L స్క్వేర్ బ్రాకెట్స్ లోపల 0 అని టైప్ చేసి Enter నొక్కుతాము. |
05:54 | ఇప్పుడు దీనిని సంకలనం చేయడానికి, totalmarks is equal to sum పరన్తసిస్ ల లోపల L స్క్వేర్ బ్రాకెట్స్ లోపల 0 అని టైప్ చేసి ఎంటర్ నొక్కండి. |
06:09 | totalmarks 0 అని టైప్ చేసి ఎంటర్ నొక్కండి.
మొదటి విద్యార్థి యొక్క అన్ని సబ్జెక్టుల మార్కుల మొత్తం మనం పొందాము. |
06:19 | ఇప్పుడు (mean) సగటును పొందడానికి మనం totalmarks ను array యొక్క పొడవుచేత భాగించవచ్చు. |
06:26 | totalmarks divided by len పరన్తసిస్ ల లోపల L స్క్వేర్ బ్రాకెట్స్ లోపల 0 అని టైప్ చేసి ఎంటర్ నొక్కండి. |
06:40 | లేదంటే function mean ను ఉపయోగించండి. np dot mean పరన్తసిస్ ల లోపల L స్క్వేర్ బ్రాకెట్స్ లోపల 0 అని టైప్ చేసి ఎంటర్ నొక్కండి. |
06:55 | కానీ మనం చాల పెద్ద data set ను కలిగిఉన్నాము.
మరియు ప్రతి విద్యార్థికి (mean) సగటును ఒక్కొక్కటిగా లెక్కించడం అనేది చాల సమయం తీసుకుంటుంది. |
07:04 | పనిని తగ్గించడానికి ఇక్కడ ఏదయినా మార్గం ఉందా?
దీని కొరకు, మనం (mean) సగటు యొక్క documentation ను చూడాలి. |
07:12 | np dot mean questionmark అని టైప్ చేసి ఎంటర్ నొక్కండి. మరింత సమాచారం కోసం టెక్స్ట్ ను చదవండి. |
07:23 | documentation ను నిష్క్రమించడానికి q ని టైప్ చేయండి. |
07:28 | పై ఉదాహరణలో, L అనేది matrix వంటి ఒక two dimensional array. |
07:35 | మనం array యొక్క ప్రతీ axis (అక్షం) అంతటా(mean) సగటును లెక్కించవచ్చు. |
07:41 | rows యొక్క axis(అక్షాలను) 0 చేత మరియు columns యొక్క axis(అక్షాలను) 1 చేత సూచిస్తారు. |
07:48 | మొత్తం columns అంతటా (mean) సగటును లెక్కించడానికి, మనం axis కొరకు అదనపు parameter 1 ను పంపాలి. |
07:57 | terminal కు తిరిగి మారండి. |
08:00 | మనం ప్రతి సబ్జెక్టుకు విద్యార్థులందరూ సాధించిన మార్కుల యొక్క (mean) సగటును లెక్కిద్దాం. |
08:07 | np dot mean పరన్తసిస్ ల లోపల L కామా 0 అని టైప్ చేసి ఎంటర్ నొక్కండి. |
08:18 | తరువాత, మనం మొత్తం విద్యార్థులందరి కొరకు ఇంగ్లీష్ మార్కుల యొక్క (median) (మధ్యగతం) మధ్యస్థాన్ని లెక్కిస్తాము. |
08:25 | L స్క్వేర్ బ్రాకెట్స్ లోపల colon కామా 0 అని టైప్ చేసి ఎంటర్ నొక్కండి. |
08:35 | గమనించండి, colon comma zero అనేది array లోని మొదటి column ను ప్రదర్శిస్తుంది, అంటే English Mark ని. |
08:45 | (median) (మధ్యగతం) మధ్యస్థాన్ని లెక్కించడానికి మనం function median ను ఉపయోగిస్తాము. |
08:51 | np dot median పరన్తసిస్ ల లోపల L స్క్వేర్ బ్రాకెట్స్ లోపల colon కామా 0 అని టైప్ చేసి ఎంటర్ నొక్కండి. |
09:04 | అన్ని సబ్జెక్టుల కొరకు, ఇక్కడ చూపిన విధంగా మనం median function ను ఉపయోగించి మొత్తం rows అంతటా (median) (మధ్యగతం) మధ్యస్థాన్ని లెక్కించవచ్చు. |
09:13 | np dot median పరన్తసిస్ ల లోపల L కామా 0 అని టైప్ చేసి ఎంటర్ నొక్కండి. |
09:24 | అదేవిధంగా (standard deviation) ప్రామాణిక విచలనాన్ని లెక్కించడానికి, మనం function std ను ఉపయోగిస్తాము. |
09:31 | ఇంగ్లీష్ సబ్జెక్ట్ కొరకు (standard deviation) ప్రామాణిక విచలనాన్ని np dot std పరన్తసిస్ ల లోపల L స్క్వేర్ బ్రాకెట్స్ లోపల colon కామా 0 అని టైప్ చేసి Enter నొక్కడం ద్వారా కనుగొనవచ్చు. |
09:50 | మరియు అన్ని రోస్ కొరకు, మనం, np dot std పరన్తసిస్ ల లోపల L కామా 0 అని టైప్ చేసి Enter నొక్కుతాము. |
10:03 | ఇక్కడ వీడియోను పాజ్ చేయండి. క్రింది అభ్యాసాన్నిప్రయత్నించి వీడియోను పునఃప్రారంభించండి. |
10:09 | football.txt ఫైల్ ను చూడండి, అది ఈ ట్యుటోరియల్ యొక్క Code Files లింక్ లో అందుబాటులో ఉంది. |
10:18 | ఫైల్ను డౌన్లోడ్ చేసి present working directory లో సేవ్ చేయండి. |
10:23 | ప్రస్తుతం present working directory అనేది Home directory. |
10:28 | football.txt లో, మొదటి కాలమ్ అనేది player name, |
10:34 | రెండవది హోమ్ వద్ద ఉన్న goals మరియు మూడవది goals away. |
10:42 | ప్రతి (ప్లేయర్)ఆటగాడి కొరకు మొత్తం గోల్స్ ను(లక్ష్యాలను)
హోమ్ యొక్క మరియు దూరమైన గోల్స్ యొక్క (Mean) సగటును |
10:50 | హోమ్ యొక్క మరియు దూరమైన గోల్స్ యొక్క (standard deviation) ప్రామాణిక విచలనాన్ని కనుగొనండి. |
10:55 | టర్మినల్ కు మారండి. |
10:58 | మొదటిదానికి పరిష్కారం, L is equal to np dot loadtxt పరన్తసిస్ ల లోపల కోట్స్ లోపల football.txt comma usecols is equal to పరన్తసిస్ ల లోపల 1 కామా 2 కామా డీలిమిటర్ is equal to కోట్స్ లోపల కామా అని టైప్ చేసి ఎంటర్ నొక్కండి. |
11:31 | np dot sum పరన్తసిస్ ల లోపల L కామా 1 మరియు ఎంటర్ నొక్కండి. |
11:39 | రెండవదాని కొరకు సమాధానం, np dot mean పరన్తసిస్ ల లోపల L కామా 0 మరియు ఎంటర్ నొక్కండి. |
11:50 | మూడవది np dot std పరన్తసిస్ ల లోపల L కామా 0 మరియు ఎంటర్ నొక్కండి. |
11:59 | ఇది మనల్ని ఈ ట్యుటోరియల్ యొక్క చివరకు తీసుకువస్తుంది.
ఈ ట్యుటోరియల్ లో మనం, Python లో sum(మొత్తం), mean(సగటు), median (మధ్యస్థం) మరియు standard deviation (ప్రామాణిక విచలనం) వంటి statistical operations(గణాంక కార్యకలాపాలు) ను చేయడం నేర్చుకున్నాం. |
12:18 | ఇక్కడ మీరు పరిష్కరించడానికి కొన్ని స్వీయ అంచనా ప్రశ్నలు ఉన్నాయి. |
12:23 | చూపిన విధంగా ఒక two dimensional list ను ఇచ్చినట్లయితే, మీరు ప్రతి రో యొక్క సగటు (mean) ను ఎలా లెక్కిస్తారు? |
12:32 | రెండవది ఇచ్చిన లిస్ట్ యొక్క (median) మధ్యస్థాన్ని లెక్కించండి. |
12:37 | మూడవది ఇక్కడ 6 కాలమ్స్ తో ఒక ఫైల్ ఉంది. కానీ మనము 2,3,4,5 కాలమ్స్ నుండి మాత్రమే టెక్స్ట్ ను లోడ్ చేయాలనీ అనుకుంటున్నాము.
దానిని మనంఎలా పేర్కొనాలి? |
12:51 | మరియు సమాధానాలు,
ప్రతీ రో యొక్క సగటు (mean) ను పొందడానికి, మనం function mean కు 1 ని రెండవ parameter గా పంపిస్తాము. |
13:02 | np.mean పరన్తసిస్ ల లోపల two_dimensional_list కామా 1 |
13:11 | list యొక్క (median) మధ్యస్థాన్ని లెక్కించడానికి మనం function median ను ఉపయోగిస్తాం.
np.median పరన్తసిస్ ల లోపల student_marks |
13:24 | మూడవది, ఒక ఫైల్ యొక్క నిర్దిష్ట కాలమ్స్ ను పేర్కొనడానికి, మనం usecols is equal to పరన్తసిస్ ల లోపల 2, 3, 4, 5 పారామీటర్ ను ఉపయోగిస్తాము. |
13:39 | దయచేసి మీ సమయంతో కూడిన సందేహాలను ఈ ఫోరమ్ లో పోస్ట్ చేయండి. |
13:43 | దయచేసి మీ సాధారణ ప్రశ్నలను ఈ Python ఫోరంపై పోస్ట్ చేయండి. |
13:48 | FOSSEE టీం TBC ప్రాజెక్ట్ ను సమన్వయం చేస్తుంది. |
13:53 | స్పోకన్ ట్యుటోరియల్ ప్రాజెక్ట్ NMEICT, MHRD, గవర్నమెంట్ అఫ్ ఇండియా చే నిధులు పొందుతుంది. మరిన్ని వివరాల కొరకు, ఈ వెబ్సైటు ను సందర్శించండి. |
14:05 | నేను ఉదయలక్ష్మి మీ వద్ద శలవు తీసుకుంటున్నాను. మాతో చేరినందుకు ధన్యవాదములు. |