Python-3.4.3/C3/Statistics/Telugu

From Script | Spoken-Tutorial
Revision as of 17:41, 18 October 2019 by Madhurig (Talk | contribs)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to: navigation, search
Time
Narration
00:01 ప్రియమైన స్నేహితులారా, Python లో Statistics గురించి వివరించే ఈ ట్యుటోరియల్ కు స్వాగతం.
00:07 ఈ ట్యుటోరియల్ యొక్క చివరకు, మీరు -Python లో statistical ఆపరేషన్స్ ను చేయడం
00:14 సంఖ్యల యొక్క ఒక సమితి ని సంకలనం(sum)చేయడం మరియు వాటి సగటు, మద్యస్థం మరియు ప్రామాణిక విచలనం లను కనుగొనడం లను చేయగలుగుతారు.
00:22 ఈ ట్యుటోరియల్ ను రికార్డ్ చేయడానికి, నేను Ubuntu Linux 16.04 ఆపరేటింగ్ సిస్టమ్
00:29 Python 3.4.3 IPython 5.1.0 లను ఉపయోగిస్తున్నాను.
00:36 ఈ ట్యుటోరియల్ ను సాధన చేయటానికి, మీకు ఫైల్స్ నుండి డేటాను లోడ్ చేయడం
00:42 లిస్ట్స్ ను ఉపయోగించడం మరియు Arrays యొక్క భాగాలను యాక్సెస్ చేయడం ఎలా చేయాలో తెలిసి ఉండాలి.
00:47 ఒకవేళ లేకపోతే, ముందస్తు అవసరాలపై Python ట్యుటోరియల్స్ ను ఈ వెబ్సైట్ పై చూడండి.
00:53 ఈ ట్యుటోరియల్ కొరకు, మనం మునుపటి ట్యుటోరియల్‌లో ఉపయోగించిన డేటా ఫైల్ student_record.txt ను ఉపయోగిస్తాము.
01:03 మీరు ఈ ఫైల్‌ను ఈ ట్యుటోరియల్ యొక్క కోడ్ ఫైల్స్ లింక్‌లో కూడా కనుగొనవచ్చు.
01:08 దయచేసి దీన్ని హోమ్ డైరెక్టరీ లో డౌన్‌లోడ్ చేసి ఉపయోగించండి.
01:12 మనం ఈ array structured file పై గణిత మరియు తార్కిక ఆపరేషన్లను ఉపయోగిస్తాము.

దీని కొరకు, మనం Numpy ను ఇన్స్టాల్ చేయాలి.

01:22 NumPy, అంటే Numerical Python.
01:26 ఇది గణిత మరియు సంఖ్యా అభ్యాసం కొరకు pre-compiled functions లను కలిగిఉన్న ఒక లైబ్రరీ.
01:33 NumPy ను విడిగా ఇన్‌స్టాల్ చేయాలి.
01:37 ముందుగా మనం Ctrl + Alt + T కీలను ఒకేసారి కలిపి నొక్కడం ద్వారా terminal ను తెరుద్దాం.
01:45 మనం సరికొత్త (లేటెస్ట్) pip ను ఇన్‌స్టాల్ చేద్దాం.

python libraries ను ఇన్స్టాల్ చేయడానికి pip కమాండ్ ఉపయోగించబడుతుంది.

01:53 sudo apt-get install python3 hyphen pip అని టైప్ చేసి Enter నొక్కండి.
02:03 మీకు ఇన్స్టలేషన్ కొరకు root యాక్సెస్ ఉండాలి ఎందుకంటే అది admin password ను అడుగుతుంది గనక.
02:15 తరువాత, మనం ట్యుటోరియల్ అంతటా numpy లైబ్రరీ ను ఉపయోగిస్తున్నందున మనం numpy లైబ్రరీ ను ఇన్స్టాల్ చేయాలి.
02:24 sudo pip3 install numpy is equal to is equal to 1.13.3 అని టైప్ చేసి Enter నొక్కండి.
02:38 ఇన్స్టాలేషన్ విజయవంతంగా పూర్తయింది. మనం ఎటువంటి ఎర్రర్ లేకుండా terminal prompt ను చూడవచ్చు.
02:47 తరువాత మనం loadtxt () ఫంక్షన్ గురించి నేర్చుకుంటాము.
02:52 డేటాను ఒక అర్రే గా పొందడానికి, మనం loadtxt() function ను ఉపయోగిస్తాము.
02:58 loadtxt() function కొరకు, మనం మొదట numpy library ను దిగుమతి చేసుకోవాలి.
03:04 Terminal కు తిరిగి మారండి. ఇప్పుడు, ipython3 అని టైప్ చేసి, Enter నొక్కండి.
03:12 import numpy as np అని టైప్ చేసి Enter నొక్కండి.

అక్కడ np అనేది numpy కు మారుపేరు( అలియాస్) ఇంకా అది ఏ పేరైనా కావచ్చు.

03:24 Student_record.txt ఫైల్ నుండి డేటాను మనం ఒక అర్రే గా లోడ్ చేద్దాం.
03:32 L is equal to np dot loadtxt పరన్తసిస్ ల లోపల కోట్స్ లోపల student_record.txt కామా usecols is equal to పరన్తసిస్ ల లోపల 3 కామా4 కామా 5 కామా 6 కామా 7 కామా delimiter is equal to కోట్స్ లోపల semicolon అని టైప్ చేసి Enter నొక్కండి.
04:04 L అని టైప్ చేసి Enter నొక్కండి.
04:07 మనం అవుట్పుట్ ను అర్రే రూపంలో పొందుతాము.
04:11 loadtxt, డేటాను ఒక ఎక్సటర్నల్ ఫైల్ నుండి లోడ్ చేస్తుంది.
04:16 Delimiter అనేది డేటా యొక్కfields ద్వారా వేరు చేయబడిన క్యారక్టర్ యొక్క రకాన్ని నిర్దేశిస్తుంది.

usecols అనేది ఉపయోగించాల్సిన columns ను నిర్దేశిస్తుంది.

04:27 loadtxt, delimiter మరియు usecols అనేవి keywords.
04:33 కనుక,student_record.txt నుండి columns 3,4,5,6,7 అనేవి ఇక్కడ లోడ్ అవుతాయి.
04:42 column numbers మధ్య కామా జోడించబడింది ఎందుకంటే usecols అనేది ఒక sequence కనుక.
04:49 మనం చూస్తున్నట్లుగా L అనేది ఒక array. shape ను ఉపయోగించి మనం ఈ array యొక్క ఆకారాన్ని పొందవచ్చు.
04:58 L dot shape అని టైప్ చేసి Enter నొక్కండి.
05:04 rows మరియు columns యొక్క సంఖ్యలను వరుసగా ఇచ్చే ఒక tuple ను మనం పొందుతాము.
05:11 ఈ ఉదాహరణలో, array L అనేది లక్ష ఎనభై ఐదు వేల ఆరు వందల అరవై ఏడు అడ్డువరుసలను మరియు 5 నిలువువరుసలను కలిగి ఉంది.
05:22 మనం student_record.txt ఫైల్‌కు తిరిగి వెళ్దాం.
05:28 వీటిపై మనం గణాంక కార్యకలాపాలను వర్తింపజేయడం ప్రారంభిద్దాం.

మొదటి విద్యార్థి కొరకు అన్ని సబ్జెక్టుల యొక్క మార్కుల మొత్తాన్ని మీరు ఎలా కనుగొంటారు?

05:39 terminal కు తిరిగి మారండి.

ఒక array లోని మొదటి రో ను యాక్సెస్ చేయడానికి, మనం L స్క్వేర్ బ్రాకెట్స్ లోపల 0 అని టైప్ చేసి Enter నొక్కుతాము.

05:54 ఇప్పుడు దీనిని సంకలనం చేయడానికి, totalmarks is equal to sum పరన్తసిస్ ల లోపల L స్క్వేర్ బ్రాకెట్స్ లోపల 0 అని టైప్ చేసి ఎంటర్ నొక్కండి.
06:09 totalmarks 0 అని టైప్ చేసి ఎంటర్ నొక్కండి.

మొదటి విద్యార్థి యొక్క అన్ని సబ్జెక్టుల మార్కుల మొత్తం మనం పొందాము.

06:19 ఇప్పుడు (mean) సగటును పొందడానికి మనం totalmarks ను array యొక్క పొడవుచేత భాగించవచ్చు.
06:26 totalmarks divided by len పరన్తసిస్ ల లోపల L స్క్వేర్ బ్రాకెట్స్ లోపల 0 అని టైప్ చేసి ఎంటర్ నొక్కండి.
06:40 లేదంటే function mean ను ఉపయోగించండి. np dot mean పరన్తసిస్ ల లోపల L స్క్వేర్ బ్రాకెట్స్ లోపల 0 అని టైప్ చేసి ఎంటర్ నొక్కండి.
06:55 కానీ మనం చాల పెద్ద data set ను కలిగిఉన్నాము.

మరియు ప్రతి విద్యార్థికి (mean) సగటును ఒక్కొక్కటిగా లెక్కించడం అనేది చాల సమయం తీసుకుంటుంది.

07:04 పనిని తగ్గించడానికి ఇక్కడ ఏదయినా మార్గం ఉందా?

దీని కొరకు, మనం (mean) సగటు యొక్క documentation ను చూడాలి.

07:12 np dot mean questionmark అని టైప్ చేసి ఎంటర్ నొక్కండి. మరింత సమాచారం కోసం టెక్స్ట్ ను చదవండి.
07:23 documentation ను నిష్క్రమించడానికి q ని టైప్ చేయండి.
07:28 పై ఉదాహరణలో, L అనేది matrix వంటి ఒక two dimensional array.
07:35 మనం array యొక్క ప్రతీ axis (అక్షం) అంతటా(mean) సగటును లెక్కించవచ్చు.
07:41 rows యొక్క axis(అక్షాలను) 0 చేత మరియు columns యొక్క axis(అక్షాలను) 1 చేత సూచిస్తారు.
07:48 మొత్తం columns అంతటా (mean) సగటును లెక్కించడానికి, మనం axis కొరకు అదనపు parameter 1 ను పంపాలి.
07:57 terminal కు తిరిగి మారండి.
08:00 మనం ప్రతి సబ్జెక్టుకు విద్యార్థులందరూ సాధించిన మార్కుల యొక్క (mean) సగటును లెక్కిద్దాం.
08:07 np dot mean పరన్తసిస్ ల లోపల L కామా 0 అని టైప్ చేసి ఎంటర్ నొక్కండి.
08:18 తరువాత, మనం మొత్తం విద్యార్థులందరి కొరకు ఇంగ్లీష్ మార్కుల యొక్క (median) (మధ్యగతం) మధ్యస్థాన్ని లెక్కిస్తాము.
08:25 L స్క్వేర్ బ్రాకెట్స్ లోపల colon కామా 0 అని టైప్ చేసి ఎంటర్ నొక్కండి.
08:35 గమనించండి, colon comma zero అనేది array లోని మొదటి column ను ప్రదర్శిస్తుంది, అంటే English Mark ని.
08:45 (median) (మధ్యగతం) మధ్యస్థాన్ని లెక్కించడానికి మనం function median ను ఉపయోగిస్తాము.
08:51 np dot median పరన్తసిస్ ల లోపల L స్క్వేర్ బ్రాకెట్స్ లోపల colon కామా 0 అని టైప్ చేసి ఎంటర్ నొక్కండి.
09:04 అన్ని సబ్జెక్టుల కొరకు, ఇక్కడ చూపిన విధంగా మనం median function ను ఉపయోగించి మొత్తం rows అంతటా (median) (మధ్యగతం) మధ్యస్థాన్ని లెక్కించవచ్చు.
09:13 np dot median పరన్తసిస్ ల లోపల L కామా 0 అని టైప్ చేసి ఎంటర్ నొక్కండి.
09:24 అదేవిధంగా (standard deviation) ప్రామాణిక విచలనాన్ని లెక్కించడానికి, మనం function std ను ఉపయోగిస్తాము.
09:31 ఇంగ్లీష్ సబ్జెక్ట్ కొరకు (standard deviation) ప్రామాణిక విచలనాన్ని np dot std పరన్తసిస్ ల లోపల L స్క్వేర్ బ్రాకెట్స్ లోపల colon కామా 0 అని టైప్ చేసి Enter నొక్కడం ద్వారా కనుగొనవచ్చు.
09:50 మరియు అన్ని రోస్ కొరకు, మనం, np dot std పరన్తసిస్ ల లోపల L కామా 0 అని టైప్ చేసి Enter నొక్కుతాము.
10:03 ఇక్కడ వీడియోను పాజ్ చేయండి. క్రింది అభ్యాసాన్నిప్రయత్నించి వీడియోను పునఃప్రారంభించండి.
10:09 football.txt ఫైల్ ను చూడండి, అది ఈ ట్యుటోరియల్ యొక్క Code Files లింక్ లో అందుబాటులో ఉంది.
10:18 ఫైల్‌ను డౌన్‌లోడ్ చేసి present working directory లో సేవ్ చేయండి.
10:23 ప్రస్తుతం present working directory అనేది Home directory.
10:28 football.txt లో, మొదటి కాలమ్ అనేది player name,
10:34 రెండవది హోమ్ వద్ద ఉన్న goals మరియు మూడవది goals away.
10:42 ప్రతి (ప్లేయర్)ఆటగాడి కొరకు మొత్తం గోల్స్ ను(లక్ష్యాలను)

హోమ్ యొక్క మరియు దూరమైన గోల్స్ యొక్క (Mean) సగటును

10:50 హోమ్ యొక్క మరియు దూరమైన గోల్స్ యొక్క (standard deviation) ప్రామాణిక విచలనాన్ని కనుగొనండి.
10:55 టర్మినల్ కు మారండి.
10:58 మొదటిదానికి పరిష్కారం, L is equal to np dot loadtxt పరన్తసిస్ ల లోపల కోట్స్ లోపల football.txt comma usecols is equal to పరన్తసిస్ ల లోపల 1 కామా 2 కామా డీలిమిటర్ is equal to కోట్స్ లోపల కామా అని టైప్ చేసి ఎంటర్ నొక్కండి.
11:31 np dot sum పరన్తసిస్ ల లోపల L కామా 1 మరియు ఎంటర్ నొక్కండి.
11:39 రెండవదాని కొరకు సమాధానం, np dot mean పరన్తసిస్ ల లోపల L కామా 0 మరియు ఎంటర్ నొక్కండి.
11:50 మూడవది np dot std పరన్తసిస్ ల లోపల L కామా 0 మరియు ఎంటర్ నొక్కండి.
11:59 ఇది మనల్ని ఈ ట్యుటోరియల్ యొక్క చివరకు తీసుకువస్తుంది.

ఈ ట్యుటోరియల్ లో మనం, Python లో sum(మొత్తం), mean(సగటు), median (మధ్యస్థం) మరియు standard deviation (ప్రామాణిక విచలనం) వంటి statistical operations(గణాంక కార్యకలాపాలు) ను చేయడం నేర్చుకున్నాం.

12:18 ఇక్కడ మీరు పరిష్కరించడానికి కొన్ని స్వీయ అంచనా ప్రశ్నలు ఉన్నాయి.
12:23 చూపిన విధంగా ఒక two dimensional list ను ఇచ్చినట్లయితే, మీరు ప్రతి రో యొక్క సగటు (mean) ను ఎలా లెక్కిస్తారు?
12:32 రెండవది ఇచ్చిన లిస్ట్ యొక్క (median) మధ్యస్థాన్ని లెక్కించండి.
12:37 మూడవది ఇక్కడ 6 కాలమ్స్ తో ఒక ఫైల్ ఉంది. కానీ మనము 2,3,4,5 కాలమ్స్ నుండి మాత్రమే టెక్స్ట్ ను లోడ్ చేయాలనీ అనుకుంటున్నాము.

దానిని మనంఎలా పేర్కొనాలి?

12:51 మరియు సమాధానాలు,

ప్రతీ రో యొక్క సగటు (mean) ను పొందడానికి, మనం function mean కు 1 ని రెండవ parameter గా పంపిస్తాము.

13:02 np.mean పరన్తసిస్ ల లోపల two_dimensional_list కామా 1
13:11 list యొక్క (median) మధ్యస్థాన్ని లెక్కించడానికి మనం function median ను ఉపయోగిస్తాం.

np.median పరన్తసిస్ ల లోపల student_marks

13:24 మూడవది, ఒక ఫైల్ యొక్క నిర్దిష్ట కాలమ్స్ ను పేర్కొనడానికి, మనం usecols is equal to పరన్తసిస్ ల లోపల 2, 3, 4, 5 పారామీటర్ ను ఉపయోగిస్తాము.
13:39 దయచేసి మీ సమయంతో కూడిన సందేహాలను ఈ ఫోరమ్ లో పోస్ట్ చేయండి.
13:43 దయచేసి మీ సాధారణ ప్రశ్నలను ఈ Python ఫోరంపై పోస్ట్ చేయండి.
13:48 FOSSEE టీం TBC ప్రాజెక్ట్ ను సమన్వయం చేస్తుంది.
13:53 స్పోకన్ ట్యుటోరియల్ ప్రాజెక్ట్ NMEICT, MHRD, గవర్నమెంట్ అఫ్ ఇండియా చే నిధులు పొందుతుంది. మరిన్ని వివరాల కొరకు, ఈ వెబ్సైటు ను సందర్శించండి.
14:05 నేను ఉదయలక్ష్మి మీ వద్ద శలవు తీసుకుంటున్నాను. మాతో చేరినందుకు ధన్యవాదములు.

Contributors and Content Editors

Madhurig, Simhadriudaya