Python-3.4.3/C3/Parsing-data/Telugu

From Script | Spoken-Tutorial
Jump to: navigation, search
Time Narration
00:01 Parsing data అనే స్పోకెన్ ట్యుటోరియల్ కు స్వాగతం.
00:06 ఈ ట్యుటోరియల్ లో మనం,
  • delimiter ను ఉపయోగించి ఒక స్ట్రింగ్ ను చీల్చడం.
  • ఒక string లో ముందంజలోని, వెనుకంజలోని మరియు అన్ని whitespaces లను తొలగించడం
  • ఇంకా విభిన్న built-in datatypes ల మధ్య మార్చడం లను నేర్చుకుంటాము.
00:22 ఈ ట్యుటోరియల్ ను రికార్డ్ చేయడానికి, నేను
  • Ubuntu Linux 16.04 ఆపరేటింగ్ సిస్టమ్
  • Python 3.4.3 మరియు
  • IPython 5.1.0 లను ఉపయోగిస్తున్నాను.
00:38 ఈ ట్యుటోరియల్ ను సాధన చేయటానికి, మీకు lists ను ఎలా ఉపయోగించాలి అనేది తెలిసి ఉండాలి.

ఒకవేళ లేకపోతే, సంబంధిత Python ట్యుటోరియల్స్ ను ఈ వెబ్సైట్ పై చూడండి.

00:49 మొదట, మనం parsing data అంటే ఏమిటో అర్థం చేసుకుందాం.
00:54 డేటాను Parsing చేయడం అంటే డేటాను టెక్స్ట్ ఫామ్ లో చదవడం. ఇది గణనల కోసం ఉపయోగించగల రూపం లోనికి మార్చబడుతుంది.
01:04 తరువాత మనం split() function గురించి నేర్చుకుంటాము.
01:08 split() function అనేది నిర్వచించిన separator ను ఉపయోగించి ఓక పెద్ద string ను చిన్న స్ట్రింగ్స్ గా విభజిస్తుంది.
01:15 ఒకవేళ ఏ argument ను పేర్కొనకపోతే, అపుడు whitespace అనేది డిఫాల్ట్‌ separator గా ఉపయోగించబడుతుంది.
01:22 సింటాక్స్ అనేది: str dot split పరన్తసిస్ ల లోపల argument.
01:29 split function అనేది ఒక string ను కావాల్సినవిధంగా విభజించి tokens యొక్క ఒక array ను తిరిగిఇస్తుంది.

దీనిని string tokenizing అంటారు.

01:38 ముందుగా మనం Ctrl + Alt + T కీలను ఒకేసారి కలిపి నొక్కడం ద్వారా terminal ను తెరుద్దాం.
01:46 ipython3 అని టైప్ చేసి Enter నొక్కండి.
01:52 మనం pylab ప్యాకేజి ని ప్రారంభిద్దాం. percentage sign pylab అని టైప్ చేసి Enter నొక్కండి.
02:02 ఇక్కడ నుండి, టెర్మినల్ పై ప్రతి కమాండ్ ను టైప్ చేసిన తర్వాత Enter కీని నొక్కాలని దయచేసి గుర్తుంచుకోండి.
02:09 మనం వేరియబుల్ str1 ను string data type గా నిర్వచిద్దాం.
02:14 str1 is equal to డబుల్ కోట్స్ లోపల Welcome to కొన్ని whitespaces లను చేర్చి తరువాత Python tutorials అని టైప్ చేయండి.
02:24 మనం to మరియు Python tutorials ల మధ్య ఏ సంఖ్యలోనైనా whitespaces ను కలిగివుండవచ్చు.

కానీ అన్ని spaces లు కలిపి ఒకే space గా పరిగణించబడతాయి.

02:34 ఇప్పుడు, మనం ఈ స్ట్రింగ్ ను whitespace పై split చేయబోతున్నాము.
02:38 str1 dot split తెరచిన మరియు మూసిన పరన్తసిస్ లను టైప్ చేయండి.
02:44 మనం చూస్తున్నట్లుగా, strings యొక్క ఒక list ను పొందుతాము.
02:48 argument తో split() function కొరకు మనం మరొక ఉదాహరణను తీసుకుందాం. చూపిన విధంగా టైప్ చేయండి.
02:57 x dot split పరన్తసిస్ ల లోపల సింగల్ కోట్స్ లోపల semicolon ను టైప్ చేయండి.
03:04 మనం comma చేత వేరు చేయబడిన strings యొక్క ఒక list ను పొందుతాము.
03:08 వీడియోను పాజ్ చేసి, క్రింది అభ్యాసాన్నిప్రయత్నించి వీడియోను పునఃప్రారంభించండి.
03:14 argument గా space ను ఉపయోగించి X ను చీల్చండి. ఇది argument లేకుండా చీల్చడం లాగానే ఉంటుంది.
03:22 పరిష్కారం కొరకు terminal కు మారండి.
03:26 b is equal to x dot split తెరచిన మరియు మూసిన పరన్తసిస్ లను టైప్ చేయండి.
03:32 c is equal to x dot split పరన్తసిస్ ల లోపల మరియు సింగల్ కోట్స్ లోపల space అని టైప్ చేయండి.
03:41 b టైప్ చేయండి.
03:44 c టైప్ చేయండి.
03:47 argument లేకుండా చీల్చడం అనేది space ను argument గా ఇచ్చి చీల్చడం రెండూ సమానమే అని మనం చూడవచ్చు.
03:54 argument లేకుండా స్ట్రింగ్ ను చీల్చడం వలన అది స్ట్రింగ్ ను spaces యొక్క ఏదయినా సంఖ్యతో వేరుచేస్తుంది.
04:01 మరియు argument గా space ను ఇవ్వడం వలన అది వాక్యాన్ని ప్రత్యేకంగా సింగిల్ whitespace పై వేరుచేస్తుంది.
04:08 మనం str1 వేరియబుల్ ను తిరిగిపిలుద్దాం.
04:12 ఇప్పుడు, మనం ఈ స్ట్రింగ్ ను argument లేకుండా చీల్చుదాం. b is equal to str1 dot split తెరచిన మరియు మూసిన పరన్తసిస్ లను టైప్ చేయండి.
04:24 c is equal to str1 dot split పరన్తసిస్ ల లోపల మరియు సింగల్ కోట్స్ లోపల space అని టైప్ చేయండి.
04:33 b టైప్ చేయండి.
04:36 c టైప్ చేయండి.
04:38 మీరు చూస్తున్నట్లుగా, ఇక్కడ b is not equal to c ఎందుకంటే c ఎంట్రీలుగా whitespaces లను కలిగి ఉంది కనుక, అందువల్ల b పదాలను మాత్రమే కలిగిఉంది.
04:49 తరువాత మనం strip method గురించి నేర్చుకుంటాము.
04:53 strip function అనేది ఒక స్ట్రింగ్ లోని ముందంజలోని, వెనుకంజలోని మరియు అన్ని whitespaces లను తొలగిస్తుంది.
04:59 unstripped is equal to డబుల్ కోట్స్ లోపల space Hello world space అని టైప్ చేయడం ద్వారా మనం ఒక స్ట్రింగ్ ను నిర్వచిద్దాము.
05:09 ఇప్పుడు whitespace ను తొలగించడానికి, unstripped dot strip తెరచిన మరియు మూసిన పరన్తసిస్ లను టైప్ చేయండి.
05:18 strip, స్ట్రింగ్ యొక్క ప్రారంభంలో మరియు చివరిలో ఉన్న అన్ని whitespaces లను తొలగిస్తుందని మనం చూడవచ్చు.
05:25 splitting మరియు stripping తరువాత, ముందంజలోని, వెనుకంజలోని తీసివేయబడిన spaces తో స్ట్రింగ్స్ యొక్క ఒక జాబితాను మనం పొందుతాము.
05:32 ఇప్పుడు మనం strings ను floats మరియు integers లోనికి మార్చడం చూద్దాం.
05:38 mark underscore str is equal to డబుల్ కోట్స్ లోపల 1.25 అని టైప్ చేయండి.
05:46 గమనించండి 1.25 అనేది ఒక స్ట్రింగ్ మరియు డబుల్ కోట్స్‌లో ఉన్నందున ఇది float కాదు.
05:53 mark is equal to float పరన్తసిస్ ల లోపల mark underscore str అని టైప్ చేయండి. ఇక్కడ మనం string ను float కు మారుస్తున్నాము.
06:05 Type పరన్తసిస్ ల లోపల mark underscore str అని టైప్ చేయండి. ఇది మీకు mark_str యొక్క datatype అనేది ఒక స్ట్రింగ్ అని చెప్తుంది.
06:17 type పరన్తసిస్ ల లోపల mark అని టైప్ చేయండి. ఇది mark అనేది ఒక float datatype అని చూపిస్తుంది.
06:26 స్ట్రింగ్, float గా మార్చబడిందని మనం చూడవచ్చు. ఇప్పుడు మనం వాటిపై mathematical operations(గణిత కార్యకలాపాలను) చేయవచ్చు.
06:34 వీడియోను పాజ్ చేయండి. క్రింది అభ్యాసాన్నిప్రయత్నించి వీడియోను పునఃప్రారంభించండి.
06:40 ఒకవేళ మీరు terminal లో int పరన్తసిస్ ల లోపల డబుల్ కోట్స్ లోపల 1.25 అని టైప్ చేస్తే ఏమి జరుగుతుంది?
06:48 పరిష్కారం కొరకు terminal కు మారండి.
06:52 int పరన్తసిస్ ల లోపల డబుల్ కోట్స్ లోపల 1.25 అని టైప్ చేయండి.
06:59 మనం ఒక ValueError ను చూడవచ్చు. మనం ఒక స్ట్రింగ్ ను integer కు నేరుగా మార్చలేము.
07:06 మనం దీనికి సరైన పరిష్కారం చూద్దాం. dcml underscore str is equal to డబుల్ కోట్స్ లోపల 1.25 అని టైప్ చేయండి.
07:18 flt is equal to float పరన్తసిస్ ల లోపల dcml underscore str అని టైప్ చేయండి.
07:27 ఇక్కడ మనం స్ట్రింగ్ ను float కు మారుస్తున్నాము, ఎందుకంటే మనం దానిని నేరుగా integer లోనికి మార్చలేము కనుక.
07:34 flt అని టైప్ చేయండి.
07:37 number is equal to int పరన్తసిస్ ల లోపల flt అని టైప్ చేయండి. ఇప్పుడు మనం float ను integer లోనికి మారుస్తున్నాము.
07:48 number అని టైప్ చేయండి. మనం అవుట్పుట్ ను integer గా పొందుతాము.
07:54 ఈ విధంగా మనం strings ను floats మరియు integers లోనికి మార్చాలి.
07:59 తరువాత, మనం data ను పార్స్ చేయడానికి డేటా ఫైల్ ను ఉపయోగిస్తాము.
08:04 నన్ను టెక్స్ట్ ఎడిటర్ లో student underscore record.txt ఫైల్ ను తెరవనివ్వండి.
08:10 student underscore record.txt ఫైల్ ఈ ట్యుటోరియల్ యొక్క Code files లింక్ లో అందుబాటులో ఉంది.

దయచేసి దానిని మీ Home directory లో డౌన్‌లోడ్ చేసి ఉపయోగించండి.

08:22 మొదట మనం ఈ ఫైల్ ను లైన్ తర్వాత లైన్ లా చదువుతాము ఇంకా ఈ ఫైల్ లోని ప్రతి రికార్డ్ ను పార్స్ చేస్తాము.
08:28 ఇది State Secondary Board Examination లో విద్యార్థుల యొక్క రికార్డ్స్ ను మరియు వారియొక్క మార్కులను కలిగిఉంటుంది.
08:35 ఇందులో 1 లక్ష 80 వేల లైన్ లు కలిగి ఉన్న రికార్డు ఉంది. మనము దీన్ని చదివి ఈ డేటాను ప్రాసెస్ చేయబోతున్నాం.
08:43 ఈ ఫైల్ లోని ప్రతి లైన్ semicolons చేత వేరుపరచబడిన fields యొక్క ఒక జత.
08:49 ఈ ఫైల్ నుండి ఒక నమూనా రికార్డును పరిగణించండి.
08:53 ఈ క్రిందివి ఇచ్చిన ఏదైనా లైన్‌లోని fields.

రీజియన్ కోడ్ రోల్ నంబర్ పేరు 5 సబ్జెక్టుల మార్కులు మొత్తం మార్కులు

09:08 క్రొత్త టెక్స్ట్ ఎడిటర్‌ను తెరవండి. చూపిన విధంగా కోడ్‌ను టైప్ చేయండి.
09:14 ఈ ప్రోగ్రాం ను నన్ను వివరించనివ్వండి.
09:17 మునుపటి ట్యుటోరియల్‌లో మనం for loop ను నేర్చుకున్నాము.

for loop విద్యార్థి రికార్డ్ ను ప్రాసెస్ చేసి ప్రతి రికార్డ్ యొక్క ఫీల్డ్స్ ను చీల్చుతుంది.

09:28 గణిత మార్కులు తరువాత float కు మార్చబడతాయి.
09:32 అప్పుడు అది చేర్చబడుతుంది మరియు రీజియన్ కోడ్ A కొరకు ఒక వేరియబుల్ లో ఒక లిస్ట్ math underscore marks underscore A గా భద్రపరచబడుతుంది.
09:41 ఫైల్‌ను హోమ్ డైరెక్టరీ లో marks.py గా సేవ్ చేయండి.
09:48 terminal కు మారండి.
09:51 percentage sign run space marks.py తో ఫైల్ ను అమలుచేయండి.
09:58 ఎడిటర్‌కు తిరిగి మారండి. ఇప్పుడు మనం region A కొరకు అన్ని గణితం మార్కులను math underscore marks underscore A అనే లిస్ట్ లో కలిగిఉన్నాము.
10:09 region A కొరకు గణితం మార్కుల సగటును(mean) లెక్కించడానికి క్రింది లైన్స్ ను జోడించండి.
10:15 దీని కొరకు, మనం గణిత మార్కులను సంకలనం చేసి పొడవుతో భాగించాలి.
10:21 region A లోని విద్యార్థుల యొక్క సంఖ్య పొడవును ఇస్తుందని గమనించండి.
10:26 మనం ఫైల్ ను సేవ్ చేద్దాం.
10:29 terminal కు మారండి.
10:32 ఫైల్ ను percentage sign run space marks.py తో మళ్ళీ అమలుచేయండి.
10:40 అందువల్ల మనం మన చివరి అవుట్పుట్ ను పొందుతాము.
10:43 ఇక్కడ region A కొరకు సగటు విలువ అనేది సుమారుగా 1 లక్ష 80 వేల రికార్డులు కోసం లెక్కించబడుతుంది.
10:51 ఈ విధంగా మనం ఒక భారీ డేటాను విభజించి, చదివి దానిపై గణనలను చేస్తాము.
10:57 ఇది మనల్ని ఈ ట్యుటోరియల్ యొక్క చివరకు తీసుకువస్తుంది.
11:01 ఈ ట్యుటోరియల్ లో మనం నేర్చుకున్నవి,

ఒక string ను Tokenize చేయడం delimiters చేత వేరుపరచబడిన ఒక స్ట్రింగ్ ను split() ఫంక్షన్ ను ఉపయోగించి చీల్చడం.

11:11 strip() function ను ఉపయోగించి whitespaces ను తొలగించడం.

సంఖ్యల యొక్క datatypes ను ఒక రకం నుండి మరొక రకానికి మార్చడం. ఇన్పుట్ డేటాను Parse చేసి దానిపై గణనలను చేయడం.

11:25 ఇక్కడ మీరు పరిష్కరించడానికి కొన్ని స్వీయ అంచనా ప్రశ్నలు.

1. పదాలను పొందడానికి మీరు Guido; Rossum;Python అనే స్ట్రింగ్‌ను ఎలా చీల్చుతారు?

11:36 2. int పరాంథసిస్ ల లోపల డబుల్ కోట్స్ లోపల 20.0 ఏమి ఉత్పత్తి చేస్తుంది?
11:43 మరియు సమాధానాలు,

1. line.split పరాంథసిస్ ల లోపల సింగిల్ కోట్స్ లోపల కామా 2. int పరాంథసిస్ ల లోపల డబుల్ కోట్స్ లోపల 20.0 అనేది ఒక ఎర్రర్ ను ఇస్తుంది, ఎందుకంటే స్ట్రింగ్ ను నేరుగా integer లోనికి మార్చడం సాధ్యం కాదు కనుక.

12:03 దయచేసి మీ సమయంతో కూడిన సందేహాలను ఈ ఫోరమ్ లో పోస్ట్ చేయండి.
12:07 దయచేసి మీ సాధారణ ప్రశ్నలను ఈ Python ఫోరంపై పోస్ట్ చేయండి.
12:12 FOSSEE టీం TBC ప్రాజెక్ట్ ను సమన్వయం చేస్తుంది.
12:16 స్పోకన్ ట్యుటోరియల్ ప్రాజెక్ట్ NMEICT, MHRD, గవర్నమెంట్ అఫ్ ఇండియా చే నిధులు పొందుతుంది. మరిన్ని వివరాల కొరకు, ఈ వెబ్సైటు ను సందర్శించండి.
12:27 నేను ఉదయలక్ష్మి మీ వద్ద శలవు తీసుకుంటున్నాను. మాతో చేరినందుకు ధన్యవాదములు.

Contributors and Content Editors

Madhurig, Simhadriudaya