Python-3.4.3/C3/Parsing-data/Telugu
Time | Narration |
00:01 | Parsing data అనే స్పోకెన్ ట్యుటోరియల్ కు స్వాగతం. |
00:06 | ఈ ట్యుటోరియల్ లో మనం
delimiter ను ఉపయోగించి ఒక స్ట్రింగ్ ను చీల్చడం. ఒక string లో ముందంజలోని, వెనుకంజలోని మరియు అన్ని whitespaces లను తొలగించడం ఇంకా విభిన్న built-in datatypes ల మధ్య మార్చడం లను నేర్చుకుంటాము. |
00:22 | ఈ ట్యుటోరియల్ ను రికార్డ్ చేయడానికి, నేను
Ubuntu Linux 16.04 ఆపరేటింగ్ సిస్టమ్ Python 3.4.3 మరియు IPython 5.1.0 లను ఉపయోగిస్తున్నాను. |
00:38 | ఈ ట్యుటోరియల్ ను సాధన చేయటానికి, మీకు lists ను ఎలా ఉపయోగించాలి అనేది తెలిసి ఉండాలి.
ఒకవేళ లేకపోతే, సంబంధిత Python ట్యుటోరియల్స్ ను ఈ వెబ్సైట్ పై చూడండి. |
00:49 | మొదట, మనం parsing data అంటే ఏమిటో అర్థం చేసుకుందాం. |
00:54 | డేటాను Parsing చేయడం అంటే డేటాను టెక్స్ట్ ఫామ్ లో చదవడం. ఇది గణనల కోసం ఉపయోగించగల రూపం లోనికి మార్చబడుతుంది. |
01:04 | తరువాత మనం split() function గురించి నేర్చుకుంటాము. |
01:08 | split() function అనేది నిర్వచించిన separator ను ఉపయోగించి ఓక పెద్ద string ను చిన్న స్ట్రింగ్స్ గా విభజిస్తుంది. |
01:15 | ఒకవేళ ఏ argument ను పేర్కొనకపోతే, అపుడు whitespace అనేది డిఫాల్ట్ separator గా ఉపయోగించబడుతుంది. |
01:22 | సింటాక్స్ అనేది: str dot split పరన్తసిస్ ల లోపల argument. |
01:29 | split function అనేది ఒక string ను కావాల్సినవిధంగా విభజించి tokens యొక్క ఒక array ను తిరిగిఇస్తుంది.
దీనిని string tokenizing అంటారు. |
01:38 | ముందుగా మనం Ctrl + Alt + T కీలను ఒకేసారి కలిపి నొక్కడం ద్వారా terminal ను తెరుద్దాం. |
01:46 | ipython3 అని టైప్ చేసి Enter నొక్కండి. |
01:52 | మనం pylab ప్యాకేజి ని ప్రారంభిద్దాం. percentage sign pylab అని టైప్ చేసి Enter నొక్కండి. |
02:02 | ఇక్కడ నుండి, టెర్మినల్ పై ప్రతి కమాండ్ ను టైప్ చేసిన తర్వాత Enter కీని నొక్కాలని దయచేసి గుర్తుంచుకోండి. |
02:09 | మనం వేరియబుల్ str1 ను string data type గా నిర్వచిద్దాం. |
02:14 | str1 is equal to డబుల్ కోట్స్ లోపల Welcome to కొన్ని whitespaces లను చేర్చి తరువాత Python tutorials అని టైప్ చేయండి. |
02:24 | మనం to మరియు Python tutorials ల మధ్య ఏ సంఖ్యలోనైనా whitespaces ను కలిగివుండవచ్చు
కానీ అన్ని spaces లు కలిపి ఒకే space గా పరిగణించబడతాయి. |
02:34 | ఇప్పుడు, మనం ఈ స్ట్రింగ్ ను whitespace పై split చేయబోతున్నాము. |
02:38 | str1 dot split తెరచిన మరియు మూసిన పరన్తసిస్ లను టైప్ చేయండి. |
02:44 | మనం చూస్తున్నట్లుగా, strings యొక్క ఒక list ను పొందుతాము. |
02:48 | argument తో split() function కొరకు మనం మరొక ఉదాహరణను తీసుకుందాం. చూపిన విధంగా టైప్ చేయండి. |
02:57 | x dot split పరన్తసిస్ ల లోపల సింగల్ కోట్స్ లోపల semicolon ను టైప్ చేయండి. |
03:04 | మనం comma చేత వేరు చేయబడిన strings యొక్క ఒక list ను పొందుతాము. |
03:08 | వీడియోను పాజ్ చేసి, క్రింది అభ్యాసాన్నిప్రయత్నించి వీడియోను పునఃప్రారంభించండి. |
03:14 | argument గా space ను ఉపయోగించి X ను చీల్చండి. ఇది argument లేకుండా చీల్చడం లాగానే ఉంటుంది. |
03:22 | పరిష్కారం కొరకు terminal కు మారండి. |
03:26 | b is equal to x dot split తెరచిన మరియు మూసిన పరన్తసిస్ లను టైప్ చేయండి. |
03:32 | c is equal to x dot split పరన్తసిస్ ల లోపల మరియు సింగల్ కోట్స్ లోపల space అని టైప్ చేయండి. |
03:41 | b టైప్ చేయండి. |
03:44 | c టైప్ చేయండి |
03:47 | argument లేకుండా చీల్చడం అనేది space ను argument గా ఇచ్చి చీల్చడం రెండూ సమానమే అని మనం చూడవచ్చు. |
03:54 | argument లేకుండా స్ట్రింగ్ ను చీల్చడం వలన అది స్ట్రింగ్ ను spaces యొక్క ఏదయినా సంఖ్యతో వేరుచేస్తుంది. |
04:01 | మరియు argument గా space ను ఇవ్వడం వలన అది వాక్యాన్ని ప్రత్యేకంగా సింగిల్ whitespace పై వేరుచేస్తుంది. |
04:08 | మనం str1 వేరియబుల్ ను తిరిగిపిలుద్దాం. |
04:12 | ఇప్పుడు, మనం ఈ స్ట్రింగ్ ను argument లేకుండా చీల్చుదాం. b is equal to str1 dot split తెరచిన మరియు మూసిన పరన్తసిస్ లను టైప్ చేయండి. |
04:24 | c is equal to str1 dot split పరన్తసిస్ ల లోపల మరియు సింగల్ కోట్స్ లోపల space అని టైప్ చేయండి. |
04:33 | b టైప్ చేయండి. |
04:36 | c టైప్ చేయండి. |
04:38 | మీరు చూస్తున్నట్లుగా, ఇక్కడ b is not equal to c ఎందుకంటే c ఎంట్రీలుగా whitespaces లను కలిగి ఉంది కనుక, అందువల్ల b పదాలను మాత్రమే కలిగిఉంది. |
04:49 | తరువాత మనం strip method గురించి నేర్చుకుంటాము. |
04:53 | strip function అనేది ఒక స్ట్రింగ్ లోని ముందంజలోని, వెనుకంజలోని మరియు అన్ని whitespaces లను తొలగిస్తుంది. |
04:59 | unstripped is equal to డబుల్ కోట్స్ లోపల space Hello world space అని టైప్ చేయడం ద్వారా మనం ఒక స్ట్రింగ్ ను నిర్వచిద్దాము. |
05:09 | ఇప్పుడు whitespace ను తొలగించడానికి, unstripped dot strip తెరచిన మరియు మూసిన పరన్తసిస్ లను టైప్ చేయండి. |
05:18 | strip, స్ట్రింగ్ యొక్క ప్రారంభంలో మరియు చివరిలో ఉన్న అన్ని whitespaces లను తొలగిస్తుందని మనం చూడవచ్చు. |
05:25 | splitting మరియు stripping తరువాత, ముందంజలోని, వెనుకంజలోని తీసివేయబడిన spaces తో స్ట్రింగ్స్ యొక్క ఒక జాబితాను మనం పొందుతాము |
05:32 | ఇప్పుడు మనం strings ను floats మరియు integers లోనికి మార్చడం చూద్దాం. |
05:38 | mark underscore str is equal to డబుల్ కోట్స్ లోపల 1.25 అని టైప్ చేయండి. |
05:46 | గమనించండి 1.25 అనేది ఒక స్ట్రింగ్ మరియు డబుల్ కోట్స్లో ఉన్నందున ఇది float కాదు. |
05:53 | mark is equal to float పరన్తసిస్ ల లోపల mark underscore str అని టైప్ చేయండి. ఇక్కడ మనం string ను float కు మారుస్తున్నాము. |
06:05 | Type పరన్తసిస్ ల లోపల mark underscore str అని టైప్ చేయండి. ఇది మీకు mark_str యొక్క datatype అనేది ఒక స్ట్రింగ్ అని చెప్తుంది. |
06:17 | type పరన్తసిస్ ల లోపల mark అని టైప్ చేయండి. ఇది mark అనేది ఒక float datatype అని చూపిస్తుంది. |
06:26 | స్ట్రింగ్, float గా మార్చబడిందని మనం చూడవచ్చు. ఇప్పుడు మనం వాటిపై mathematical operations(గణిత కార్యకలాపాలను) చేయవచ్చు. |
06:34 | వీడియోను పాజ్ చేయండి. క్రింది అభ్యాసాన్నిప్రయత్నించి వీడియోను పునఃప్రారంభించండి. |
06:40 | ఒకవేళ మీరు terminal లో int పరన్తసిస్ ల లోపల డబుల్ కోట్స్ లోపల 1.25 అని టైప్ చేస్తే ఏమి జరుగుతుంది? |
06:48 | పరిష్కారం కొరకు terminal కు మారండి. |
06:52 | int పరన్తసిస్ ల లోపల డబుల్ కోట్స్ లోపల 1.25 అని టైప్ చేయండి. |
06:59 | మనం ఒక ValueError ను చూడవచ్చు. మనం ఒక స్ట్రింగ్ ను integer కు నేరుగా మార్చలేము. |
07:06 | మనం దీనికి సరైన పరిష్కారం చూద్దాం. dcml underscore str is equal to డబుల్ కోట్స్ లోపల 1.25 అని టైప్ చేయండి. |
07:18 | flt is equal to float పరన్తసిస్ ల లోపల dcml underscore str అని టైప్ చేయండి. |
07:27 | ఇక్కడ మనం స్ట్రింగ్ ను float కు మారుస్తున్నాము, ఎందుకంటే మనం దానిని నేరుగా integer లోనికి మార్చలేము కనుక. |
07:34 | flt అని టైప్ చేయండి. |
07:37 | number is equal to int పరన్తసిస్ ల లోపల flt అని టైప్ చేయండి. ఇప్పుడు మనం float ను integer లోనికి మారుస్తున్నాము. |
07:48 | number అని టైప్ చేయండి. మనం అవుట్పుట్ ను integer గా పొందుతాము. |
07:54 | ఈ విధంగా మనం strings ను floats మరియు integers లోనికి మార్చాలి. |
07:59 | తరువాత, మనం data ను పార్స్ చేయడానికి డేటా ఫైల్ ను ఉపయోగిస్తాము. |
08:04 | నన్ను టెక్స్ట్ ఎడిటర్ లో student underscore record.txt ఫైల్ ను తెరవనివ్వండి. |
08:10 | student underscore record.txt ఫైల్ ఈ ట్యుటోరియల్ యొక్క Code files లింక్ లో అందుబాటులో ఉంది.
దయచేసి దానిని మీ Home directory లో డౌన్లోడ్ చేసి ఉపయోగించండి. |
08:22 | మొదట మనం ఈ ఫైల్ ను లైన్ తర్వాత లైన్ లా చదువుతాము ఇంకా ఈ ఫైల్ లోని ప్రతి రికార్డ్ ను పార్స్ చేస్తాము. |
08:28 | ఇది State Secondary Board Examination లో విద్యార్థుల యొక్క రికార్డ్స్ ను మరియు వారియొక్క మార్కులను కలిగిఉంటుంది. |
08:35 | ఇందులో 1 లక్ష 80 వేల లైన్ లు కలిగి ఉన్న రికార్డు ఉంది. మనము దీన్ని చదివి ఈ డేటాను ప్రాసెస్ చేయబోతున్నాం. |
08:43 | ఈ ఫైల్ లోని ప్రతి లైన్ semicolons చేత వేరుపరచబడిన fields యొక్క ఒక జత. |
08:49 | ఈ ఫైల్ నుండి ఒక నమూనా రికార్డును పరిగణించండి. |
08:53 | ఈ క్రిందివి ఇచ్చిన ఏదైనా లైన్లోని fields.
రీజియన్ కోడ్ రోల్ నంబర్ పేరు 5 సబ్జెక్టుల మార్కులు మొత్తం మార్కులు |
09:08 | క్రొత్త టెక్స్ట్ ఎడిటర్ను తెరవండి. చూపిన విధంగా కోడ్ను టైప్ చేయండి. |
09:14 | ఈ ప్రోగ్రాం ను నన్ను వివరించనివ్వండి. |
09:17 | మునుపటి ట్యుటోరియల్లో మనం for loop ను నేర్చుకున్నాము.
for loop విద్యార్థి రికార్డ్ ను ప్రాసెస్ చేసి ప్రతి రికార్డ్ యొక్క ఫీల్డ్స్ ను చీల్చుతుంది |
09:28 | గణిత మార్కులు తరువాత float కు మార్చబడతాయి. |
09:32 | అప్పుడు అది చేర్చబడుతుంది మరియు రీజియన్ కోడ్ A కొరకు ఒక వేరియబుల్ లో ఒక లిస్ట్ math underscore marks underscore A గా భద్రపరచబడుతుంది. |
09:41 | ఫైల్ను హోమ్ డైరెక్టరీ లో marks.py గా సేవ్ చేయండి. |
09:48 | terminal కు మారండి. |
09:51 | percentage sign run space marks.py తో ఫైల్ ను అమలుచేయండి |
09:58 | ఎడిటర్కు తిరిగి మారండి. ఇప్పుడు మనం region A కొరకు అన్ని గణితం మార్కులను math underscore marks underscore A అనే లిస్ట్ లో కలిగిఉన్నాము. |
10:09 | region A కొరకు గణితం మార్కుల సగటును(mean) లెక్కించడానికి క్రింది లైన్స్ ను జోడించండి. |
10:15 | దీని కొరకు, మనం గణిత మార్కులను సంకలనం చేసి పొడవుతో భాగించాలి. |
10:21 | region A లోని విద్యార్థుల యొక్క సంఖ్య పొడవును ఇస్తుందని గమనించండి. |
10:26 | మనం ఫైల్ ను సేవ్ చేద్దాం. |
10:29 | terminal కు మారండి. |
10:32 | ఫైల్ ను percentage sign run space marks.py తో మళ్ళీ అమలుచేయండి. |
10:40 | అందువల్ల మనం మన చివరి అవుట్పుట్ ను పొందుతాము. |
10:43 | ఇక్కడ region A కొరకు సగటు విలువ అనేది సుమారుగా 1 లక్ష 80 వేల రికార్డులు కోసం లెక్కించబడుతుంది. |
10:51 | ఈ విధంగా మనం ఒక భారీ డేటాను విభజించి, చదివి దానిపై గణనలను చేస్తాము. |
10:57 | ఇది మనల్ని ఈ ట్యుటోరియల్ యొక్క చివరకు తీసుకువస్తుంది. |
11:01 | ఈ ట్యుటోరియల్ లో మనం నేర్చుకున్నవి,
ఒక string ను Tokenize చేయడం delimiters చేత వేరుపరచబడిన ఒక స్ట్రింగ్ ను split() ఫంక్షన్ ను ఉపయోగించి చీల్చడం. |
11:11 | strip() function ను ఉపయోగించి whitespaces ను తొలగించడం.
సంఖ్యల యొక్క datatypes ను ఒక రకం నుండి మరొక రకానికి మార్చడం. ఇన్పుట్ డేటాను Parse చేసి దానిపై గణనలను చేయడం. |
11:25 | ఇక్కడ మీరు పరిష్కరించడానికి కొన్ని స్వీయ అంచనా ప్రశ్నలు.
1. పదాలను పొందడానికి మీరు Guido; Rossum;Python అనే స్ట్రింగ్ను ఎలా చీల్చుతారు? |
11:36 | 2. int పరాంథసిస్ ల లోపల డబుల్ కోట్స్ లోపల 20.0 ఏమి ఉత్పత్తి చేస్తుంది? |
11:43 | మరియు సమాధానాలు,
1. line.split పరాంథసిస్ ల లోపల సింగిల్ కోట్స్ లోపల కామా 2. int పరాంథసిస్ ల లోపల డబుల్ కోట్స్ లోపల 20.0 అనేది ఒక ఎర్రర్ ను ఇస్తుంది, ఎందుకంటే స్ట్రింగ్ ను నేరుగా integer లోనికి మార్చడం సాధ్యం కాదు కనుక. |
12:03 | దయచేసి మీ సమయంతో కూడిన సందేహాలను ఈ ఫోరమ్ లో పోస్ట్ చేయండి. |
12:07 | దయచేసి మీ సాధారణ ప్రశ్నలను ఈ Python ఫోరంపై పోస్ట్ చేయండి. |
12:12 | FOSSEE టీం TBC ప్రాజెక్ట్ ను సమన్వయం చేస్తుంది. |
12:16 | స్పోకన్ ట్యుటోరియల్ ప్రాజెక్ట్ NMEICT, MHRD, గవర్నమెంట్ అఫ్ ఇండియా చే నిధులు పొందుతుంది. మరిన్ని వివరాల కొరకు, ఈ వెబ్సైటు ను సందర్శించండి. |
12:27 | నేను ఉదయలక్ష్మి మీ వద్ద శలవు తీసుకుంటున్నాను. మాతో చేరినందుకు ధన్యవాదములు. |