Tuesday 14 January 2014

సెర్చ్ ఇంజన్లు ఎలా సమాచారాన్ని సేకరిస్తాయి ?

ఇంటర్నెట్ విస్తృతి పెరిగేకొద్దీ సెర్చ్ ఇంజన్లపై ఆధారపడడం ఎక్కువవుతుంది. సెర్చ్ ఇంజన్ మనకు రిజల్ట్ ఇవ్వాలంటే ముందు అవి ఆయాపేజీలను ఇప్పటికే గుర్తించి  ఉండాలి కదా. . ఇన్ని వేల పేజీల పలితాలను ఇస్తున్న సెర్చ్ ఇంజిన్ తాను అన్ని కోట్ల పేజీలను ఎలా దాచుకోగలుగుతుంది ? ప్రజీ ఇంటర్నెట్ సెర్చ్ ఇంజిన్ రోబోట్స్ ( robots ) అని పిలువబడే ప్రత్యెక సాఫ్ట్వేర్ ఉపయొగిస్తాయి. వీటినే spiders అంటారు. spider  అంటే సాలెపురుగు . web ( సాలెగూడు ) ను అల్లుకుపోతుంది ఇది. వెబ్ లో ప్రతీమూలా వెతుకుతూ keywords ను తయారు చేయడమో, లేక ఇప్పటికే అది తయారు చేసిన వాటికి క్రొత్త విషయాల్ని జొదించడమో  చెస్తాయి. దీన్ని వెబ్ క్రౌలింగ్ అంటారు . ఈ spiders  ముందుగా ఎక్కువగా ఉపయోగించే సర్వర్లను , ముఖ్యమైన పేజీలతో తమ ప్రయాణాన్ని మొదలెడతాయి. ఈ ప్రయాణంలో తారసపడే ప్రతీ క్రొత్త పదాన్నీ , క్రోత్త  లింక్ నూ  తనలో దాచుకుంటుంది . అసలు ఈ spiders వెబ్ పేజిలను ఎలా చదువుతాయి? వాటికి అన్ని బాషలు వచ్చా ? వచ్చే పాఠం లో ...

0 comments:

Post a Comment