இது கூகுளால் மட்டும் எப்படி சாத்தியமாகிறது என்பது ஆச்சரியப்படக்கூடிய விஷயம்தான்.
காரணம் இதற்கு முன்பிருந்தே இணையத் தேடல் வசதியைத் தந்து கொண்டிருக்கும் யாகூ, அல்ட்ராவிஸ்டா போன்ற தேடல் தளங்களால் தர முடியாத தகவல்களைக் கூட, அதுவும் நமக்கு எது தேவையோ அதனை சரியாக அடையாளம் கண்டு தரும் தன்மை கூகுளிடம் மட்டும் இருப்பதுதான்.
தொழில்நுட்ப உலகில் 15 ஆண்டுகள் கடந்தும் ஒரு தேடல் தளம் மக்களின் நம்பகத் தன்மையுடன் இருப்பது கூகுள் மட்டுமே.
பிங், யாகூ போன்ற எத்தனையோ தளங்கள் தங்களை மேம்படுத்திக் கொண்டிருந்தாலும் அவற்றை விட கூடுதலான தகவல்களை வேகமாகத் தருவதில் இன்றும் முதலிடம் கூகுளுக்குத்தான்.
கூகுளின் ஜிமெயில் கணக்குக்கு செல்வதாகட்டும், ஃபேஸ்புக் கணக்கில் நுழைவதாக இருந்தாலும், ரயில் டிக்கெட் பதிவு செய்ய IRCTC இணையதளம் செல்வதாக இருந்தாலும் நேரடியாக அட்ரஸ் பாரில் முகவரியைக் கொடுத்து நேரடியாக நுழையாமல், கூகுள் தேடலில் பெயரைக் கொடுத்து, சர்ச் செய்து, லிங்க் பெற்று அந்தத் தளங்களில் நுழைவதுதான் இன்று பெருவாரியான மக்களின் செயல்பாடாக மாறியிருக்கிறது.
இது எப்படி கூகுளால் மட்டும் சாத்தியமாகியது என்று பார்த்தால், அதற்குப் பின் உள்ள தொழில்நுட்பம் இணைய வலைப்பின்னலைப் போன்றே மிகச் சிக்கலான கட்டமைப்பில் உருவாக்கப்பட்டதாக இருக்கிறது.
இதன் முழுவிபரமும் இரகசியமானதாக வைக்கப்பட்டிருந்தாலும், அதில் ஓரளவு தகவல்கள் மட்டும் கண்டுபிடித்து பல்வேறு இணையதளங்கள் வெளியிட்டுள்ளன.
அவற்றைத் தொகுத்து இங்கு தருகிறோம்.தகவல்களைத் தேட கூகுள் பாட் என்ற ஒற்றன் வகை மென்பொருள் ஒன்றை பயன்படுத்தி இணையதளத் தகவல்களை திரட்டி தன்னுடைய சர்வரில் அவற்றை வரிசைப்படுத்தி சேகரித்து வைத்துக் கொள்கிறது.
ஒரு இணையதளத்தில் நுழைந்து தகவல்களைத் திரட்டியபின் அது சார்ந்த இணையதளங்களுக்கு சென்றும் தேடும் வகையில் இது உருவாக்கப்பட்டிருக்கிறது.
தேடுபவர்கள் குறிப்பிடும் வார்த்தைகளை மட்டும் தேடாமல் அதன் பொருள், அந்தக் குறிப்பிட்ட வார்த்தை சரியான வார்த்தையா, அந்த வார்த்தைக்குத் தொடர்பான மற்ற வார்த்தைகள் என்று ஒரு டிக்ஷனரியைப் படித்து தேடுவதுபோல விபரங்களைத் தேடும் வகையில் அமைக்கப்பட்டுள்ளது.
பயனர் ஒருவர் தேடிய விபரங்களை மூன்று மாதங்கள் வரை அவர் கணக்கில் கூகுள் சேமித்து வைத்திருப்பதாகவும் கூறப்படுகிறது.
இந்த அளவு முன்பு 11 மாதங்களாக இருந்தது. பிரைவஸி பாதிப்பதாக வந்த புகார்களால் இந்தக் கால அளவு தற்போது குறைக்கப்பட்டுள்ளது.
இந்த விபரங்களை சேகரித்து வைப்பதை அனைத்து தேடல் நிறுவனங்களுமே மேற்கொள்கின்றன.
ஆனால், பயனர் இதனை விரும்பமாட்டார்கள் என்பதாலும், அடுத்த முறை தங்களது சேவையைப் பயன்படுத்தமாட்டார்கள் என்பதாலும் இணையதளங்கள் இதுகுறித்த உண்மை விபரங்களை வெளியிடாமல் மறைக்கின்றன.
குறிப்பிட்ட வார்த்தையை அதிகம் பேர் தேடுகிறார்கள் என்றாலும், தேடல் முடிவுகளில் அதிகம் பேர் எந்த முடிவை கிளிக் செய்து பார்க்கிறார்கள் என்பதையும் கூகுள் பதிவு செய்து கொள்கிறது.
அடுத்து வரும் பயனர்கள் அந்தக் குறிப்பிட்ட வார்த்தையைக் கொண்டு தேடும்போது முந்தைய பயனர்கள் பார்த்த இணையதளத் தகவல்கள் முதலாவதாக வரும்படி மாற்றியமைக்கப்படுகின்றன.
இதனை பேஜ் ரேங்க் என்று குறிப்பிடுகின்றனர்.
கூகுள் தேடல் தளம் ஒவ்வொரு நாட்டிற்கும் தனித்தனி வசதிகளை உள்ளடக்கியுள்ளது.
இதற்கு தேடுபவரின் இணைய ஐபி எண்ணைக் கொண்டு அவர் தற்போதுள்ள பகுதி எது என்பதை அறிந்து அப்பகுதி சார்ந்த இணையதளங்களுக்கு முக்கியத்துவம் தருகிறது.
சென்னையிலிருந்து தேடுபவர்களுக்கு சென்னையைச் சுற்றியுள்ள பகுதிகளைச் சார்ந்த இணையதளங்களையும், மதுரை, திருச்சி, கோவை பகுதிகளைச் சார்ந்தவர்களுக்கு அவர்கள் வசிக்கும் பகுதியைச் சார்ந்த தளங்களும் முதலிடத்தில் வரும்படி காட்டப்படும்.
அடுத்ததாக, கால முறைத் தேடல். இது இணையப் பக்கம் கடைசியாக மேம்படுத்தப்பட்டபோது கொடுக்கப்பட்ட தகவல்களை முன்னிலைப்படுத்தும். அடுத்து தேடுபவரின் தேவையை அறிவது.
குறிப்பிட்ட ஐபி முகவரியிலிருந்து தேடப்பட்ட விபரங்கள் மற்றும் தேடுபவர் கூகுள் கணக்கை பயன்படுத்தி நுழைந்திருந்தால் அவர் இதற்கு முன்பு தேடிய விபரங்கள் ஆகியவற்றை ஆராய்ந்து முடிவுகள் காட்டப்படும்.
இம்முடிவுகளைக் காட்டுவதற்கு அது எடுத்துக் கொள்ளும் நேரம் ஒரு சில விநாடிகள்தான்.
இந்த விபரங்கள் அனைத்தும் கூகுளின் மிகப்பெரிய கணினித் தொகுப்பால் நிர்வகிக்கப்படுகின்றன.
இதற்கு சக்திவாய்ந்த 10 கோடி கிகா பைட் அளவிலான (95 பீட்டா பைட்ஸ்) தகவல் தொகுப்பு பயன்படுத்தப்படுகிறது.
வர்த்தக நோக்குடன் பயன்படுத்துபவர்களுக்கும், தகவல்கள், செய்திகளை வழங்கும் இணையதளங்களுக்கும் கூகுள் தேடலில் முன்னிலை வகிக்க தகுந்த குறிச்சொற்கள் மற்றும் தொழில்நுட்பத்தை தம்முடைய இணையதளங்களில் பயன்படுத்தவேண்டும்.
சிலர் தங்களுடைய தளம் கூகுள் தேடலில் வருவதை விரும்பவில்லை என்றால் அதனை தடை செய்து கொள்ளும் வசதியை இணைய வடிவமைப்பாளர்கள் மூலமாக செய்து கொள்ளலாம்.
How Google Works
If you
aren’t interested in learning how Google creates the index and the
database of documents that it accesses when processing a query, skip
this description. I adapted the following overview from Chris Sherman
and Gary Price’s wonderful description of How Search Engines Work in
Chapter 2 of The Invisible Web (CyberAge Books, 2001).
Google runs on a distributed network of
thousands of low-cost computers and can therefore carry out fast
parallel processing. Parallel processing is a method of computation in
which many calculations can be performed simultaneously, significantly
speeding up data processing. Google has three distinct parts:
- Googlebot, a web crawler that finds and fetches web pages.
- The indexer that sorts every word on every page and stores the resulting index of words in a huge database.
- The query processor, which compares your search query to the index and recommends the documents that it considers most relevant.
கருத்துரையிடுக Facebook Disqus