0


தகவல்களை விரைவாகத் தேடித்தருவதில் கூகுளின் வேகம் மற்றும் துல்லியம் பற்றி நீங்கள் அறிந்திருப்பீர்கள். 

இது கூகுளால் மட்டும் எப்படி சாத்தியமாகிறது என்பது ஆச்சரியப்படக்கூடிய விஷயம்தான்.

காரணம் இதற்கு முன்பிருந்தே இணையத் தேடல் வசதியைத் தந்து கொண்டிருக்கும் யாகூ, அல்ட்ராவிஸ்டா போன்ற தேடல் தளங்களால் தர முடியாத தகவல்களைக் கூட, அதுவும் நமக்கு எது தேவையோ அதனை சரியாக அடையாளம் கண்டு தரும் தன்மை கூகுளிடம் மட்டும் இருப்பதுதான்.

தொழில்நுட்ப உலகில் 15 ஆண்டுகள் கடந்தும் ஒரு தேடல் தளம் மக்களின் நம்பகத் தன்மையுடன் இருப்பது கூகுள் மட்டுமே. 

பிங், யாகூ போன்ற எத்தனையோ தளங்கள் தங்களை மேம்படுத்திக் கொண்டிருந்தாலும் அவற்றை விட கூடுதலான தகவல்களை வேகமாகத் தருவதில் இன்றும் முதலிடம் கூகுளுக்குத்தான்.

கூகுளின் ஜிமெயில் கணக்குக்கு செல்வதாகட்டும், ஃபேஸ்புக் கணக்கில் நுழைவதாக இருந்தாலும், ரயில் டிக்கெட் பதிவு செய்ய IRCTC இணையதளம் செல்வதாக இருந்தாலும் நேரடியாக அட்ரஸ் பாரில் முகவரியைக் கொடுத்து நேரடியாக நுழையாமல், கூகுள் தேடலில் பெயரைக் கொடுத்து, சர்ச் செய்து, லிங்க் பெற்று அந்தத் தளங்களில் நுழைவதுதான் இன்று பெருவாரியான மக்களின் செயல்பாடாக மாறியிருக்கிறது.

இது எப்படி கூகுளால் மட்டும் சாத்தியமாகியது என்று பார்த்தால், அதற்குப் பின் உள்ள தொழில்நுட்பம் இணைய வலைப்பின்னலைப் போன்றே மிகச் சிக்கலான கட்டமைப்பில் உருவாக்கப்பட்டதாக இருக்கிறது.

இதன் முழுவிபரமும் இரகசியமானதாக வைக்கப்பட்டிருந்தாலும், அதில் ஓரளவு தகவல்கள் மட்டும் கண்டுபிடித்து பல்வேறு இணையதளங்கள் வெளியிட்டுள்ளன. 

அவற்றைத் தொகுத்து இங்கு தருகிறோம்.தகவல்களைத் தேட கூகுள் பாட் என்ற ஒற்றன் வகை மென்பொருள் ஒன்றை பயன்படுத்தி இணையதளத் தகவல்களை திரட்டி தன்னுடைய சர்வரில் அவற்றை வரிசைப்படுத்தி சேகரித்து வைத்துக் கொள்கிறது.

ஒரு இணையதளத்தில் நுழைந்து தகவல்களைத் திரட்டியபின் அது சார்ந்த இணையதளங்களுக்கு சென்றும் தேடும் வகையில் இது உருவாக்கப்பட்டிருக்கிறது.

தேடுபவர்கள் குறிப்பிடும் வார்த்தைகளை மட்டும் தேடாமல் அதன் பொருள், அந்தக் குறிப்பிட்ட வார்த்தை சரியான வார்த்தையா, அந்த வார்த்தைக்குத் தொடர்பான மற்ற வார்த்தைகள் என்று ஒரு டிக்ஷனரியைப் படித்து தேடுவதுபோல விபரங்களைத் தேடும் வகையில் அமைக்கப்பட்டுள்ளது.

பயனர் ஒருவர் தேடிய விபரங்களை மூன்று மாதங்கள் வரை அவர் கணக்கில் கூகுள் சேமித்து வைத்திருப்பதாகவும் கூறப்படுகிறது. 

இந்த அளவு முன்பு 11 மாதங்களாக இருந்தது. பிரைவஸி பாதிப்பதாக வந்த புகார்களால் இந்தக் கால அளவு தற்போது குறைக்கப்பட்டுள்ளது. 

இந்த விபரங்களை சேகரித்து வைப்பதை அனைத்து தேடல் நிறுவனங்களுமே மேற்கொள்கின்றன. 

ஆனால், பயனர் இதனை விரும்பமாட்டார்கள் என்பதாலும், அடுத்த முறை தங்களது சேவையைப் பயன்படுத்தமாட்டார்கள் என்பதாலும் இணையதளங்கள் இதுகுறித்த உண்மை விபரங்களை வெளியிடாமல் மறைக்கின்றன.

குறிப்பிட்ட வார்த்தையை அதிகம் பேர் தேடுகிறார்கள் என்றாலும், தேடல் முடிவுகளில் அதிகம் பேர் எந்த முடிவை கிளிக் செய்து பார்க்கிறார்கள் என்பதையும் கூகுள் பதிவு செய்து கொள்கிறது. 

அடுத்து வரும் பயனர்கள் அந்தக் குறிப்பிட்ட வார்த்தையைக் கொண்டு தேடும்போது முந்தைய பயனர்கள் பார்த்த இணையதளத் தகவல்கள் முதலாவதாக வரும்படி மாற்றியமைக்கப்படுகின்றன. 

இதனை பேஜ் ரேங்க் என்று குறிப்பிடுகின்றனர்.

கூகுள் தேடல் தளம் ஒவ்வொரு நாட்டிற்கும் தனித்தனி வசதிகளை உள்ளடக்கியுள்ளது. 

இதற்கு தேடுபவரின் இணைய ஐபி எண்ணைக் கொண்டு அவர் தற்போதுள்ள பகுதி எது என்பதை அறிந்து அப்பகுதி சார்ந்த இணையதளங்களுக்கு முக்கியத்துவம் தருகிறது. 

சென்னையிலிருந்து தேடுபவர்களுக்கு சென்னையைச் சுற்றியுள்ள பகுதிகளைச் சார்ந்த இணையதளங்களையும், மதுரை, திருச்சி, கோவை பகுதிகளைச் சார்ந்தவர்களுக்கு அவர்கள் வசிக்கும் பகுதியைச் சார்ந்த தளங்களும் முதலிடத்தில் வரும்படி காட்டப்படும்.

அடுத்ததாக, கால முறைத் தேடல். இது இணையப் பக்கம் கடைசியாக மேம்படுத்தப்பட்டபோது கொடுக்கப்பட்ட தகவல்களை முன்னிலைப்படுத்தும். அடுத்து தேடுபவரின் தேவையை அறிவது. 

குறிப்பிட்ட ஐபி முகவரியிலிருந்து தேடப்பட்ட விபரங்கள் மற்றும் தேடுபவர் கூகுள் கணக்கை பயன்படுத்தி நுழைந்திருந்தால் அவர் இதற்கு முன்பு தேடிய விபரங்கள் ஆகியவற்றை ஆராய்ந்து முடிவுகள் காட்டப்படும்.

இம்முடிவுகளைக் காட்டுவதற்கு அது எடுத்துக் கொள்ளும் நேரம் ஒரு சில விநாடிகள்தான்.

இந்த விபரங்கள் அனைத்தும் கூகுளின் மிகப்பெரிய கணினித் தொகுப்பால் நிர்வகிக்கப்படுகின்றன. 

இதற்கு சக்திவாய்ந்த 10 கோடி கிகா பைட் அளவிலான (95 பீட்டா பைட்ஸ்) தகவல் தொகுப்பு பயன்படுத்தப்படுகிறது.

வர்த்தக நோக்குடன் பயன்படுத்துபவர்களுக்கும், தகவல்கள், செய்திகளை வழங்கும் இணையதளங்களுக்கும் கூகுள் தேடலில் முன்னிலை வகிக்க தகுந்த குறிச்சொற்கள் மற்றும் தொழில்நுட்பத்தை தம்முடைய இணையதளங்களில் பயன்படுத்தவேண்டும்.

சிலர் தங்களுடைய தளம் கூகுள் தேடலில் வருவதை விரும்பவில்லை என்றால் அதனை தடை செய்து கொள்ளும் வசதியை இணைய வடிவமைப்பாளர்கள் மூலமாக செய்து கொள்ளலாம்.






How Google Works

If you aren’t interested in learning how Google creates the index and the database of documents that it accesses when processing a query, skip this description. I adapted the following overview from Chris Sherman and Gary Price’s wonderful description of How Search Engines Work in Chapter 2 of The Invisible Web (CyberAge Books, 2001).

Google runs on a distributed network of thousands of low-cost computers and can therefore carry out fast parallel processing. Parallel processing is a method of computation in which many calculations can be performed simultaneously, significantly speeding up data processing. Google has three distinct parts:
  • Googlebot, a web crawler that finds and fetches web pages.
  • The indexer that sorts every word on every page and stores the resulting index of words in a huge database.
  • The query processor, which compares your search query to the index and recommends the documents that it considers most relevant.

கருத்துரையிடுக Disqus

 
Top