செவ்வாய், 11 பிப்ரவரி, 2014

கூகுளில் இது தெரியுமா உங்களுக்கு?

இன்றைக்கு கம்பியூட்டரை ஆன் செய்தவுடன் நாம் செல்லும் முதல் தளம் கூகுள் தான், அந்த அளவுக்கு இன்று கூகுள் மிகப் பெரிய உயரத்தில் இருக்கின்றது எனலாம்.

இணையம் சார்ந்து இயங்கும் எந்த நிறுவனமும், தனி நபர்களும், கூகுள் வழி மேற்கொள்ளப்படும் தேடல் முடிவுகளையே தங்கள் கணிப்பின் அடிப்படையாக ஏற்றுக் கொள்கின்றனர். இது எப்படி நிகழ்கிறது? என்ற கேள்வியும் அனைவரின் மனதிலும் ஏற்படுகிறது. இதற்கான விடையை இங்கு காண்போம்.



முதலில் கூகுள் தோன்றிய நிலையைக் காணலாம். விக்கிப்பீடியா தளம் தரும் தகவல்களின் படி, கூகுள் சர்ச் என்னும் பிரிவு, 1997ல் தொடங்கப்பட்டது. இதனைத் தொடங்கியவர்கள் லாரி பேஜ் மற்றும் செர்ஜி பிரின்.

இன்றைய நிலையில், நாளொன்றுக்கு இந்த தேடல் தளம் வழியாக 300 கோடிக்கும் மேற்பட்ட தேடல்கள் மேற்கொள்ளப்படுகின்றன. இந்த தேடலுக்கான முடிவுகள், 60 ட்ரியல்லனுக்கு (10 லட்சத்து 10 லட்சம் - 1,000,000,000,000) மேலான இணையப் பக்கங்களைத் தேடித் தரப்படுகிறது.

இவற்றைத் தேட ஒரு அட்டவணைக் குறிப்பு பயன்படுத்தப்படுகிறது. இதன் அளவு 95 பீட்டா பைட்ஸ். (ஒரு பீட்டா பைட் என்பது 1000000000000000 பைட்ஸ். கிகா பைட், டெரா பைட் அடுத்து பீட்டா பைட்)அதாவது ஏறத்தாழ 10 கோடி கிகா பைட்ஸ்.

தேடல் பணியினை மேற்கொள்ள தான் "Google bot" என்னும் நவீன சாப்ட்வேர் புரோகிராம் ஒன்றை இயக்குவதாக கூகுள் கூறுகிறது. இந்த புரோகிராம் பல்லாயிரக்கணக்கான கம்ப்யூட்டர்களில் இயக்கப்பட்டு, பல இணைய தளங்களைத் தேடிச் செல்கிறது.

தான் இறுதியாகத் தேடிப் பார்த்த தளத்திலிருந்து, அடுத்த புதிய இணைய தளங்களுக்கு இந்த புரோகிராமின் தேடல்கள் செல்கின்றன. தான் எந்த இணைய தள உரிமையாளர்களிடமும், அவர்கள் தளங்களை அடிக்கடிப் பார்ப்பதற்கென பணம் வாங்கவில்லை என்று கூகுள் அறிவித்துள்ளது. ஆனால், இணைய தள உரிமையாளர்கள் நினைத்தால், தங்கள் தளங்களை கூகுள் தேடல் தீண்டாமல் இருக்கும்படி வைத்துக் கொள்ளலாம்.

மேலே சொன்னபடி, அனைத்து தளங்களையும் பார்த்த பின்னர், அதில் கிடைத்த தகவல்கள் வகைப்படுத்தப்பட வேண்டும். இந்த தகவல்களே, 95 பீட்டா பைட்ஸ் அளவிலான வரிசைக் குறிப்பாக அமைக்கப்பட்டுள்ளது. இருப்பினும், சில இணைய தளங்களை கூகுள் பாட் தேடல் புரோகிராமினால் பார்க்கப்பட முடியாமலும் போகலாம்.

ஒரு கூகுள் தேடலானது, இந்த வரிசைக் குறிப்பினை மட்டும் பார்த்து தன் தேவைக்கேற்ப தகவல்களை எடுப்பதில்லை. அதற்கு அதிகமான நேரம் ஆகும். அது மட்டுமின்றி, தேவையற்ற குப்பைகளும் சில சமயம் தேடல் முடிவுகளாகக் கிடைக்கும். எனவே, தேடலுக்கு அதிகத் தொடர்புள்ளவற்றை மட்டும் கண்டறிய சில சிறப்பு தேடல் வழிகள் பயன்படுத்தப்படுகின்றன.

இந்த வழிகள் மற்றவர்கள் அறியாத வகையில் இரகசியமாக உள்ளன. மேலும், தேடலில் கிடைக்கும் தகவல்கள் பலவும் இரகசியமாக வைக்கப்படுகின்றன. ஏனென்றால், இதன் வழியாக கூகுள் தேடல் சாதனமே கைப்பற்றப்படலாம்.

இருப்பினும் சில தேடல் வழிகளை நாம் அறிய முடிகிறது. இணைய தள டேட்டாவின் வகை (தேடல் சொற்களுக்கு எந்த அளவில் தொடர்புடையது என்ற அடிப்படையில்) அடுத்து டேட்டாவின் தன்மை. இதற்கு சொல் எழுத்து சோதனை மேற்கொள்ளப்படுகிறது.

இதன் மூலம் உண்மையிலேயே நல்ல தகவல்களைக் கொண்டுள்ள இணையப் பக்கங்களிலிருந்து, அர்த்தமற்ற தளங்கள் இனம் காணப்பட்டு பிரிக்கப் படுகின்றன. இணையத் தளங்கள் தரும் டேட்டாவின் அண்மைத் தன்மை.

அடுத்ததாக, இணைய தளத்தின் நம்பகத் தன்மை. உண்மையிலேயே தளம் சொல் லும் தகவல் சார்ந்ததா? இல்லை, போலியான மால்வேர் கொண்டுள்ள தளமா எனக் கண்டறிதல். அடுத்ததாக, இணைய தளத்தின் பெயர் மற்றும் முகவரி சரி பார்த்து அறிதல்.

இதனைத் தொடர்ந்து சொற்கள், அவற்றின் இணைச் சொற்களைப் பிரித்து அறிதல் மேற்கொள்ளப்படு. இதன் பின்னர், குறிப்பிட்ட இணைய தளத்தை எத்தனை லிங்க்குகள் சுட்டிக் காட்டுகின்றன மற்றும் அவற்றின் நம்பகத்தன்மை குறித்து ஆய்வு செய்யப்படுகிறது.

இறுதியாகச் சொல்லப்பட்ட நம்பகத் தன்மை "PageRank." என்று சொல்லப்படும் தன்மையின் அடிப்படையில் செயல்படுத்தப்படுகிறது. ஓர் இணையப் பக்கத்தின் தர வரிசை அதற்கான லிங்க் எப்படிப்பட்ட மூலத்திலிருந்து வருகிறது என்பதை அறிவதில் உள்ளது.

இதன் அடிப்படையில், ஒரு தளம் தேடல் பட்டியல் முடிவுகள் அறிவிக்கும் பட்டியலில் முதலில் இடம் பிடிக்கும். இதிலும் அதன் தன்மை கண்டறியப்படுகிறது. ஒரு தளத்திற்கு அதிகமான எண்ணிக்கையில், ஆனால், தரம் குறைந்த தொடர்புகளின் அடிப்படையில் தொடர்பு இருக்கலாம்.

இன்னொரு தளத்திற்கு நல்ல தரமான தொடர்புகள் சுட்டிக் காட்டும் தன்மை இருக்கலாம். அப்போது இரண்டாவதாகச் சொல்லப்பட்டதே, "PageRank" மதிப்பெண் அதிகம் பெற்று, தேடல் முடிவுகளில் முதல் பக்கத்தில் இடம் பெறும்.
Share |
Image Hosted by ImageShack.us

கருத்துகள் இல்லை:

கருத்துரையிடுக

About This Blog

BBC News | South Asia | World Edition

  © Blogger templates The Professional Template by Ourblogtemplates.com 2008

Back to TOP  

^ மேலே செல்ல