செவ்வாய், 11 பிப்ரவரி, 2014

கூகுளில் இது தெரியுமா உங்களுக்கு?

இன்றைக்கு கம்பியூட்டரை ஆன் செய்தவுடன் நாம் செல்லும் முதல் தளம் கூகுள் தான், அந்த அளவுக்கு இன்று கூகுள் மிகப் பெரிய உயரத்தில் இருக்கின்றது எனலாம்.

இணையம் சார்ந்து இயங்கும் எந்த நிறுவனமும், தனி நபர்களும், கூகுள் வழி மேற்கொள்ளப்படும் தேடல் முடிவுகளையே தங்கள் கணிப்பின் அடிப்படையாக ஏற்றுக் கொள்கின்றனர். இது எப்படி நிகழ்கிறது? என்ற கேள்வியும் அனைவரின் மனதிலும் ஏற்படுகிறது. இதற்கான விடையை இங்கு காண்போம்.



முதலில் கூகுள் தோன்றிய நிலையைக் காணலாம். விக்கிப்பீடியா தளம் தரும் தகவல்களின் படி, கூகுள் சர்ச் என்னும் பிரிவு, 1997ல் தொடங்கப்பட்டது. இதனைத் தொடங்கியவர்கள் லாரி பேஜ் மற்றும் செர்ஜி பிரின்.

இன்றைய நிலையில், நாளொன்றுக்கு இந்த தேடல் தளம் வழியாக 300 கோடிக்கும் மேற்பட்ட தேடல்கள் மேற்கொள்ளப்படுகின்றன. இந்த தேடலுக்கான முடிவுகள், 60 ட்ரியல்லனுக்கு (10 லட்சத்து 10 லட்சம் - 1,000,000,000,000) மேலான இணையப் பக்கங்களைத் தேடித் தரப்படுகிறது.

இவற்றைத் தேட ஒரு அட்டவணைக் குறிப்பு பயன்படுத்தப்படுகிறது. இதன் அளவு 95 பீட்டா பைட்ஸ். (ஒரு பீட்டா பைட் என்பது 1000000000000000 பைட்ஸ். கிகா பைட், டெரா பைட் அடுத்து பீட்டா பைட்)அதாவது ஏறத்தாழ 10 கோடி கிகா பைட்ஸ்.

தேடல் பணியினை மேற்கொள்ள தான் "Google bot" என்னும் நவீன சாப்ட்வேர் புரோகிராம் ஒன்றை இயக்குவதாக கூகுள் கூறுகிறது. இந்த புரோகிராம் பல்லாயிரக்கணக்கான கம்ப்யூட்டர்களில் இயக்கப்பட்டு, பல இணைய தளங்களைத் தேடிச் செல்கிறது.

தான் இறுதியாகத் தேடிப் பார்த்த தளத்திலிருந்து, அடுத்த புதிய இணைய தளங்களுக்கு இந்த புரோகிராமின் தேடல்கள் செல்கின்றன. தான் எந்த இணைய தள உரிமையாளர்களிடமும், அவர்கள் தளங்களை அடிக்கடிப் பார்ப்பதற்கென பணம் வாங்கவில்லை என்று கூகுள் அறிவித்துள்ளது. ஆனால், இணைய தள உரிமையாளர்கள் நினைத்தால், தங்கள் தளங்களை கூகுள் தேடல் தீண்டாமல் இருக்கும்படி வைத்துக் கொள்ளலாம்.

மேலே சொன்னபடி, அனைத்து தளங்களையும் பார்த்த பின்னர், அதில் கிடைத்த தகவல்கள் வகைப்படுத்தப்பட வேண்டும். இந்த தகவல்களே, 95 பீட்டா பைட்ஸ் அளவிலான வரிசைக் குறிப்பாக அமைக்கப்பட்டுள்ளது. இருப்பினும், சில இணைய தளங்களை கூகுள் பாட் தேடல் புரோகிராமினால் பார்க்கப்பட முடியாமலும் போகலாம்.

ஒரு கூகுள் தேடலானது, இந்த வரிசைக் குறிப்பினை மட்டும் பார்த்து தன் தேவைக்கேற்ப தகவல்களை எடுப்பதில்லை. அதற்கு அதிகமான நேரம் ஆகும். அது மட்டுமின்றி, தேவையற்ற குப்பைகளும் சில சமயம் தேடல் முடிவுகளாகக் கிடைக்கும். எனவே, தேடலுக்கு அதிகத் தொடர்புள்ளவற்றை மட்டும் கண்டறிய சில சிறப்பு தேடல் வழிகள் பயன்படுத்தப்படுகின்றன.

இந்த வழிகள் மற்றவர்கள் அறியாத வகையில் இரகசியமாக உள்ளன. மேலும், தேடலில் கிடைக்கும் தகவல்கள் பலவும் இரகசியமாக வைக்கப்படுகின்றன. ஏனென்றால், இதன் வழியாக கூகுள் தேடல் சாதனமே கைப்பற்றப்படலாம்.

இருப்பினும் சில தேடல் வழிகளை நாம் அறிய முடிகிறது. இணைய தள டேட்டாவின் வகை (தேடல் சொற்களுக்கு எந்த அளவில் தொடர்புடையது என்ற அடிப்படையில்) அடுத்து டேட்டாவின் தன்மை. இதற்கு சொல் எழுத்து சோதனை மேற்கொள்ளப்படுகிறது.

இதன் மூலம் உண்மையிலேயே நல்ல தகவல்களைக் கொண்டுள்ள இணையப் பக்கங்களிலிருந்து, அர்த்தமற்ற தளங்கள் இனம் காணப்பட்டு பிரிக்கப் படுகின்றன. இணையத் தளங்கள் தரும் டேட்டாவின் அண்மைத் தன்மை.

அடுத்ததாக, இணைய தளத்தின் நம்பகத் தன்மை. உண்மையிலேயே தளம் சொல் லும் தகவல் சார்ந்ததா? இல்லை, போலியான மால்வேர் கொண்டுள்ள தளமா எனக் கண்டறிதல். அடுத்ததாக, இணைய தளத்தின் பெயர் மற்றும் முகவரி சரி பார்த்து அறிதல்.

இதனைத் தொடர்ந்து சொற்கள், அவற்றின் இணைச் சொற்களைப் பிரித்து அறிதல் மேற்கொள்ளப்படு. இதன் பின்னர், குறிப்பிட்ட இணைய தளத்தை எத்தனை லிங்க்குகள் சுட்டிக் காட்டுகின்றன மற்றும் அவற்றின் நம்பகத்தன்மை குறித்து ஆய்வு செய்யப்படுகிறது.

இறுதியாகச் சொல்லப்பட்ட நம்பகத் தன்மை "PageRank." என்று சொல்லப்படும் தன்மையின் அடிப்படையில் செயல்படுத்தப்படுகிறது. ஓர் இணையப் பக்கத்தின் தர வரிசை அதற்கான லிங்க் எப்படிப்பட்ட மூலத்திலிருந்து வருகிறது என்பதை அறிவதில் உள்ளது.

இதன் அடிப்படையில், ஒரு தளம் தேடல் பட்டியல் முடிவுகள் அறிவிக்கும் பட்டியலில் முதலில் இடம் பிடிக்கும். இதிலும் அதன் தன்மை கண்டறியப்படுகிறது. ஒரு தளத்திற்கு அதிகமான எண்ணிக்கையில், ஆனால், தரம் குறைந்த தொடர்புகளின் அடிப்படையில் தொடர்பு இருக்கலாம்.

இன்னொரு தளத்திற்கு நல்ல தரமான தொடர்புகள் சுட்டிக் காட்டும் தன்மை இருக்கலாம். அப்போது இரண்டாவதாகச் சொல்லப்பட்டதே, "PageRank" மதிப்பெண் அதிகம் பெற்று, தேடல் முடிவுகளில் முதல் பக்கத்தில் இடம் பெறும்.
Share |
Image Hosted by ImageShack.us

கருத்துகள் இல்லை:

கருத்துரையிடுக

Related Posts with Thumbnails
செய்தித் தளங்கள்
மீனகம் A A பதிவு A A ஈழ நேசன் A A ஈழம் சூன் A A ஈழ தேசம் A A ஈழம் வெப்சைட் A A நெருடல் A A வருடல் A A தாய்நிலம் A A தாளம் நியூஸ் A A அதிர்வு A A உயர்வு A A புலர்வு A A சரிதம் A A சங்கதி..2 A A சங்கதி..1 A A சங்கமம் A A ஈழம் வெப் (மாவீரர்) A A புதினப் பலகை A A புதினம் நியூஸ் A A யாழ் இணையம் A A ஈழம் ரைம்ஸ் A A இன்போ தமிழ் A A லங்காசிறி A A நாம் தமிழர் A A சிறுத்தைகள் A A பொங்கு தமிழ் A A ரூ தமிழ் இணையம் A A உலகத்தமிழ்ச் செய்தி A A உலகத் தமிழ் இணையம் A A செம்பருத்தி A A தமிழ்வின் A A தமிழ் அரசு A A தமிழ்த்தாய் A A தமிழ் உலகம் A A தமிழ் மீடியா A A தரவு இணையம் A A எதிரி இணையம் A A B.B.C தமிழ் செய்தி A A புதிய யாழ்ப்பாணம் A A கூகிள் தமிழ் செய்திகள் A A பாரிஸ் தமிழ்




புதினம்

புதினப்பலகை

தமிழ்வின்

Google செய்திகள் (இந்தியா)

Google செய்திகள் (உலகம்)

Google செய்திகள் (பொழுதுபோக்கு)

சினிமா எக்ஸ்பிரஸ்

About This Blog

BBC News | South Asia | World Edition

Sri Lanka News via iNFoPiG

Google செய்திகள் (இந்தியா)

Google செய்திகள் (இலங்கை)

Oneindia.in - thatsTamil

Google செய்திகள் (விளையாட்டு)

  © Blogger templates The Professional Template by Ourblogtemplates.com 2008

Back to TOP  

^ மேலே செல்ல