Latest topics
» மின் நூல்கள் தரவிறக்க.. (தொடர்)by வாகரைமைந்தன் Yesterday at 11:24 pm
» உலகச் செய்திகளில் விநோதம் (தொடர்)
by வாகரைமைந்தன் Tue Nov 19, 2024 9:43 pm
» வரலாற்றில் வினோதங்கள் (தொடர்)
by வாகரைமைந்தன் Mon Nov 18, 2024 4:53 pm
» கணினி-இணைய -செய்திகள்/தகவல்கள்
by வாகரைமைந்தன் Sun Nov 17, 2024 3:49 pm
» தினம் ஒரு தகவல் (தொடர்)
by வாகரைமைந்தன் Thu Nov 14, 2024 8:52 pm
» சினிமா
by வாகரைமைந்தன் Tue Nov 05, 2024 1:33 am
» How to earnings online?
by Tamil Mon Dec 11, 2023 8:15 pm
» ‘பிரிவு 370 நீக்கம் சரியே..!’ - உச்ச நீதிமன்றத் தீர்ப்பும், ஜம்மு காஷ்மீரின் எதிர்காலமும்!
by Tamil Mon Dec 11, 2023 6:52 pm
» மியூச்சுவல் ஃபண்ட் நிறுவனங்களுக்கு புதிய கட்டுப்பாடுகள்... விதிமுறைகள் என்ன சொல்கிறது?
by Tamil Mon Dec 11, 2023 6:49 pm
» ``கமல்ஹாசன், ஒரு சீட்டுக்காக திமுக-வுக்கு லாலி பாடுகிறார்!" - விளாசும் செல்லூர் ராஜூ
by Tamil Mon Dec 11, 2023 6:44 pm
» Bigg Boss 7 Day 70: `வன்மம்... வன்மம்... வன்மம்' அர்ச்சனா, விஷ்ணுவுக்கு கமல் நடத்திய பரேடு!
by Tamil Mon Dec 11, 2023 6:38 pm
» பாஸ்டர் வின்சென்ட் செல்வகுமார் புத்தகங்கள் வேண்டும்
by gnanaseharj Sun Oct 29, 2023 6:26 pm
» My open letter to Brother VincentSelvakumar and Sadhu Sundar Selvaraj of Jesus Ministries in India
by வாகரைமைந்தன் Sun Oct 22, 2023 3:15 pm
» பாஸ்டர் வின்சென்ட் செல்வகுமார் புத்தகங்கள் வேண்டும்
by gnanaseharj Sat Oct 21, 2023 8:31 pm
» புத்தகம் தேவை
by gnanaseharj Sun Sep 17, 2023 9:19 pm
» நாவல் தேவை
by jayaragh Sat Jun 10, 2023 9:58 pm
» ஆன்லைன் இணைய மோசடிகள் + பாதுகாப்பு முறைகள்
by வாகரைமைந்தன் Mon Oct 24, 2022 3:26 pm
» தினம் ஒரு திருக்குறள்- படிப்போம்
by வாகரைமைந்தன் Sun Sep 18, 2022 1:15 pm
» சிறுவர் கதைகள்
by வாகரைமைந்தன் Fri Aug 12, 2022 12:28 am
» கதை படிக்கலாம்-கதையும் படிக்கலாம் (தொடர்)
by வாகரைமைந்தன் Mon Aug 08, 2022 4:48 pm
» வல்லிபுரத்தினில் கண்ணன் தலத்தினில் மாயவனின் திருநடனம் வண்ணமயத்தினில் வண்ணநிலத்தினில் அகன்றிடுமே பெருஞ்சலன
by veelratna Fri Jul 22, 2022 11:14 am
» கண்முன்னே பரிதவிக்கும் பிள்ளையின் நிலை கண்டு துடிக்கும் பெற்ற மனம்
by veelratna Fri Jul 15, 2022 11:59 am
» இணையத்தில் தரவுகள்+பாதுகாப்பு (தொடர்)
by வாகரைமைந்தன் Tue May 03, 2022 3:16 pm
» ஆரம்ப - மேல் நிலை கணினி-இணையப் பாடம்
by வாகரைமைந்தன் Mon Jan 31, 2022 4:07 pm
» பாடல் என்ன தெரியுமா? கேள்வியும்-பதிலும் (தொடர்)
by வாகரைமைந்தன் Thu Jan 27, 2022 5:47 pm
» சித்தமருத்துவ நூல்கள் தரவிறக்கம் செய்ய..
by வாகரைமைந்தன் Sun Jan 02, 2022 4:04 pm
» யாழ்ப்பாணம் கோட்டை
by Tamil Mon Dec 13, 2021 6:44 am
» ஸ்ருதி வினோ நாவல்கள் - மின்நூல்
by வாகரைமைந்தன் Fri Dec 10, 2021 11:14 pm
» கவிதை படிக்கலாம்
by வாகரைமைந்தன் Thu Dec 02, 2021 4:09 pm
» சினிமாவில் தொழில்நுட்பம்+செய்தி
by வாகரைமைந்தன் Fri Nov 19, 2021 4:45 pm
» மனசு அமைதி பெற .......
by veelratna Mon Nov 08, 2021 12:13 pm
» கீரிமலையில் அமைந்துள்ள சிவன் கோயில் நகுலேஸ்வரம்
by veelratna Mon Nov 08, 2021 12:11 pm
» இலங்கை வானொலியில் ஒளிபரப்பு செய்யப்படட சில பழைய விளம்பரங்கள் அத்தானே அத்தானே எந்தன் ஆசை அத்தானே
by veelratna Mon Nov 08, 2021 12:06 pm
» பக்தி பாடல்கள்
by veelratna Mon Nov 08, 2021 12:04 pm
» தவில் நாதஸ்வரம்
by veelratna Mon Nov 08, 2021 11:58 am
» புது வரவு விளையாட்டு
by veelratna Mon Nov 08, 2021 11:56 am
» கீரிமலை நாகுலேஸ்வரம் கோவில்
by veelratna Tue Oct 26, 2021 11:51 am
» நாச்சி முத்தையா நாச்சி முத்தையா
by veelratna Tue Oct 26, 2021 11:48 am
» மெல்லிசை பாடல்
by veelratna Mon Oct 25, 2021 11:35 am
» யாழ்ப்பாணம் கச்சேரி பழய நினைவுகள்
by veelratna Mon Oct 25, 2021 11:31 am
கூகுள் தேடலில் அடிப்படைகள்
Page 1 of 1
கூகுள் தேடலில் அடிப்படைகள்
இன்றைய தேடல் உலகில் அதி நவீன தொழில் நுட்பத்தின் அடிப்படையில் இயங்கி, வேறு யாரும் தொட முடியாத உயரத்தில் இருப்பது கூகுள் தேடல் சாதனங்கள். இணையம் சார்ந்து இயங்கும் எந்த நிறுவனமும், தனி நபர்களும், கூகுள் வழி மேற்கொள்ளப்படும் தேடல் முடிவுகளையே தங்கள் கணிப்பின் அடிப்படையாக ஏற்றுக் கொள்கின்றனர். இது எப்படி நிகழ்கிறது? என்ற கேள்வியும் அனைவரின் மனதிலும் ஏற்படுகிறது. இதற்கான விடையை இங்கு காண்போம்.
முதலில் கூகுள் தோன்றிய நிலையைக் காணலாம். விக்கிப்பீடியா தளம் தரும் தகவல்களின் படி, கூகுள் சர்ச் என்னும் பிரிவு, 1997ல் தொடங்கப்பட்டது. இதனைத் தொடங்கியவர்கள் லாரி பேஜ் மற்றும் செர்ஜி பிரின் (Larry Page and Sergey Brin). இன்றைய நிலையில், நாளொன்றுக்கு இந்த தேடல் தளம் வழியாக 300 கோடிக்கும் மேற்பட்ட தேடல்கள் மேற்கொள்ளப்படுகின்றன. இந்த தேடலுக்கான முடிவுகள், 60 ட்ரியல்லனுக்கு (10 லட்சத்து 10 லட்சம் - 1,000,000,000,000) மேலான இணையப் பக்கங்களைத் தேடித் தரப்படுகிறது. இவற்றைத் தேட ஒரு அட்டவணைக் குறிப்பு (index) பயன்படுத்தப்படுகிறது. இதன் அளவு 95 பீட்டா பைட்ஸ். (ஒரு பீட்டா பைட் என்பது 1000000000000000 பைட்ஸ். கிகா பைட், டெரா பைட் அடுத்து பீட்டா பைட்)அதாவது ஏறத்தாழ 10 கோடி கிகா பைட்ஸ்.
1. இணைய தளங்களை எப்படி தேடி அறிவது?
தேடல் பணியினை மேற்கொள்ள தான் "Google bot” என்னும் நவீன சாப்ட்வேர் புரோகிராம் ஒன்றை இயக்குவதாக கூகுள் கூறுகிறது. இந்த புரோகிராம் பல்லாயிரக்கணக்கான கம்ப்யூட்டர்களில் இயக்கப்பட்டு, பல இணைய தளங்களைத் தேடிச் செல்கிறது. தான் இறுதியாகத் தேடிப் பார்த்த தளத்திலிருந்து, அடுத்த புதிய இணைய தளங்களுக்கு இந்த புரோகிராமின் தேடல்கள் செல்கின்றன. தான் எந்த இணைய தள உரிமையாளர்களிடமும், அவர்கள் தளங்களை அடிக்கடிப் பார்ப்பதற்கென பணம் வாங்கவில்லை என்று கூகுள் அறிவித்துள்ளது. ஆனால், இணைய தள உரிமையாளர்கள் நினைத்தால், தங்கள் தளங்களை கூகுள் தேடல் தீண்டாமல் இருக்கும்படி வைத்துக் கொள்ளலாம்.
2. டேட்டாவினை வகைப்படுத்தல்:
மேலே சொன்னபடி, அனைத்து தளங்களையும் பார்த்த பின்னர், அதில் கிடைத்த தகவல்கள் வகைப்படுத்தப்பட வேண்டும். இந்த தகவல்களே, 95 பீட்டா பைட்ஸ் அளவிலான வரிசைக் குறிப்பாக (index) அமைக்கப்பட்டுள்ளது. இருப்பினும், சில இணைய தளங்களை கூகுள் பாட் தேடல் புரோகிராமினால் பார்க்கப்பட முடியாமலும் போகலாம்.
3. தகவல் அறிவித்தல்: ஒரு கூகுள் தேடலானது, இந்த வரிசைக் குறிப்பினை மட்டும் பார்த்து தன் தேவைக்கேற்ப தகவல்களை எடுப்பதில்லை. அதற்கு அதிகமான நேரம் ஆகும். அது மட்டுமின்றி, தேவையற்ற குப்பைகளும் சில சமயம் தேடல் முடிவுகளாகக் கிடைக்கும். எனவே, தேடலுக்கு அதிகத் தொடர்புள்ளவற்றை மட்டும் கண்டறிய சில சிறப்பு தேடல் வழிகள் பயன்படுத்தப்படுகின்றன. இந்த வழிகள் மற்றவர்கள் அறியாத வகையில் இரகசியமாக உள்ளன. மேலும், தேடலில் கிடைக்கும் தகவல்கள் பலவும் இரகசியமாக வைக்கப்படுகின்றன. ஏனென்றால், இதன் வழியாக கூகுள் தேடல் சாதனமே கைப்பற்றப்படலாம்.
4. தெரிந்த தேடல் வழிகள்:
இருப்பினும் சில தேடல் வழிகளை நாம் அறிய முடிகிறது. இணைய தள டேட்டாவின் வகை (தேடல் சொற்களுக்கு எந்த அளவில் தொடர்புடையது என்ற அடிப்படையில்) அடுத்து டேட்டாவின் தன்மை. இதற்கு சொல் எழுத்து சோதனை (spell check) மேற்கொள்ளப்படுகிறது. இதன் மூலம் உண்மையிலேயே நல்ல தகவல்களைக் கொண்டுள்ள இணையப் பக்கங்களிலிருந்து, அர்த்தமற்ற தளங்கள் இனம் காணப்பட்டு பிரிக்கப் படுகின்றன. இணையத் தளங்கள் தரும் டேட்டாவின் அண்மைத் தன்மை. 1996ல் பதியப்பட்ட ஒரு தளத்தின் தகவல், 2013ல் பதியப் பட்ட தளங்களின் முன்னே காட்டப்படுவதில்லை.
அடுத்ததாக, இணைய தளத்தின் நம்பகத் தன்மை. உண்மையிலேயே தளம் சொல் லும் தகவல் சார்ந்ததா? இல்லை, போலியான மால்வேர் கொண்டுள்ள தளமா எனக் கண்டறிதல். அடுத்ததாக, இணைய தளத்தின் பெயர் மற்றும் முகவரி சரி பார்த்து அறிதல். இதனைத் தொடர்ந்து சொற்கள், அவற்றின் இணைச் சொற்களைப் பிரித்து அறிதல் மேற்கொள்ளப்படு. இதன் பின்னர், குறிப்பிட்ட இணைய தளத்தை எத்தனை லிங்க்குகள் சுட்டிக் காட்டுகின்றன மற்றும் அவற்றின் நம்பகத்தன்மை குறித்து ஆய்வு செய்யப்படுகிறது.
இறுதியாகச் சொல்லப்பட்ட நம்பகத் தன்மை "PageRank.” என்று சொல்லப்படும் தன்மையின் அடிப்படையில் செயல்படுத்தப்படுகிறது. ஓர் இணையப் பக்கத்தின் தர வரிசை அதற்கான லிங்க் எப்படிப்பட்ட மூலத்திலிருந்து வருகிறது என்பதை அறிவதில் உள்ளது. இதன் அடிப்படையில், ஒரு தளம் தேடல் பட்டியல் முடிவுகள் அறிவிக்கும் பட்டியலில் முதலில் இடம் பிடிக்கும். இதிலும் அதன் தன்மை கண்டறியப்படுகிறது.
ஒரு தளத்திற்கு அதிகமான எண்ணிக்கையில், ஆனால், தரம் குறைந்த தொடர்புகளின் அடிப்படையில் தொடர்பு இருக்கலாம். இன்னொரு தளத்திற்கு நல்ல தரமான தொடர்புகள் சுட்டிக் காட்டும் தன்மை இருக்கலாம். அப்போது இரண்டாவதாகச் சொல்லப்பட்டதே, "PageRank” மதிப்பெண் அதிகம் பெற்று, தேடல் முடிவுகளில் முதல் பக்கத்தில் இடம் பெறும்.
இதனால் தான், இணைய தளங்களை உருவாக்கிப் பதிப்பவர்கள், தங்கள் மதிப்பெண்ணை "PageRank” ஐ எப்படி உயர்த்துவது என எப்போதும் சிந்திக்கின்றனர். அதற்கான அடிப்படைக் காரணிகளை அறிந்து அவற்றை உயர்த்துகின்றனர்.
முதலில் கூகுள் தோன்றிய நிலையைக் காணலாம். விக்கிப்பீடியா தளம் தரும் தகவல்களின் படி, கூகுள் சர்ச் என்னும் பிரிவு, 1997ல் தொடங்கப்பட்டது. இதனைத் தொடங்கியவர்கள் லாரி பேஜ் மற்றும் செர்ஜி பிரின் (Larry Page and Sergey Brin). இன்றைய நிலையில், நாளொன்றுக்கு இந்த தேடல் தளம் வழியாக 300 கோடிக்கும் மேற்பட்ட தேடல்கள் மேற்கொள்ளப்படுகின்றன. இந்த தேடலுக்கான முடிவுகள், 60 ட்ரியல்லனுக்கு (10 லட்சத்து 10 லட்சம் - 1,000,000,000,000) மேலான இணையப் பக்கங்களைத் தேடித் தரப்படுகிறது. இவற்றைத் தேட ஒரு அட்டவணைக் குறிப்பு (index) பயன்படுத்தப்படுகிறது. இதன் அளவு 95 பீட்டா பைட்ஸ். (ஒரு பீட்டா பைட் என்பது 1000000000000000 பைட்ஸ். கிகா பைட், டெரா பைட் அடுத்து பீட்டா பைட்)அதாவது ஏறத்தாழ 10 கோடி கிகா பைட்ஸ்.
1. இணைய தளங்களை எப்படி தேடி அறிவது?
தேடல் பணியினை மேற்கொள்ள தான் "Google bot” என்னும் நவீன சாப்ட்வேர் புரோகிராம் ஒன்றை இயக்குவதாக கூகுள் கூறுகிறது. இந்த புரோகிராம் பல்லாயிரக்கணக்கான கம்ப்யூட்டர்களில் இயக்கப்பட்டு, பல இணைய தளங்களைத் தேடிச் செல்கிறது. தான் இறுதியாகத் தேடிப் பார்த்த தளத்திலிருந்து, அடுத்த புதிய இணைய தளங்களுக்கு இந்த புரோகிராமின் தேடல்கள் செல்கின்றன. தான் எந்த இணைய தள உரிமையாளர்களிடமும், அவர்கள் தளங்களை அடிக்கடிப் பார்ப்பதற்கென பணம் வாங்கவில்லை என்று கூகுள் அறிவித்துள்ளது. ஆனால், இணைய தள உரிமையாளர்கள் நினைத்தால், தங்கள் தளங்களை கூகுள் தேடல் தீண்டாமல் இருக்கும்படி வைத்துக் கொள்ளலாம்.
2. டேட்டாவினை வகைப்படுத்தல்:
மேலே சொன்னபடி, அனைத்து தளங்களையும் பார்த்த பின்னர், அதில் கிடைத்த தகவல்கள் வகைப்படுத்தப்பட வேண்டும். இந்த தகவல்களே, 95 பீட்டா பைட்ஸ் அளவிலான வரிசைக் குறிப்பாக (index) அமைக்கப்பட்டுள்ளது. இருப்பினும், சில இணைய தளங்களை கூகுள் பாட் தேடல் புரோகிராமினால் பார்க்கப்பட முடியாமலும் போகலாம்.
3. தகவல் அறிவித்தல்: ஒரு கூகுள் தேடலானது, இந்த வரிசைக் குறிப்பினை மட்டும் பார்த்து தன் தேவைக்கேற்ப தகவல்களை எடுப்பதில்லை. அதற்கு அதிகமான நேரம் ஆகும். அது மட்டுமின்றி, தேவையற்ற குப்பைகளும் சில சமயம் தேடல் முடிவுகளாகக் கிடைக்கும். எனவே, தேடலுக்கு அதிகத் தொடர்புள்ளவற்றை மட்டும் கண்டறிய சில சிறப்பு தேடல் வழிகள் பயன்படுத்தப்படுகின்றன. இந்த வழிகள் மற்றவர்கள் அறியாத வகையில் இரகசியமாக உள்ளன. மேலும், தேடலில் கிடைக்கும் தகவல்கள் பலவும் இரகசியமாக வைக்கப்படுகின்றன. ஏனென்றால், இதன் வழியாக கூகுள் தேடல் சாதனமே கைப்பற்றப்படலாம்.
4. தெரிந்த தேடல் வழிகள்:
இருப்பினும் சில தேடல் வழிகளை நாம் அறிய முடிகிறது. இணைய தள டேட்டாவின் வகை (தேடல் சொற்களுக்கு எந்த அளவில் தொடர்புடையது என்ற அடிப்படையில்) அடுத்து டேட்டாவின் தன்மை. இதற்கு சொல் எழுத்து சோதனை (spell check) மேற்கொள்ளப்படுகிறது. இதன் மூலம் உண்மையிலேயே நல்ல தகவல்களைக் கொண்டுள்ள இணையப் பக்கங்களிலிருந்து, அர்த்தமற்ற தளங்கள் இனம் காணப்பட்டு பிரிக்கப் படுகின்றன. இணையத் தளங்கள் தரும் டேட்டாவின் அண்மைத் தன்மை. 1996ல் பதியப்பட்ட ஒரு தளத்தின் தகவல், 2013ல் பதியப் பட்ட தளங்களின் முன்னே காட்டப்படுவதில்லை.
அடுத்ததாக, இணைய தளத்தின் நம்பகத் தன்மை. உண்மையிலேயே தளம் சொல் லும் தகவல் சார்ந்ததா? இல்லை, போலியான மால்வேர் கொண்டுள்ள தளமா எனக் கண்டறிதல். அடுத்ததாக, இணைய தளத்தின் பெயர் மற்றும் முகவரி சரி பார்த்து அறிதல். இதனைத் தொடர்ந்து சொற்கள், அவற்றின் இணைச் சொற்களைப் பிரித்து அறிதல் மேற்கொள்ளப்படு. இதன் பின்னர், குறிப்பிட்ட இணைய தளத்தை எத்தனை லிங்க்குகள் சுட்டிக் காட்டுகின்றன மற்றும் அவற்றின் நம்பகத்தன்மை குறித்து ஆய்வு செய்யப்படுகிறது.
இறுதியாகச் சொல்லப்பட்ட நம்பகத் தன்மை "PageRank.” என்று சொல்லப்படும் தன்மையின் அடிப்படையில் செயல்படுத்தப்படுகிறது. ஓர் இணையப் பக்கத்தின் தர வரிசை அதற்கான லிங்க் எப்படிப்பட்ட மூலத்திலிருந்து வருகிறது என்பதை அறிவதில் உள்ளது. இதன் அடிப்படையில், ஒரு தளம் தேடல் பட்டியல் முடிவுகள் அறிவிக்கும் பட்டியலில் முதலில் இடம் பிடிக்கும். இதிலும் அதன் தன்மை கண்டறியப்படுகிறது.
ஒரு தளத்திற்கு அதிகமான எண்ணிக்கையில், ஆனால், தரம் குறைந்த தொடர்புகளின் அடிப்படையில் தொடர்பு இருக்கலாம். இன்னொரு தளத்திற்கு நல்ல தரமான தொடர்புகள் சுட்டிக் காட்டும் தன்மை இருக்கலாம். அப்போது இரண்டாவதாகச் சொல்லப்பட்டதே, "PageRank” மதிப்பெண் அதிகம் பெற்று, தேடல் முடிவுகளில் முதல் பக்கத்தில் இடம் பெறும்.
இதனால் தான், இணைய தளங்களை உருவாக்கிப் பதிப்பவர்கள், தங்கள் மதிப்பெண்ணை "PageRank” ஐ எப்படி உயர்த்துவது என எப்போதும் சிந்திக்கின்றனர். அதற்கான அடிப்படைக் காரணிகளை அறிந்து அவற்றை உயர்த்துகின்றனர்.
Similar topics
» கூகுள் தேடலில் பயனுள்ள புதிய வசதி அறிமுகம்
» கூகுள் தேடலில் மேலும் ஒரு பயனுள்ள வசதி- Webpage Previews
» குழந்தைகளின் கூகுள் தேடலில் ஆபாச தகவல்கள் வராமல் Lock செய்ய? video
» Excel பயன்பாட்டின் அடிப்படைகள் - 1
» ஆபாச தகவல் Google தேடலில் வராமல் Lock செய்வது எப்படி..?
» கூகுள் தேடலில் மேலும் ஒரு பயனுள்ள வசதி- Webpage Previews
» குழந்தைகளின் கூகுள் தேடலில் ஆபாச தகவல்கள் வராமல் Lock செய்ய? video
» Excel பயன்பாட்டின் அடிப்படைகள் - 1
» ஆபாச தகவல் Google தேடலில் வராமல் Lock செய்வது எப்படி..?
Page 1 of 1
Permissions in this forum:
You cannot reply to topics in this forum