موتورهای جستجو
در اين بخش ميخواهم در مورد سايت هاي
جستجو يا موتورهاي جستجوگر
search engines و
اهميت آنها براي سايت شما صحبت
کنیم. هر هدفي را که از ساخت يک وب سايت دنبال ميکنيد ، تا
زمانيکه سايت شما شناخته نشده باشد، به آن هدف نخواهيد
رسيد. بطور معمول ، هدف از ساخت يک وب سايت يا اطلاع رساني
است يا کسب درآمد و يا ميتواند هر دو آنها باشد که به نظر
من اين آخري از همه بهتر است. در هر حال شما بعد از راه
اندازي سايتتان نياز به يک تبليغات گسترده براي جلب بيننده
بيشتر داريد، اين نکته را هميشه در ذهن بسپاريد، هر چه
بيننده وب سايت شما بيشتر باشد، موفقيت شما بيشتر خواهد
بود، هر بيننده برابر با يک امتياز و يا شايد هم بيشتر.
يکي از اساسي ترين راههاي جذب بيننده، ثبت
صفحات سايت در موتورهاي جستجوگر
search engines است، چون هر کسي در
هر کجا که باشد ميتواند سايت شما را پيدا کند.
موتور جستجوگر چيست؟
در حال حاضر تعداد زيادي
سايت جستجوگر مانند،
AltaVista, Mama, Yahoo, Google
داريم که هر کدام از اينها توسط برنامه هاي گردشگر بنام
spider, web
crawler, robot
مرتب در وب بدنبال صفحات جديد و يا تغييريافته ميگردند و
به محض پيدا کردن آنها، اطلاعات مورد نظر را در پايگاه
داده ايDatabase
خود،
ليست ميکنند تا در موقع لزوم و بهنگام جستجو در اختيار
کاربران قرار دهند. زمانيکه شما بدنبال يک کلمه کليديkeyword
در
آن سايتها مي گرديد، اطلاعات پايگاه داده اي آنها را جستجو
ميکنيد و سپس نزديکترين مطالب به کلمه کليدي را براي شما
نمايان ميکنند که هر چه آن کلمه دقيق تر باشد، شما به مطلب
مورد نظر زودتر و راحت تر دسترسي پيدا ميکنيد.
چگونه صفحات در پايگاه
داده اي Database
ليست ميشود؟
هنگاميکه
robot
ها و يا يک برنامه گردشگر ديگر بطور اتوماتيک گردش خود را
شروع ميکند، به محض يافتن يک سايت جديد در وب ابتدا به
سراغ فايلي بنام
robots.txt
ميگردد، سپس مطالب قسمت
HEAD
و بدنبال آن اطلاعات نوشته شده در متاتگها را جمع آوري
ميکند و پس از يک پردازش دقيق با استفاده از يک الگوريتم
مخصوص، صفحات را در پايگاه داده اي خود ذخيره و ليست
ميکند.
فايل
robots.txt چيست؟
robots.txt
يک فايل متني است که اين فايل را ميتوانيد در سرور و در
دايرکتوري وب سايت خود قرار دهيد تا تنظيمات گردش برنامه
هاي گردشگر را در آن کنترل کنيد و در حقيقت زحمت اين
برنامه ها را کم کنيد. اما اطلاعاتي که در اين فايل بايد
قرار گيرد الگوي خاصي دارد که در زير به آن اشاره شده و در
آن سطح دسترسي گردشگرها را با ذکر نامشان معين ميکنيد،
User-agent:
Disallow:
اين دو خط را در فايل
متني وارد و آنرا با پسوند
txt
ذخيره ميکنيد.
User-agent
به برنامه هايي ميگويند که براي وب ساخته ميشوند تا در
اختيار کاربران قرار گيرند و گردشگر ها مانند
robot
ها و crawler
ها از اين قبيل هستند و هر سايت جستجو يک
گردشگر با اسم مشخص دارد، مانند سايت گوگل که بنام
Googlebot معروف
است. براي تعيين سطح دسترسي بايد نام برنامه را در خط اول
بنويسيد و در خط دوم هم نام فايلها يا دايرکتوري هاييکه
نبايد ليست شوند را مينويسيد. اگر بطور کل نميخواهيد سايت
شما ليست شود طبق دستور زير عمل ميکنيد:
User-agent: *
Disallow: /
براي اطلاعات بيشتر در
مورد
robots.txt به
سايت
www.robotstxt.org مراجعه
کنيد.
نقش متاتگها
meta tags براي
موتورهاي جستجو
شما درباره ساخت متاتگها
در بخش HEAD
مطالبي را آموختيد. در اين قسمت نقش آنها را در
search engine
ها ياد خواهيد گرفت. گردشگرها بيشتر به متاتگها حساس هستند
تا اطلاعاتي را در اختيارشان قرار دهند. اطلاعاتي را که
شما در متاتگها بايد وارد کنيد به شرح زير ميباشند:
هر موتور جستجوگر اصول و
قوانين خاص خود را براي ليست و ذخيره کردن
( index )
سايت شما و تعيين رتبه آن
( Page Ranking )
دارد که متا تگها در اين مورد نقش اساسي دارند و شما در
انتخاب و تعيين آنها بايد بسيار دقت کنيد. بطور مثال بکار
بردن کلماتيکه در متا تگها به عنوان
keyword انتخاب
نموده ايد در متن داخل همان صفحه در رتبه بنديpage
ranking
صفحه بسيار موثر خواهد بود.
منظور از رتبه بندي(
Page Ranking ) چيست؟
اگر شما داخل يکي از
سايتهاي جستجو مانند گوگل بدنبال کلمه اي گشته باشيد متوجه
ميشويد که بعضي از سايتها در همان صفحه هاي اول هستند ولي
بقيه در صفحه هاي آخر، که اين ترتيب بر اساس رتبه بندي يک
سايت است که آن سايت در ابتدا نشان داده شود يا در آخر
ليست باشد. اگر اصول و قوانين رتبه بندي يک موتور جستجو را
رعايت کنيد ، سايت شما هم بعد از مدتي در صفحات ابتدايي
نمايش داده خواهد شد.
در بخش بعدي مطالبي را در
مورد بهترين و معروفترين سايت جستجو يعني گوگل جمع آوري
کردیم که براي ثبت و رتبه بندي سايت شما بسيار مفيد است.
|