X
تبلیغات
رایتل

آموزش فناوری دانلود

ترفندهای جستجو در گوگل (قسمت دوم)

بعضی از موتورهای جستجو تکنیکی به نام Stemming را پشتیبانی می کنند که تکنیکی است که معمولا با اضافه کردن * یا گاهی ؟ به عبارت موردنظر از موتور جستجو درخواست می کند که به جای این علامت، مشتقات آن را جستجو کند.
به عنوان مثال جستجوی moon* نتایجی مثل moons, moonlight, moonshot را در برخواهد داشت. گوگل از این ویژگی به طور صریح استفاده نمی کند. ولی زمانی که شما جای یک کلمه را در عبارتی نمی دانید، می توانید از * استفاده کنید که از این ستاره به معنای جانشین یک کلمه کامل در گوگل، برداشت می شود. بنابراین طبق گفته های بالا جستجو برای "three * mice" موارد زیر را در نتایج خواهد داشت: finds three blind mice, three blue mice, three green mice,


چقدر این ویژگی گوگل بدرد می خورد؛ مطمئنا به اندازه ویژگی stemming مفید نیست ولی بازهم موجب گیج شدن مبتدیان نمی شود. یک * یک جانشین برای یک کلمه است، دو * به معنای دو کلمه و ...

این ویژگی در موارد زیر قابل استفاده است:

1- فائق آمدن بر محدودیت 10 کلمه گوگل ( در گوگل عبارت هایی که بین دو کوتیشن قرار می گیرد، نباید بیش از 10 کلمه باشد) شما این مثال ها را (مثلا عبارت Fourscore and seven years ago, our fathers brought forth on this continent) که زیاد برای پیدا کردن یک شعر یا نقل قول تکرار می شوند را، اگر امتحان کنید، گوگل تنها تا کلمه on عمل جستجو را انجام خواهد داد و همه آنچه بعد از آن می آید، توسط گوگل نادیده گرفته می شود.

2-بررسی تکرار یک عبارت معین یا مشتق عبارت مثل: (درباره دستور این تایتل بعدا توضیح داده خواهد شد) intitle:"methinks the * doth protest too much" و یا intitle: "the * of Seville"

3- پر کردن جاهای خالی حافظه یک آدم حواس پرت! شاید شما فقط یک قسمت کوتاه یک ترانه را به یاد بیاورید که جستجو تنها از آنچه شما به یا می آورید، به جای بازسازی تصادفی استفاده می کند.

بیایید یک مثالی را مرور کنیم، سرود "Good Times" که توسط چیک سروده شده است، که خط زیر را بیان میکند: "You silly fool, you can't change your fate."

شاید شما یک ترانه را گوش کرده اید، اما شما یادتان نمی اید که کلمه fool درست است یا چیز دیگری بوده، اگر شما اشتباه کرده باشید ( اگر درستش به عنوان مثال "You silly child, you can't change your fate" باشد) شما هیچ جوابی نخواهید یافت.

راه حل استفاده از ویژگی گوگل است که به جای آن کلمه سرچ کنیم: "You silly *, you can't change your fate"

شما این تکنیک را می توانید برای نقل قول ها و شعرهای غنایی و ... به کار ببرید، شما باید حواستان را جمع کنید که به اندازه کافی از متن نقل قول را سرچ کنید تا به یک نتیجه واحد برسید. مثلا عبارت زیر که قسمتی از مثال بالاست نتایج زیادی در بر خواهد داشت: "you * fool"

علاوه بر OR و AND و جستجو های عبارتی، Google دستورهای خاص زیادی را برای محدود نمودن جستجوی شما فراهم نموده است. همانند همه موتورهای جستجوی Full Text، در گوگل به جای اینکه صفحات وب تنها بر اساس عنوان و توضیحات انها ایندکس شوند، صفحات وب کلا ایندکس می گردند. دستورهای خاص به کاربران گوگل اجازه می دهند که جاهای معینی از صفحات وب را برای اطلاعات به خصوصی، جستجو نمایند، و این اجازه را به کاربران گوگل می دهند که بتوانند جاهای معینی از صفحات وب را برای اطلاعات به خصوصی، جستجو نمایند (که آن ها اپراتورهای پیشرفته نیز نامیده می شوند). این ویژگی (دستورات و المانهای خاص) خیلی چاره ساز است مخصوصا زمانی که شما با بیش از 8 بیلیون صفحه وب مواجهید و می خواهید دامنه جستجوی خود را محدودتر نمایید!

مثلا ذکر اینکه اینکه کلمات عبارت مورد نظر شما تنها بایستی در عنوان یا URL صفحات وب باشد، می تواند کمک شایانی به شما برای به دست اوردن نتایج بسیار خاص داشته باشد. در ادامه مطلب به شرح برخی از المان های دستوری معمول خواهیم پرداخت:

intitle: این المان جستجوی شما را به عنوان صفحات وب محدود می کند و متغیر allintitle: صفحاتی که عنوانشان تمام کلمات ذکر شده جستجو را دربردارد را پیدا می کند و هر دو دستور، قبل کیوردها استفاده می شوند. intitle:"windows xp" allintitle:"windows xp" microsoft

همچنین ممکن است شما ترجیح دهید از دستور allintitle: استفاده نکنید، چون در ترکیب با دستورات دیگر ممکن است خوب کار نکند.

site: این دستور به کاربر اجازه می دهد که جستجوی خود را به یک سایت محدود نماید.

site:loc.gov
site:thomas.loc.gov
site:edu
site:nc.us

نکته ای که تذکرش لازم است این است که این دستور، دستور خوبی برای یک وب سایتی که شامل زیرشاخه هایی (مثل /~sam/album/ ) است، نمی باشد. مثلا شما نمیتوانید با دستور site: همه صفحات را در http://www.geocities.com/test/test1/6485 بیابید و گوگل هیچ نتیجه ای برای جستجوی شما نخواهد یافت. به جای این دستور، دستور inurl: پیشنهاد می شود.

inurl: این دستور جستجوی شما را به URL صفحات وب محدود می کند. این دستور برای یافتن صفحات help بسیار خوب کار می کند، زیرا آن ها نسبتا در ساختار خود منظم اند و allinurl: متغیری است که همه کلمات لیست شده در URL را پیدا می کند ولی در ترکیب با دستورت دیگر خوب کار نمی کند. inurl:help
allinurl:search help

همانطور که می بینید استفاده inurl: به جای site: یک مزیت ضروری دارد و آن اینست که شما می توانید از آن برای جستجوی ساب دایرکتوری ها (زیرفهرست ها) نیز استفاده نمایید.

تذکر: در استفاده از دستور inurl: برای داشتن نتایج بیشتر از //:http استفاده نکنید.

همچنین شما می توانید inurl: را در ترکیب با site: به کار برید تا بتوانید اطلاعات ساب دامین ها (زیردامنه ها) را استخراج نمایید. برای مثال opensource.org چند تا ساب دامین دارد؟ یک جستار سریع به شما کمک می کند تا به پاسخ این جواب برسید: site:opensource.org -inurl:www.opensource.org

این جستجو از گوگل میخواهد تا تمام صفحات دامنه opensource.org را لیست کند، اما صفحاتی را که از زیر دامنه معمول www هستند و شما آن ها را قبلا دیده بودید، نادیده بگیرید.

link: این دستور فهرستی از صفحاتی که به URL تعیین شده لینک داده اند را، می یابد. اگر link: را وارد کنید شما به فهرستی از صفحاتی که به صفحه گوگل لینک داده اند، دست می یابد ( نه در هر جای دامنه google.com ) نگران نباشید اگر ادرس شما با //:http همراه نباشد، شما به آن نیازی ندارید. بنابراین اگر ادرس شما //:http هم داشت، باز گوگل آن را نادیده می گیرد. این دستور به خوبی با هر URL با محتوای بزرگ کار می کند. مثلا سرعت جستجویش در http://www.opensource.org/test/test1 فرقی با بالاترین مرتبه سایت، مثل opensource.org ندارد.


cache: این دستور یک کپی از صفحه ای که در گوگل ایندکس گذاری شده است را، می یابد. حتی اگر آن صفحه دیگر در URL اصلی در دسترس نباشد یا محتوایش به کلی تغییر کرده باشد.
cache:www.yahoo.com

catch گوگل مخصوصا برای باز یافتن نگارش قبلی یک صفحه که بارها تغییر می کند، مناسب است.


daterange: این دستور جستجوی شما را به تاریخ به خصوصی یا یک محدوده تاریخی که صفحه در گوگل ایندکس گذاری شده، محدود می نماید. باید در نظر داشت که این جستجو، کاری به تاریخی که یک صفحه ساخته شده است، ندارد و تنها بر مبنای تاریخ ایندکس گذاری در گوگل، عمل می کند. "Microsoft" "Windows XP" daterange:2450958-2450968

نظرات (0)
نام :
ایمیل : [پنهان میماند]
وب/وبلاگ :
برای نمایش آواتار خود در این وبلاگ در سایت Gravatar.com ثبت نام کنید. (راهنما)