موتورهای جستجوگر خبری

موتورهای جستجوگر خبری، کار بلاگرها، روزنامه نگاران، روابط عمومی ها و گردانندگان سایتها را تا حد بسیار زیادی راحت کرده اند. مسوول امور ارتباط با رسانه های هر روابط عمومی می تواند با مراجعه به جستجوگرهای خبری فارسی زبان از نحوه پوشش خبر ارسالی خود به رسانه ها در مدت زمان کمتری، مطلع شود و دیگر نیازی به بازکردن صفحات متعدد خبرگزاری ها و سایر سایتهای اطلاع رسانی اینترنتی ندارد و این یکی دیگر از کاربردهای اصلی اینترنت در اینگونه دفاتر است.

روزنامه نگاران، بلاگرها و سایر دروازه بانان خبر هم برای شکار خبرهایی که با کلمات کلیدی همراه هستند از موتورهای جستجوگر خبری استفاده می کنند. این موتورها نیز امکان مشاهده مجموعه آخرین اخباری که در بخشهای مختلف خبری تهیه می شود را بر روی مونیتور (صفحه نمایش) فراهم می کنند.

پیاده سازی جستجوگری که نتایج آن قسمت عمده ای از نیازهای کاربران ایرانی را برآورده سازد و به تمام درخواستهای آنها جوابی قانع کننده دهد واز طرفی به عنوان یک جستجوگر محلی مطرح شود از آرزوی دست اندرکاران اینگونه از سایتهاست.

به عنوان مثال موتور جستجوگر گوگل در ارایه خدمت ” جستجوی خبری” http://news.google.com امکان جستجوی کلمات مورد نظر شما را در میان عناوین خبری، مقالات و متون آنها از میان ۴۵۰۰ منبع انگلیسی زبان فراهم می آورد و کاربر می تواند بر اساس نیاز خود، آنها را بسته به اهمیت مرتبط بودن با موضوع و یا تاریخ آن (جدید و قدیمی بودن خبر) رتبه بندی نماید.

گوگل نتایج جستجوهایش را تا ۳۰ روز قبل اعلام می کند و این امکان را فراهم می آورد تا با بهره گیری از سرویس ای میل، بر اساس کلمات درخواستی تان، نتایج را برایتان ارسال نماید. (اصطلاحا به این خدمت News Alerts می گویند.)

همچنین چنانچه شما برای انجام تحقیقی همچون “تحلیل محتوای رسانه ای” نیازی به مطالب قدیمی تر داشتید، با ارسال ای میلی به گوگل، مطالب مورد نیاز خود را دریافت خواهید داشت.

جستجوگر خبری گوگل برای زبانهای دیگر نیز این امکان خاص را فراهم آورده است. گوگل به زبان آلمانی از میان ۷۵۰ منبع، زبان فرانسه ۵۰۰ منبع و زبان ایتالیایی ۲۵۰ منبع خبری آخرین اخبار و مقالات را نمایش می دهد. این سایـتها از نمونه های پر طرفدار سایت خبری گوگل است.

از دیگر موتورهای جستجوگر خبری موفق به زبان انگلیسی می توان به موارد زیر اشاره داشت:

ـ Yahoo News: http://news.yahoo.com

ـ World News Network: http://www.wn.com

ـ AllTheWeb News: http://www.alltheweb.com/?cat=news

ـ AltaVista News: http://news.altavista.com

ـ Daypop: http://www.daypop.com

البته سایتهای دیگری همچون newsblip و newstrove و همچنین newsnow هستند که در رتبه های بعدی قرار دارند.

● جستجوگرهای خبری فارسی زبان

تاکنون گوگل این خدمت را به زبان فارسی ارایه نکرده است و این عامل باعث شد تا برنامه نویسان ایرانی خود به فکر راه اندازی موتورهای جستجوگر خبری بیافتند. اولین نمونه آن سایت “سرخط” بود که در اولین گام خوش درخشید ولی در ارایه نتایج ضعیف بود و ضعیف ماند.

دومین نمونه این نوع موتورها یجستجوگر خبری “پارسیک” بود. سایت پارسیک که در اردیبهشت ۱۳۸۱ و با هدف ایجاد خدمات جستجو تاسیس شده در تهران مدیریت می‌شود. پارسیک اولین جست و جوگری بود که جست و جوی جامع در وب با امکان جست و جوی کلمات فارسی ، راهنمای فارسی و امکاناتی که ممکن است برای جست و جوی فارسی نیاز باشد را یکجا فراهم کرد. در زمان راه اندازی پارسیک نسخه فارسی گوگل ارائه نشده بود و جست و جوی فارسی در گوگل نیازمند تنظیمات و مشکلاتی بود.

در آبان ماه سال ۸۲ بود که پارسیک موتور جستجوگر خبری خود را در دسترس قرارداد. جستجوگر خبر پارسیک قادر است از ۳۹ منبع خبری، اخبار را در بخشهای مختلف ایران، جهان، اقتصادی، علوم، آی تی، هنر، فرهنگ و جامعه، ورزش و حوادث پویش کرده، در هر لحظه عناوین اخبار سایتهای خبری را به کاربران ارائه کند.

از نقاط ضعف پارسیک این است که امکان دسترسی به “متون اخبار و مقالات” را برای کاربر فراهم نکرده، حتی در مواردی که عناوین اخبار با “روتیتر” همراه بوده به ذکر روتیتر به تنهایی اکتفا شده است. از مهمترین نکاتی که لازم است مسوولین سایت به آن توجه کنند، اخبار روزنامه هاست که در حال حاضر از ۲ یا ۳ روزنامه مطلب درج می گردد. در حالی که مطالب تولیدی تعدای از جراید بعضا از مهمترین اخبار می باشند که به نگاه سایر منابع خبری نیامده اند. روزنامه هایی که سایتهای خوبی نیز دارند همچون شرق، کیهان، اعتماد و روزنامه های همشهری و ایران که به تازگی دستی بر سر و روی سایتشان کشیده اند و یا مجلات ارزشمندی همچون تدبیر در پارسیک جایشان خالی است. در این سایت ازخبرگزاری “ایرنا” به عنوان مهمترین خبرگزاری ایران، خبری و اثری نمی بینیم. البته به نظر، اشکال فنی از سوی برنامه نویسان سایت ایرنا است چرا که از شهریور ماه سال گذشته همزمان با راه اندازی سایت جدید ایرنا، نام و اخبار انگلیسی این سایت از موتور جستجو گر خبری گوگل حذف شده است و نتایجی را در این خصوص در بر ندارد. این حذف شدن از موتورهای خبری جستجوگر های مشهوری چون گوگل و همچنین سرعت بسیار پایین دسترسی به صفحات ایرنا موجب کاهش شدید تعداد بازدیدکنندگان آن طی یکسال اخیر شده است.

بهر حال در حال حاضر کاربردی ترین موتور جستجوگر خبری به زبان فارسی که سرعت بالایی نیز در پویش مطالب دارد سایت پارسیک است. البته نیاز به حمایت دارد و از طرفی نیاز به تقویت کمی و کیفی محتوا. این خواست اندک کاربران فارسی زبان است چرا که هستند کسانی که صفحه اول (Home Page) پویشگر اینترنت خود را http://www.parseek.com/Akhbar قرار داده اند و از این طریق به منابع اطلاعاتی خبری دسترسی پیدا می کنند. فراموش نکنیم که اینترنت کاران، سایتها را دایما با هم مقایسه می کنند و انتظاری که از گوگل دارند را در سایتهای ایرانی جستجو می کنند.

جستجوی سایت|جستجوی فارسی

خط فارسی دارای مشکلات مختلفی است که در جستجو و بازیابی اطلاعات، مسائل و مشکلات فراوانی را فراروی کابران اینترنت قرار می دهد. به خصوص با رشد سریع انتشارات الکترونیکی بر روی وب در شکل های مختلف پایگاه های اطلاعاتی، وبلاگ و هیچ قاعده مشخص و ثابتی برای رسم الخط فارسی وجود ندارد و این مسأله باعث شده تا جستجوگران مطالب فارسی با مشکلات فراوانی روبه رو شوند. اینترنت به عنوان یک محمل اطلاعاتی عظیم، منابع اطلاعاتی را در مقیاسی وسیع در دسترس مخاطبان بالقوه قرار داده است.

سهولت دسترسی به منابع اطلاعاتی اعم از متن و سایر رسانه ها عمده ترین مزیت اینترنت محسوب می شود. این توانایی که هر کس ناشر آثار خود باشد عواقب ناخواسته ای را نیز در پی خواهد داشت و آشکارترین معضل، آن است که انبوهی از منابع بسیار متنوع و غیرقابل مدیریت را فراهم می آورد. افزایش سریع منابع اینترنتی نیازمند یک سازمان دهی مفید و مطثر است. هرچند در حال حاضر راهنما هایی برای منابع اینترنتی تهیه شده است که براساس فایل های مقلوب ساخته شده توسط موتورهای جستجو و با استفاده از قابلیت های مختلف این موتورها از جمله؛ استفاده از عملگرهای بولی، جستجوی دقیق عبارت، محدود کردن یک جستجو به بخش خاصی از رکورد (مانند عنوان، آدرس) کوتاه سازی کلمات، جستجوی نزدیک یابی واژه ها، ایجاد محدودیت زمانی و منطقه ای و زبانی و. به جستجوی اطلاعات کمک می کند اما باید تأکید کرد که در امر بازیابی اطلاعات از اینترنت بدون نمایه سازی نظام یافته نمی توان انتظار بازیابی مفید و مؤثر را داشت.

هرچند بیشترین اطلاعات موجود بر روی اینترنت به زبان انگلیسی است، ولی حجم اطلاعات به زبان فارسی نیز با سرعت در حال افزایش است و کاربران به دلایل مختلفی علاقه زیادی به اطلاعات فارسی نشان می دهند و از آن جایی که زبان غالب در اینترنت انگلیسی است، جستجو به زبان های غیرانگلیسی از جمله فارسی، مسایل و مشکلات مختلفی را جدای از مشکلات عمومی اینترنت دارد.حجم اطلاعات به زبان فارسی در روی اینترنت در اشکال مختلف آن به سرعت رشد کرده است. در حال حاضر توسعه وبلاگ های فارسی، سایت های علمی، تبلیغاتی و دانشگاهی به زبان فارسی باعث شده است که جایگاه زبان فارسی تا حد زبان اول ارتباطات اینترنتی نزد ایرانیان و فارسی زبانان در سراسر جهان ارتقا یابد. شاید بتوان گفت که اولین مرجع وبلاگ نویسی فارسی با انتشار راهنمای ساخت وبلاگ فارسی آغاز شده است. بدون شک دومین موج نیز با شروع به کار سایت پرشین بلاگ که امکان راه اندازی وبلاگ برای کاربران فارسی زبان را با سهولت بیش تری فراهم می کند آغاز شده است. اما پیامد قابل توجه دیگری که رشد وبلاگ نویسی در ایران داشته است پیدایش سایت های اینترنتی فارسی زبانی است که صاحبان وبلاگ ها ایجاد کرده اند و این خود موج جدیدی از گسترش کاربرد اینترنت در جامعه ایران به حساب می آید. اکنون روی آوردن برخی از روزنامه نگاران، پژوهش گران، دانشجویان به وب فارسی و استفاده از منابع خبری، علمی و… موجب تقویت نقش رسانه ای وب فارسی شده است. پدیده دیگری که باعث گسترش زبان و خط فارسی در اینترنت شده است، ایجاد کتابخانه های دیجیتالی فارسی در شبکه جهانی است. با این که از شکل گیری کتابخانه های فارسی در شبکه جهانی مدت زیادی نمی گذرد، اما با این حال به سرعت در حال رشد و گسترش است.

شماری از این کتابخانه ها در پایگاه های اینترنتی شکل گرفته اند و بسیاری وبلاگ هایی هستند که برای این کار راه اندازی شده اند. از ویژگی های این کتابخانه ها این است که هیچ یک جنبه تجاری ندارند. آنچه در بسیاری از کتابخانه های مجازی فارسی در دسترس است فقط شامل کتاب نیست، بلکه نوشته هایی اعم از داستان، مقاله، تک نگاشت و… نیز در میان مجموعه ها دیده می شود. هم چنین آثاری که احتمالاً هیچ گاه چاپ کاغذی ندارند و البته وجود کتاب هایی که مدت هاست نایاب هستند و مجال انتشار دوباره نیافته اند و یا آثاری که امروز به دلایلی بازچاپ آن ها مقدور نیست، از جاذبه های کتابخانه های مجازی اند. پایگاه اینترنتی کتاب های رایگان فارسی، پایگاه اینترنتی بانی تک، کتابخانه مجازی داستان های فارسی، آوای آزاد، پایگاه اینترنتی خوابگرد، کتابخانه دوات، پایگاه اینترنتی سخن، وبلاگ کتابخانه هرمس، پایگاه اینترنتی گفتمان، پایگاه تاریخ و فرهنگ ایران زمین، پایگاه مرکز جهانی اطلاع رسانی آل البیت، کتابخانه پایگاه اینترنتی حوزه، پایگاه اینترنتی امام علی (ع)، پایگاه اینترنتی کتابخانه دیجیتال و… شماری از این کتابخانه ها هستند. کاربران به دلایل مختلفی از قبیل؟ دسترسی آسان و ارزان به حجم عظیم اطلاعات، عدم نیاز اطلاعات یافته شده از اینترنت به تایپ مجدد، دسترسی سریع و اطلاعات جدید، صرفه جویی در وقت و عدم تسلط اکثر کاربران به زبان انگلیسی که زبان غالب بر اینترنت است؟ به دنبال اطلاعات فارسی از اینترنت هستند. گسترش زبان و انبوهی از نوشتارها ایجاب می کند که خط ضابطه داشته باشد و از سوی دیگر پیشرفت فناوری و پیدایش اینترنت خواستار ضابطه و قانونمندی است. اطلاع رسانی که جنبه بین الملی پیدا کرده است بدون دستور خطی سامان یافته و نظام مند میسر نیست و دست کم بر دشواری ها می آفریند.

در حال حاضر وبلاگ های فارسی مقام دوم یا سوم را در جهان دارا می باشد. به نظر دکتر آشوری، اگر زبان فارسی به همین صورت بی دقت در اینترنت به کار رود در سطح زبانی برای تفنن باقی خواهد ماند و کم تر حرفی جدی به این زبان زده خواهد شد. آینده زبان فارسی در اینترنت بستگی به این دارد که نویسندگان فارسی تا چه حد کار خود را جدی بگیرند و این زبان را بازسازی کنند که از لحاظ قدرت بیان و دقت مفاهیم و استواری ساختار دستوری به زبان انگلیسی نزدیک شود. نبود استاندارد ثابت رسم الخط فارسی موجب این شده است که به تعداد صفحات وب فارسی سبک و سیاق نگارش به کار رفته باشد،بنابراین می توان چنین ارزیابی کرد که اکثر وب های فارسی در برخی خصوصیات مشترک می باشند از جمله این که نگارش برخی از آن ها زبان غیررسمی و محاوره ای است و به خصوص در متون علمی اغلب واژه های بیگانه به دفعات استفاده می شود. رسم الخط مورد استفاده نیز متفاوت و سلیقه ای است و برخی از آن ها غلط های تایپی و نگارشی فراوانی دارند و این خصوصیات، اغلب به جهت محدودیت های محیط الکترونیکی و عدم تطابق رسم الخط فارسی با آن می باشد که نمایه سازی و سپس جستجو به این زبان را با دشواری هایی رو به رو می سازد. با توجه به این نکته که اطلاعات ارزشمند فراوانی در اینترنت وجود دارد و اینترنت با شتابی فراوان به یک منبع اطلاعاتی ممتاز تبدیل شده است.

موتورهای جستجو به عنوان یکی از اساسی ترین دروازه های ورود به منابع اینترنتی دارای ضعف هایی هستند که می توان به این موارد اشاره کرد: در یک مجموعه از یافته های بازیابی شده مدخل های تکراری فراوانی ملاحظه می شود. نتایج غیر قابل پیش بینی هستند. نتایج چه بسا گمراه کننده باشند؛ ممکن است جستجویی در یک موتور کاوش نتیجه ای نداشته، ولی در موتور دیگر دارای یافته های فراوان باشد. موتورهای کاوش محتویات پایگاه های اطلاعاتی خودشان را نشان نمی دهند و از معیارهایی که برای گنجاندن یک مدرک در فایل هایشان دارند حتی شرحی ارائه نمی کنند. مهار واژگانی وجود ندارد و قواعد نقطه گذاری و بزرگ نویسی نیز استاندارد نیست. بدون بررسی عملی هر عنصر، اغلب نمی توان میزان ربط و رابطه ها را تحلیل کرد. یعنی اطلاعات کافی در مدخل نمایه نیست تا فرد بتواند دست به انتخاب بزند. عدم توان موتورهای جستجو در تمایز میان مدارکی که توسط فرد الف نوشته شده و مدارکی که درباره فرد الف نوشته شده است. منابع قابل توجهی در شبکه وب وجود دارند که توسط موتورهای جستجو نمایه نمی شوند. به این بخش از وب اصطلاحاً وب نامریی می گویند.؟ وب نامریی بخش بزرگی از وب است که موتورهای جستجو آن ها را نمی توانند نمایه کنند و عبارتند از: سایت های دارای رمز عبور، فایل های پی.دی.اف از متون آرشیو شده، ابزارهای تعاملی نظیر ماشین حساب ها و برخی از واژه نامه ها و هم چنین بعضی از پایگاه های اطلاعاتی، منابع محافظت شده از طریق اسم کاربر و گذر واژه، منابع و صفحات وب بدون پیوند و صفحات افزون بر حداکثر تعداد صفحات قابل مرور جستجوی اطلاعات در اینترنت به دو روش می تواند صورت گیرد یکی استفاده از جملات زبان محاوره ای است و دیگری بکارگیری کلمات کلیدی. در روش استفاده از جملات زبان محاوره ای که اغلب به کاربران تازه کار پیشنهاد می شود. یکی از عیب های بزرگ این روش تعداد نتایج جستجوی زیادی است که بازگردانده می شود. به همین دلیل این روش توسط کاربران حرفه ای و حتی توسط همه، کم تر استفاده می شود. یکی از کاراترین و مقتدرترین روش های جستجوی اطلاعات در دنیای وب استفاده از واژه هایی است که اصطلاحاً کلمات کلیدی نامیده می شوند. اغلب کاربران حرفه ای و جستجوگران ورزیده دنیای اینترنت می توانند با طرح بهترین کلمات کلیدی و بکار بستن قوانین ترکیب آن ها با هم برای نیازهای اطلاعاتی خود پاسخی در خور بیابند. در این روش توصیه های زیر برای انتخاب کلمات کلیدی و نیز جستجوی دقیق و مفید پیشنهاد می شود که بشرح ذیل است:

۱) حتی المقدور سعی شود کلمات کلیدی از میان اصطلاحات منحصر به فرد و اسامی خاص انتخاب شود.

۲) حتی المقدور از آوردن کلمات عمومی که عناوین بسیاری را در زیر مجموعه خود شامل می شوند، جداً خودداری کنید.

۳) همیشه اسم شخص یا نام شی یا هر چیز دیگری را که مد نظر دارید به طور کامل وارد کنید.

۴) دقت کنید که اگر موتور جستجو میان حروف بزرگ و کوچک تفاوتی می گذارد، این مسأله را در طرح کلمات کلیدی خود مدنظر داشته باشید.

۵) در نظر داشته باشید اگر نتیجه جستجو صفر بود به احتمال زیاد می تواند از یک اشتباه تایپی باشد.

۶) اگر املای صحیح و کامل

کلمه ای را نمی دانید از کارکتر جانشین که اغلب * و یا؟ است استفاده کنید.

۷) اگر یک کلمه کلیدی را برای طرح دقیق و تمام و کمال یک مورد جستجو کفایت نمی کند، از تکنیک های جستجوی عبارتی، استفاده از اپراتورهای جبر بولین (AND، OR، NOT) استفاده کنید. جستجوی عبارتی یکی از مهم ترین و قدرتمندترین امکانات جستجو در اغلب موتورهای جستجو می باشد و می توان یک عبارت یا جمله مشخص را به همان ترتیبی که کلمات وارد شده اند مورد جستجو قرار داد. برای این روش جستجو عبارت مورد نظر را داخل گیومه بگذارید.

● استفاده از عملگر AND :

به مفهوم؟ و؟ برای محدود کردن دامنه جستجو از طریق ترکیب کلید واژه های مختلف به کار می رود و برای ترکیب کلیدهای جستجو زمانی که برای شما مهم است که دو یا چند کلمه کلیدی حتماً وجود داشته باشد و علامت آن در پایگاه های مختلف به صورت استفاده از عبارت AND، استفاده از +، انتخاب عبارت ALL THE WORD از منو، انتخاب عبارت (MATCH ON ALL WORDS AND) به وسیله کلیک کردن روی دکمه های رادیویی است.

● استفاده از عملگر OR :

اپراتور OR به مفهوم« یا» و برخلاف عملگر AND باعث گسترش دامنه جستجو و بازیابی اطلاعات بیش تر شده برای ترکیب کلید واژه های جستجو زمانی که انتظار دارید فقط یک، دو یا چند کلمه کلیدی حضور داشته باشند و علامت آن استفاده از عبارت OR، چگونگی اجرای ساده و معمولی آن، انتخاب عبارت ANY OF THE WORDS از منو، انتخاب عبارت (MATCH ON ANY WORDS OR) با کلیک بر روی دکمه های رادیویی می باشد. یکی از کاربردهای مهم این عملگر پوشش مفاهیم یا اصطلاحات مترادف، مرتبط یا با املاهای متفاوت است.

● استفاده از عملگر NOT :

اپراتور NOT به مفهوم« نه» و یا به جز که در این صورت همه جواب های بازگشتی که حاوی عبارت یا کلمه کلیدی هستند حذف خواهند گردید و برای اجرای آن فقط کافیست که NOT را قبل از عبارت یا کلمه کلیدی مورد نظرتان با یک فاصله بیاورید.

● استفاده از کوتاه سازی کلید واژه ها:

این تکنیک به ما امکان می دهد که با وارد کردن بخشی از یک کلید واژه بتوانیم مشتقات مختلف آن را نیز در فرآیند جستجو بازیابی کنیم. اکثر موتورهای جستجو این تکنیک را با استفاده از علامت ستاره (*) ارائه می دهند. یکی از مشکلات استفاده از این تکنیک این است که باعث بازیابی اطلاعات غیرمرتبط و ناخواسته زیادی می شود.

● استفاده از عملگر نزدیک یابی:

در بسیاری از موارد استفاده از عملگر AND باعث بازیابی اطلاعاتی می شود که برای ما مفید نیست. به این دلیل که این عملگر کلید واژه ها را در هر کجای متن که باشند بازیابی می کند. در این موارد استفاده از تکنیک نزدیک یابی می تواند از ریزش کاذب اطلاعات و یا بازیابی اطلاعات غیرمرتبط جلوگیری نماید. همه موتورهای جستجو قابلیت استفاده از این تکنیک را ندارند ولی به عنوان مثال در موتور جستجوی آلتاویستا می توان با استفاده از عملگر NEAR از این تکنیک استفاده نمود.

● جستجوی ترکیبی با استفاده از پرانتز:

این تکنیک یکی از مهم ترین تکنیک های جستجو می باشد که به وسیله آن می توان تا حدود زیادی از بازیابی موارد غیرمرتبط در محیط وب جلوگیری کرد. در این روش می توان از همه عملگرهای جستجو که در بالا گفته شده یک جا استفاده کرد و آن ها را با هم دیگر ترکیب نمود.

● جستجوی کلیدواژه در عنوان صفحات وب:

این تکنیک با این پیش فرض که عنوان یک صفحه وب تا حدود زیادی نمایان گر محتوای اطلاعات موجود در آن است به جستجوی واژه های کلیدی در عنوان سایت ها می پردازد. علامت آن در موتورهای جستجو متفاوت است ولی اغلب موتورهای جستجو از طریق فهرست انتخابی و یا گزینه های دیگر این امکان را فراهم می آورند.

● جستجوی حوزه سایت ها:

با توجه به این که به صورت قراردادی هر کشوری حوزه خاصی در محیط وب دارد، قابلیت جستجوی حوزه سایت ها به ما این امکان را می دهد که فرایند جستجو را به حوزه خاصی نظیر سایت های وب ایران (IR) و یا سایت های وب سازمان های غیر انتفاعی (ORG) محدود کنیم. دستورات استفاده از این تکنیک در موتورهای جستجو مختلف می باشد. محدود کردن جستجو به زبان های مختلف باعث می شود نتایج جستجو به زبان های دیگر آورده نشود و انتخاب مطلب مورد نظر آسان تر است.

محدود کردن جستجو به تاریخ انتشار منابع در وب:

تاریخ انتشار یا به اصطلاح روزآمدی مطلب به خصوص در منابع علمی اصل مهمی است و این گونه محدودیت باعث می شود بنا به نیاز کاربر جدیدترین و یا قدیمی ترین منبع بازیابی بشود.

جستجوی رسانه های مختلف؛ موسیقی، عکس، ویدئو:

زمانی که فقط نوع خاصی از رسانه مورد نیاز است به عنوان مثال زمانی که به عکس یک شخصیت نیاز داریم، جستجو در میان عکس ها باعث می شود نتیجه جستجو شامل اطلاعات دیگری در مورد آن شخصیت نباشد.

● جستجوی صفحات با فرمت های مختلف:

PDF، WORD، MP۳، MPEG. زمانی که فرمت خاصی مورد نظر است می توان از این تکنیک استفاده کرد .به عنوان مثال اگر مایل باشیم منبع بازیابی شده در فرمت PDF باشد، این تکنیک می تواند مفید باشد.

● آگاهی از پیش فرض های جستجو در موتور جستجو:

با توجه به این که هر موتور جستجو برای ترکیب واژه ها یک پیش فرض دارد و اگر از هیچ گونه عملگری استفاده نشود، کلید واژه ها را به صورت پیش فرض با یکی از عملگرهای جبر بولی ترکیب می کند؛ آگاهی از این پیش فرض موتورهای جستجوی مختلف مهارت ما را در جستجو بالا می برد.

● وب نامرئی:

وب نامرئی به دو دلیل کمی و کیفی اهمیت دارد کمی از این نظر که موتورهای جستجو فقط قادر هستند حدود ۱۶ درصد از اطلاعات موجود در اینترنت را بازیابی کنند و اندازه وب نامرئی تقریباً ۵۰۰ برابر وب مرئی است و کیفی از این نظر که منابع اطلاعاتی موجود در وب عمیق معمولاً ارزشمند و مفید هستند و در بسیاری از موارد پاسخ گوی نیاز کاربران می باشند. آشنایی با ابزارهایی که برای شناسایی منابع وب نامرئی به وجود آمده اند و کاربران را به سایت های مناسب راهنمایی می کنند، باعث دسترسی به این بخش عظیم از اطلاعات مفید و ارزشمند می شود. مثل سایت INVISIBLEWEB که فهرستی از منابع نامرئی را و سایت COMPLETEPLASET که فهرستی از تقریباً ۴۰۰۰۰ پایگاه اطلاعاتی وب نامرئی را ارائه می دهد.

مقدمه
به طور متوسط ۷۵ الی ۸۰ درصد بازدیدهایی که از یک وب سایت صورت می‌گیرد از درگاه موتورهای جستجو می باشد. نکته قابل توجه این است که اکثریت مردم فقط ۲ صفحه اول از نتیجه بازگشتی توسط موتورهای جستجو را بررسی می‌کنند.

SEO چیست؟
SEO مخفف کلمات Search Engine Optimization به معنای بهینه سازی وب سایت برای موتورهای جستجو می‌باشد.
برای اینکه رتبه وب سایتتان را افزایش دهید باید به موتورهای جستجو بگویید که سایت شما در چه زمینه‌ای فعالیت می کند. برای معرفی زمینه فعالیت وب سایتتان به موتورهای جستجو باید از کلمات کلیدی (keywords) مناسب در جاهای مختلفی از سایتتان استفاده کنید.

انتخاب کلمات کلیدی مناسب
قبل از اینکه ما مشغول جمع آوری اطلاعات برای سایت شویم، باید تعدادی کلمه کلیدی، متناسب با زمینه فعالیت‌مان انتخاب کنیم و سپس این کلمات را مورد تجزیه و تحلیل قرار دهیم. این مرحله یکی از مهمترین مراحل در علم سئو می‌باشد.
تجزیه و تحلیل کلمات انتخاب شده شامل موارد زیر می‌باشد:
۱- کلمات انتخاب شده را در موتورهای جستجوی معروف نظیر Google جستجو کنید. با این کار رقبای اصلی شما مشخص خواهند شد. سپس شما باید سایت‌های رقیب را بررسی کنید، در ادامه خواهیم گفت که در بررسی سایت‌های رقیب به چه نکاتی باید توجه کرد.
۲- سعی کنید کلمات عمومی را به عنوان کلمه کلیدی انتخاب نکنید.
بعنوان مثال اگر زمینه فعالیت شما فروش قطعات کامپیوتری دست دوم است، کلمه “کامپیوتر” کلمه مناسبی نمی‌باشد. زیرا شامل تاریخچه کامپیوتر، علوم کامپیوتر و… نیز می شود ولی کلمه “قطعه دست دوم کامپیوتر” کلمه مناسبی خواهد بود.
۳- بهتر است از کلمات ترکیبی بعنوان کلمات کلیدی استفاده کنید زیرا رقابت برای کلمات مفرد بیشتر است. پس از اینکه ترافیک سایت شما به یک حد قابل قبولی رسید، می‌توانید رقابت خود را برای کلمات مفرد ادامه دهید.

چگونه کلمات کلیدی انتخاب شده را به موتورهای جستجو بشناسانیم؟
در این مرحله هدف این است که کلمات انتخاب شده را در جاهای مختلف سایت بکار بریم تا ربات‌های موتورهای جستجو هنگام پیمایش سایت ما، اطلاعات کافی از زمینه فعالیت ما بدست آوردند. برای این منظور به ازای هر یک از کلمات انتخاب شده یک صفحه، اطلاعات می‌نویسیم. بهتر است در هر صفحه تمرکز بر روی یک کلمه باشد. نکته قابل توجه این است که باید سعی شود کلمه مورد نظر در متن ما بیش از اندازه تکرار نشود زیرا در این صورت ربات‌های موتورهای جستجو، سایت ما را جزو سایت‌هایی قرار می دهد که هدف آنها مختل کردن فعالیت موتورهای جستجو است (spam) و هیچگاه سایت شما در بانک اطلاعاتی موتورهای جستجو قرار نخواهد گرفت. به طور کلی گفته می‌شود بهتر است در یک صفحه ۲ الی ۳ درصد از کلمات، به کلمات کلیدی اختصاص یابد.
همچنین با توجه به این نکته که ربات‌های موتورهای جستجو، صفحات وب را از بالا به پایین و از چپ به راست پیمایش می‌کنند، بهتر است که در ابتدا و انتهای صفحات، کلمات کلیدی بکار برده شوند. معمولاً در پایین صفحات وب (زیر کپی رایت سایت) کلمات کلیدی مرتبط با صفحه نوشته می‌شوند.
پس از نوشته شدن مطالب، مراحل زیر را انجام دهید:
۱- در عنوان صفحه، کلمه یا کلمات کلیدی استفاده شده در متن صفحه را بکار ببرید. انجام این کار اهمیت بالایی دارد زیرا متنی که درعنوان صفحه قرار دارد بعنوان متن لینک، بازگشتی موتورهای جستجو می‌باشد. موتور جستجوی گوگل فقط ۶۶ کارکتر از این متن را نمایش می‌دهد بنابراین سعی کنید عنوان صفحات کمتر از ۶۶ کاراکتر باشد. برای تعیین عنوان صفحه از تک title بصورت زیر استفاده کنید. سعی کنید اگر بیش از یک کلمه کلیدی در صفحه دارید از کارکتر | بعنوان جداکننده کلمات، استفاده کنید:
کلمه کلیدی اول | کلمه کلیدی دوم و…

۲- از تگ‌های meta برای مشخص ساختن کلمات کلیدی استفاده کنید. برای اطلاع از نحوه استفاده از تگ‌ها به مقاله ” راهنمایی موتور جستجو با متا‌تگ‌ها(Meta Tags) ” مراجعه نمایید.

۳- اگر در صفحه از عکس استفاده کرده‌اید، در خصوصیت alt عکس‌ها، کلمات کلیدی خود را بصورت زیر استفاده کنید:

۴- از نوشتن کدهای css و JavaScript بطور مستقیم در صفحات وب، خودداری کنید بلکه این کدها را در فایل‌های جداگانه بنویسید و در فایل اصلی آنها را فراخوانی کنید.

۵- اگر بیش از یک کلمه کلیدی انتخاب کرده‌اید و به ازای هر کدام از آنها یک صفحه نوشته‌اید، همه این صفحات را با استفاده از لینک‌ها به هم متصل کنید و متن لینک‌ها را کلمات کلیدی خود قرار دهید. متن لینک‌ها نیز همانند نوشته‌های italic، bold و underline از اهمیت زیادی برخوردارند و موتورهای جستجو به آنها توجه زیادی می‌کنند.

اهمیت لینک‌های خارجی در افزایش رتبه یک سایت:
منظور از لینک‌های خارجی، لینک‌هایی است که از سایت‌های دیگر به سایت شما وجود دارد. هر چه تعداد این لینک‌ها بیشتر باشد رتبه سایت شما بیشتر خواهد بود. علت این امر این است که موتورهای جستجو اینگونه استدلال می‌کنند که چون تعداد زیادی لینک به این سایت وجود دارد بنابراین از نظر کاربران اینترنت این سایت دارای اهمیت زیادی است بنابراین موتورهای جستجو نیز رتبه سایت را بالا می‌برند.
موتور جستجوی گوگل رتبه سایت‌ها را براساس آیتمی بنام page rank بیان می‌کند که عددی بین ۱ تا ۱۰ می‌باشد. هر چه این عدد بزرگتر باشد رتبه سایت مربوطه بیشتر خواهد بود و همچنین هر چه تعداد لینک‌های خارجی یک سایت بیشتر باشد ranking آن سایت بیشتر می‌شود. این موضوع را قبلا در مقاله “چگونه امتیاز سایت خودمان را در گوگل افزایش دهیم؟” بررسی کردیم.

سایر تکنیک‌های موثر در افزایش رتبه سایت:
۱- موتور جستجوی گوگل تکنیکی را بیان می‌کند که به کمک آن می‌توانید تمام فایل‌هایی را که تمایل دارد توسط گوگل ایندکس شوند را در یک فایل، معرفی کنید. برای این منظور باید نقشه XML سایت (XML sitemap) را در یک فایل بنام sitemap.xml قرار دهید.

۲- فایلی به نام robos.txt در ریشه سایت خود قرار دهید. به کمک این فایل می‌توانید به موتورهای جستجو بگویید چه فایل یا پوشه‌هایی را ایندکس کنند و چه فایل یا پوشه‌هایی را نادیده بگیرند.

۳- در بررسی سایت‌های رقبا حتماً به این نکته توجه کنید که از چه سایت‌هایی به آن سایتها لینک وجود دارد. برای بررسی این مطلب می توانید در موتور جستجوی گوگل از دستور زیر استفاده کنید:
نام وب سایت مورد نظر :Link

4- هنگامی که یک domain ثبت می کنید، آن را در آدرس google.com/addurl.html اضافه کنید. پس از انجام این کار حدوداً ۳ هفته طول می کشد که گوگل domain شما را به بانک اطلاعاتی خود اضافه کند. برای اطمینان از اینکه domain شما به بانک اطلاعاتی گوگل وارد شده است یا نه در گوگل می توانید نام domain خود را جستجو کنید، اگر در نتیجه بازگشتی توسط گوگل، domain شما وجود داشت بدین معنا است که به بانک اطلاعاتی گوگل وارد شده است. البته یک راه بهتر برای domain شما در کمتر از یک هفته به بانک اطلاعاتی گوگل وارد شود این است که از یک سایت که رتبه بالایی در گوگل دارد به سایت خود یک لینک ایجاد کنید.

۵- یکی دیگر از راه های موثر در افزایش رتبه یک سایت، بکار بردن تالارهای و انجمن های گفتگو در وب سایت است. این کار باعث می شود که کلمات کلیدی مورد نظر شما به طرق مختلف در تالارهای گفتگو تکرار شود. علاوه بر این باعث می‌شود که بینندگان سایت و در نتیجه ترافیک سایت بالا رود.

۶- نوشتن مقاله در زمینه های مرتبط با فعالیت شما یکی از راه‌هایی است که به کمک آن می‌توانید لینک‌های خارجی سایت خود را افزایش دهید. دایرکتوری‌های زیادی در سطح جهان وجود دارد که شما می توانید مقالات خود را در آنها وارد کنید و یک لینک از سایت آنها به سایت خود ایجاد نمایید

گوگل از آغاز تا امروز

انام گوگل از تغییر googol که به معنای (عدد ۱۰ به توان ۱۰۰) می باشد گرفته شده است. گوگل تاثیر زیادی در دنیای وب داشته و می توان از آن به عنوان انقلاب بزرگ نوآوری در اینترنت یاد نمود. فعل “Google” نیز اخیرا در جولای سال ۲۰۰۶ به فرهنگ لغت Oxford English و Merriam Websterاضافه شده است. این فعل به معنای موتور جستجوی گوگل برای دریافت اطلاعات از اینترنت می باشد.
در حالی که ۱۰ سال پیش هیچ نامی از گوگل در دنیای وب وجود نداشت، ولی اکنون ابرقدرت بی چون و چرای موتورهای جستجو می باشد. گوگل اولین موتور جستجو در وب می باشد که ۵۴% سهام بازار را در اختیار داشته و یاهو با ۲۳% و MSN با ۱۳% در رتبه بعد می باشند. گوگل بیش از یک میلیارد جستجو کننده در روز دارد.
 گوگل چگونه آغاز به کار کرد؟
ژانویه سال ۱۹۹۶ دو دانشجوی ph.D به نام Larry Puge و Sergey Brin در دانشگاه Stand ford گوگل را به عنوان پروژه دانشجویی آغاز کردند. پروژه موتور جستجویی بود که بتواند روابط بین سایت ها را آنالیز کند و این روابط باعث بهینه شدن نتایج جستجو گردد. در آن زمان موتورهای جستجو بر مبنای تعداد دفعات مورد جستجو رتبه بندی می کردند. به این سیستم رتبه بندی “Back Rub” گفته شد، چرا که این سیستم Back links یا لینک های بازگشتی به سایت را برای تخمین اهمیت سایت بررسی می کند. البته یک موتور جستجوی کوچک به نام Rank Dex نیزقبلا از این استراتژی بهره برده بود. پیج و برین بعد از اطمینان از اینکه صفحاتی که بیشترین لینک مرتبط با موضوع را به خود دارند، دارای مرتبط ترین هستند، موضوع تز خود را آغاز کرده و موتور جستجوی خود را بنا نهادند.
در ابتدا موتور جستجو از وب سایت دانشگاه استند فورد استفاده می کرد و نام دامنه آن google.standford.edu بود. سپس دامنه google.com در در ۱۴ سپتامبر ۱۹۹۷ ثبت شده و شرکت Google Inc, نیزدر ۷ سپتامبر ۱۹۹۸ در گاراژ یک دوست درMenlo Park کالیفرنیا شروع به کار نمود.(لازم به ذکر است که این گاراژ اخیرا توسط گوگل خریداری شده و از جازبه های توریستی به شمار می رود). سرمایه شرکت نیز یک میلیارد دلار بود.
با رشد چشمگیر کاربران در اینترنت، گوگل نیز محبوبیت زیادی یافت. سادگی صفحه گوگل برای جستجوگران و طراحی مناسب آن برای کاربران بسیار جذاب بود. این نوع طراحی فقط همانند موتور جستجوی قدیمی AltaVista بوده که با قابلیت بالای جستجوی گوگل نیز ادغام شد.
در سال ۲۰۰۰ گوگل آغاز به فروش تبلیغات نمود که این نوع تبلیغات مطابق با کلمات کلیدی جستجو شده بود. این قابلیت برای افزایش بازدهی تبلیغات بسیار مناسب بوده و به خصوص که برمبنای hit توسط کابران بوده است. تبلیغات نیز به صورت متن بوده (بدون گرافیک) و دلیل آن نیز بالا نگه داشتن سرعت بالا آمدن صفحه بود چرا که گوگل پرسرعت ترین موتور جستجو در این زمینه به شمار می رود. کلمات کلیدی نیز از ترکیب تعداد کلیک ها و مقدار قیمتی که سفارش دهنده آگهی توانایی پرداخت را برای آن کلمه کلیدی اعلام کرده، قیمت گذاری و فروخته می شود. البته این مدل تبلیغات و پرداخت آن از سایت Goto.com که بعدها به Yahoo Search Marketing تغییر یافت سرچشمه گرفته بود.

P4P یعنی چه ؟

P4P کوتاه شده عبارت Pay-For-Placement می باشد. یعنی اینکه شما به موتور جستجو پول می دهید و موتور جستجو سایت شما را در نتایج بالاتر لیست می کند.البته فقط نتایج جستجوهایی که به زمینه کار شما مربوط باشد. معمولا اینگونه است که در ازای پرداخت مبالغ مشخص چند کلمه فروخته می شود و هرگاه کاربری عبارتی نزدیک به آن کلمات را جستجو کند سایت شما به عنوان پشتیبان مالی (sponsored) در صفحه نخست بصورت جداگانه لیست میشود.
دقت کنید ! برخی موتورهای جستجو همچون گوگل لینکهایی که با این روش ارتقا یافته اند را جداگانه لیست میکنند ولی برخی موتورها همچون یاهو پس از نتایج پولی، اقدام به لیست کردن نتایج طبیعی و پولی بصورت درهم می کنند. یعنی نتایج فهرست نتیجه جستجو، هم شامل سایتهای پرداخت کننده و هم سایتهایی که بصورت طبیعی بالاتر هستند.
هدف ما نیز رسیدن به جایگاه سایتهای پرداخت کننده ولی بصورت طبیعی(Organic) است.