پارسی جو رکورد زد/ پوشش بیش از ۴ میلیارد صفحه وب فارسی

به گزارش روز شنبه ایرنا از پروژه ملی موتور جستجوگر پارسی جو؛ امیرعلی خیراندیش، افزود:این میزان در مقایسه با رقم ۲ میلیارد صفحه تحت پوشش در مدت مشابه سال قبل، نشان از افزایش ۱۰۰ درصدی میزان پوشش نسخه جدید این جستجوگر دارد.
وی با اشاره به اینکه ۷۵ درصد صفحات وب فارسی بی ارزش هستند، افزود: در میان ۴ میلیارد صفحه فارسی شناسایی شده توسط جستجوگر پارسی‌جو، نزدیک به ۱ میلیارد آن‌، حدود ۲۵ درصد، ارزشمند بوده و بقیه صفحات تکراری یا اسپم بوده‌ که نشان از ضعف تولید محتوی در زبان فارسی دارد.
خیراندیش ادامه داد: با توجه به روند جهان در موضوع تولید محتوی، افراد جامعه در هر شغل یا حرفه ای که هستند می توانند باتوجه به دانسته های علمی و کاربردی خود، به تولید محتوی معتبر و موثق در راستای آگاهی رسانی تخصص خود اقدام کنند که البته این مبحث باعث توسعه کسب و کار آنها نیز خواهد شد.
وی با بیان اینکه حجم بالای صفحات بی ارزش، دو چالش بزرگ را پیش روی پارسی جو در پوشش صفحات وب فارسی قرار داده است افزود: این جستجوگر ملی برای کشف صفحات وب مفید فارسی باید تعداد زیادی از صفحات را شناسایی کند در حالی که تنها ۲۵ درصد آنها قابل استفاده برای کاربران است که همین عامل علاوه بر اتلاف زمان، فشار زیادی بر سرورها وارد می کند، ضمن اینکه پارسی جو برای حفظ و ارتقای کیفیت خود، ملزم به ارتقای مداوم هوش مصنوعی خود در بخش خزش، نمایه‌سازی و رتبه‌بندی است.
مدیراجرایی پارسی‌جو ادامه داد: به‌کارگیری فناوری‌های نوین، درک صحیح از زبان فارسی، تکنیک های موثر در حذف صفحات تکراری و اسپم و رعایت‌ تناسب‌های فرهنگی از جمله ویژگی های بی بدیل جستجوگر پارسی جو و تسلط آن در حوزه وب فارسی است.
وی افزود: استفاده بیش از ۱۵ سرویس متنوع برای ارتقاء کیفیت نتایج جستجو، پوشش ۴ میلیارد سند فارسی، قدرت پاسخگویی به میلیون ها پرس‌و‌جو در روز ، استفاده از خزشگر هوشمند با پوشش میلیاردها سند از جمله ویژگی‌های جستجوگر ملی پارسی جو است.
نسخه اول جویشگر بومی پارسی جو در سال ۷۹ با توانمندی یک میلیون جستجو در وب ایجاد شده و پس از چندین سال تلاش در آبان ماه سال ۹۴ نسخه پنجم این جویشگر رونمایی شد که امکان پوشش بیش از یک میلیارد صفحه را برای فارسی زبانان فراهم کرده است.