اسامی پروژه‌ها

تهیه دانشنامه آزاد مبتنی بر دانشنامه عمومی دانش‌گستر

تهیه دانشنامه آزاد مبتنی بر دانشنامه عمومی دانش‌گستر
توضیحات:

در جهان امروز که افراد نیازمند دریافت اطلاعات درباره امور مختلف جاری در زندگی روزمره خود هستند، وجود یک منبع معتبر علمی که ایشان را در دسترسی به داده‌های معتبر، قابل اتکا و تاییده شده یاری رساند بیش از هر زمان دیگری ضرورت یافته است. از سوی دیگر، با گسترش فضاهای مجازی و رسانه‌های اینترنتی، این داده‌ها از منابع گسترده ای در اختیار کاربران قرار می‌گیرد که در بسیاری موارد آگاهی یافتن از منبع و روایی اطلاعات موجود برای کاربران ناممکن است و از این رو، احتمال آن می‌رود که افراد به طور همزمان در معرض اطلاعات درست و نادرست قرار گیرند. همچنین در حال حاضر وبسایت‌های بسیاری وجود دارند که به ارائه اطلاعاتی از این دست مبادرت می‌ورزند، اما این منابع عمدتا در خارج از کشور طراحی و تنظیم می‌شوند و عمدتا از خصلت بومی بودن بی بهره اند و از این حیث می‌توانند حیات فرهنگی شهروندان را تحت تاثیر خود قرار دهند. همه اینها حاکی از ضرورت ایجاد یک منبع معتبر برای ارائه خدمات به شهروندان است؛ منبعی که بتواند از سویی اطلاعات تاییده‌شده و مستند و معتبر را در اختیار مخاطبانش قرار دهد، و از سوی دیگر ناظر بر فرهنگ ملی و بومی و متناسب با هویت و نیازهای زندگی روزمره ایرانی-اسلامی طراحی و تدوین شده باشد. علاوه بر ضرورت فوق، در حال حاضر کشور ما در ساختار جمعیتی خود از تحصیل‌کردگان و صاحب نظران بسیاری در حوزه‌های مختلف دانش بهره‌مند است که همین امر پتانسیل کم‌نظیری را در راستای تولید و ترویج دانش در اختیار می‌گذارد. لیکن تاکنون بستری مناسب و معتبر و در عین حال مردم پایه وجود نداشته است تا بتواند با جلب همکاری‌ها و مشارکت این صاحب نظران، یک منبع منسجم و غنی از داده‌ها و معلومات را در سطح ملی ایجاد کند. ایجاد چنین منبعی، هم شهروندان را در دستیابی به اطلاعات مورد نیازشان یاری می‌کند و هم با جلب همکاری و کنشگری علمی خود ایشان در فرآیند تولید دانش، همزمان موجبات ارتقا و بالندگی فرهنگی و تقویت وحدت ملی را فراهم می‌آورد. لذا وجه دیگر ضرورت ایجاد یک منبع معتبر اطلاع رسانی، دقیقا به همین جذب و استفاده از مشارکت‌های مردمی برای ایجاد یک منبع علمی معتبر و نهادینه سازی دانش‌های پراکنده موجود در هیات یک کلیت منسجم و روا باز می‌گردد.

بازه اجرای پروژه
۱۳۹۵/۱۲/۰۸ الی۱۳۹۶/۱۲/۰۸
دستاورد:
فاز اول: ۱- لیست موضوعات و برچسب‌های مربوط به مقالات ۲- ساختار کاربران داخلی و نقش هر یک از آنها ۳- سیکل کاری مربوط به تهیه، ویراستاری و انتشار مقالات ۴- لیست فیلدهای لازم برای هر یک از موضوعات تعیین شده ۵- لیست مدل‌های کسب و کار مد نظر به همراه توضیحات لازم ۶- انتشار حداقل ۲۰۰ مقاله جدید ۷- ارائه گزارش اتمام فاز اول فاز دوم: ۱- مقالات گروه بندی شده ۲- Info Box تکمیل شده برای قریب به ۵۰۰۰ مقاله مورد نیاز ۳- تبدیل جداول موجود عکسی به متنی ۴- انتشار حداقل ۴۰۰ مقاله جدید ۵- ارائه گزارش اتمام فاز دوم فاز سوم: ۱- انتشار اطلاعیه ۲- تعیین وضعیت ارجاعات درون متنی و برون متنی در تمامی مقالات ۳- گزارش انجام کار ۴- مقالات گروه بندی شده ۵- Info Box تکمیل شده برای ۵۰۰۰ مقاله مورد نیاز باقیمانده
هدف:
• ایجاد یک دانشنامه آزاد، عمومی، فراگیر و رایگان در سطح ملی: امکان دسترسی آزاد و جامع به هر نوع از اطلاعات مورد نیاز افراد در سطوح مختلف، با هدف ارتقاء سطح دانش، رسالت اصلی دانشنامه آزاد ابوریحان است. مخاطب دانشنامه عموم مردم فارسی زبان است. بیان مطالب به صورت ساده و در حد متوسط درک اجتماعی است. دسترسی به دانشنامه آسان و بدون هزینه است. از لحاظ گستره مطالب کاملا عمومی و غیرتخصصی و از لحاظ محتوا برآیند افکار عمومی جامعه و به دور از پیش‌داوری و قضاوت‌های سیاسی، قومی و طائفه‌ای خواهد بود. • ایجاد یک مرجع شناخته شده و عمومی (برندسازی): ساختن یک مرجع شناخته‌شده و قابل اطمینان، هدف دیگر دانشنامه آزاد است. برنامه‌ریزی و اقدامات چنان باید باشد که در اعتماد و اعتبار این دانشنامه خللی وارد نشود. هدف ایجاد یک سامانه برای جلب مشارکت عمومی در تولید محتوا و ارتقاء سطح دانش است. امکان ایجاد مقالات، به صورت آزاد و غیر متمرکز، در اختیار کاربران است. • ارائه خدمات خاص اطلاعاتی و تحلیلی: تحلیل اطلاعات موجود در دانشنامه و نوع تعاملات کاربران با این اطلاعات، به عنوان منبعی برای ارائه خدمات خاص برای کاربران خاص، از جمله اهداف دیگر این دانشنامه است.

توسعه آزمایشگاه ارزیابی خدمات وب (وب آزما)

توسعه آزمایشگاه ارزیابی خدمات وب (وب آزما)
توضیحات:

با گسترش روزافزون خدمات بومی ارائه شده در فضای مجازی، ارزیابی، کیفیت سنجی و رتبه‏بندی این خدمات با هدف ارتقاء توانمندی‏های آنها و نیز شناخت نقاط ضعف و قوت هریک در مقایسه با دیگران و نیز رقبای خارجی ضرورتی ویژه‌ یافته است. انجام این مهم در کنار حمایت عادلانه از این خدمات از جمله رسالت‌های خطیری است که می‌تواند توسط بخش دولتی تحقق یابد. بدین منظور، «پژوهشگاه ارتباطات و فناوری اطلاعات» در سال ۱۳۹۴ اقدام به تاسیس آزمایشگاه «ارزیابی و اعتبارسنجی خدمات وب» نموده است. این آزمایشگاه با اولویت قراردادنِ ارزیابی خدمات تحت وب بومی و با تمرکز بر طرح جویشگر، تحت نام «وب‏آزما» آغاز به کار کرده است.
در ابتدای راه‏اندازی آزمایشگاه، تمرکز بر ارزیابی خدمات جویش متنی، صوتی، تصویری و ویدئویی و نیز مترجم‌های ماشینی بوده است. اما هدف‏گذاری اصلی وب‏آزما، توسعه همگام و هماهنگ با خدمات تحت حمایت طرح جویشگر بومی، به گونه‏ای است که امکان ارزیابی و کیفیت‏سنجی دستاوردها و خروجی‌های تک‏تک این خدمات در آزمایشگاه امکان‏پذیر باشد. همچنین این آزمایشگاه باید بتواند اهداف کلی طرح را اندازه‌گیری نماید. این هدف‏گذاری، نیاز به توسعه مداوم وب‏آزما را به خوبی نشان می‏دهد.

بازه اجرای پروژه
۱۳۹۵/۱۱/۰۹ الی۱۳۹۶/۱۱/۰۹

سامانه تحلیل و جستجوی خبر ( هما پلاس )

سامانه تحلیل و جستجوی خبر ( هما پلاس )
توضیحات:

تحلیل ۵۰ سایت برتر ایران در سایت الکسا حاکی از این است که حدود ۳۰ درصد از این ۵۰ سایت پرترافیک در ایران سایتهای خبری هستند. این موضوع بیانگر میزان اهمیت این سایتهای خبری و استفاده زیاد کاربران ایرانی از این سایتها است.لذا یکی از سرویسهای جذاب و پرکاربرد برای کاربران که میتواند یک مزیت رقابتی برای جویشگر بومی در مقایسه با محبوبی مانند گوگل باشد، خدمات مبتنی بر اخبار میباشد. با توجه به وجود سرویسدهندهگان خبری متعدد خارجی و داخلی و همچنین حجم زیاد اخبار مربوط به موضوعات خبری مختلف، لذا برای پاسخگویی به نیازهای اطلاعاتی کاربران در رابطه با اخبار نیازمند طراحی و پیادهسازی سامانه‌های تحلیل و جستجوی خبری میباشیم.

بازه اجرای پروژه
۱۳۹۵/۱۱/۰۶ الی۱۳۹۶/۱۱/۰۶

تدوین مدل‌ها و راهکارهای توسعه زیست‌بوم کسب‌وکارها در طرح جویشگر بومی

تدوین مدل‌ها و راهکارهای توسعه زیست‌بوم کسب‌وکارها در طرح جویشگر بومی
توضیحات:

در راستای تحقق اهداف طرح جویشگر بومی، صرفا توجه به جنبه‌های فنی ارائه سرویس‌ها نمی تواند تضمین کننده موفقیت آن باشد، چرا که عدم توجه به جنبه‌های موفقیت کسب و کار هر یک از فراهم کنندگان خدمات و تعاملات بین آنها در یک زیست بوم می‌تواند منجر به عدم استمرار و بقا طرح گردد. از این رو در این پروژه کاربردی هدف ارائه خدمات مشاوره در خصوص تعیین مدل سنجش و ارزیابی موفقیت کسب و کارها هم در سطح زیست بوم و هم در سطح کسب و کار جهت تعیین راهبردها و راهکارهای مناسب برای ارتقا وضعیت کسب و کارها در راستای تحقق اهداف طرح می‌باشد. لازم به ذکر است برای دستیابی به این اهداف نیاز است با همکاری تیم پژوهشگاه جنبه‌های مربوط به ارزش گذاری، مدل اقتصادی و توسعه استارتاپ‌ها در طرح جویشگر نیز مورد بررسی قرار گیرد.
از این رو انجام این پروژه می‌تواند از یک طرف به بخش خصوصی در رشد و توسعه کسب و کار شان در طرح جویشگر بومی کمک نماید و از طرف دیگر به عنوان یک بازوی مشورتی به مدیریت طرح جویشگر بومی و سیاستگذار دولتی یاری می‌رساند

بازه اجرای پروژه
۱۳۹۵/۰۵/۱۲ الی۱۳۹۵/۱۰/۱۲

توسعه سکوی اعتماد

توسعه سکوی اعتماد
توضیحات:

هدف از انجام این پروژه تحقق امنیت جویشگر و صیانت حریم خصوصی به‌منظور حفظ منافع ملی در رایافضا و توسعه محتوای بومی و اشاعه فرهنگ ارزش‌مدار در رایا فضا هست؛ و ضرورت انجام آن این است که عدم وجود خدمات مناسب و باکیفیت مطلوب در بسیاری از حوزه‏های فناوری اطلاعات در سطح کشور که موجب استفاده سازمان‏ها از خدمات مشابه خارجی می‏گردد.

بازه اجرای پروژه
۱۳۹۶/۰۳/۲۳

ایجاد گراف دانش زبان فارسی

ایجاد گراف دانش زبان فارسی
توضیحات:

هدف از تعریف این دستاورد، رسیدن به گراف دانشی است که محتوای اطلاعاتی آن به زیان فارسی تهیه‌شده باشد تا بتواند در سامانه‌ها و خدمات وب فارسی پاسخگوی نیاز اطلاعاتی کاربران به زبان فارسی باشد. همچنین داشتن رابطه با پایگاه‌های دانش آزاد موجود در زبان‌های دیگر نیز موردتوجه هست. بنابراین منظور از گراف دانش زبان فارسی، پایگاه دانشی است که محتوای آن به زبان فارسی باشد و محتواهای سایر زبان‌ها مدنظر نیست. 

 

بازه اجرای پروژه
۱۳۹۵/۰۴/۲۷ الی۱۳۹۶/۰۴/۲۷
دستاورد:
فاز اول: ۱. API مناسب برای دریافت ورودی (متن) و ارائه‌ی موجودیت‌ها ۲. سند خروجی تحقیقات اولیه شامل بررسی استخراج آزاد اطلاعات، یادگیرنده بی‌پایان زبان (NELL)، چالش‌های کلی، چالش‌های زبان فارسی، پیش‌نیازها ۳. انتخاب یک پایگاه اطلاعاتی مناسب و راه‌اندازی اولیه با داده‌های تست. این بخش حداقل شامل بررسی DBpedia و BaseKB و FreeBase و RelFinder و ReVerb و تست عملکردی آن‌ها خواهد بود. ممکن است نتایج تست مستقیما توسط تیم پژوهشکر استخراج نشده باشد و بر کارها و مقالات دیگران تکیه شود. ۴. سند مقایسه ابزارهای موجود. از جمله پایگاه‌های دانش موجود (Freebase و…) و سامانه‌ها (KnowItAll، ReVerb، NELL و…) ۵. کامپوننت‌های استخراج شده از سایر ابزارها و گزارش اولیه. برای مثال کتابخانه‌ها‌ی برچسب‌زنی ادات سخن (کار خانم سراجی، ابزار هضم تیم سبحه و..)، استخراج موجودیت‌های نامدار (کار آقای عسگری و..)، تجزیه‌وابستگی (کار آقای خلاش و..)، تجزیه نحوی کم‌عمق (ابزار هضم تیم سبحه)، تشخیص هم‌ارجاع‌ها و… ۶. مکانیسم‌های مناسب برای سیستم اصلی، نحوه ارزیابی و معیارهای ارزیابی. معیارهای ارزیابی به یکی از چهار روش ارائه شده در متن (احتمالا روش دوم) ۷. لیست صفحات متنی با کیفیت. به ترتیب الویت؛ صفحات ویکی پدیا، سایت‌های خبری، اسناد با جداول و منابع استخراج اطلاعات، وی‌سایت‌های رسمی، وبلاگ‌ها و اسناد دیگر ۸. گزارش طراحی ساختار پروژه ۹. سند گزارش خروجی فاز دوم: ۱. نسخه آزمایشی ابزار استخراج اطلاعات ۲. دادگان اولیه شامل موجودیت‌ها و سه‌تایی‌ها ۳. نسخه‌ اولیه هر دو سامانه‌ی ساخت گراف دانش و پرس و جو روی گراف دانش و ارتباط بین آن‌ها به شکل مناسب ۴. پایگاه دانش اولیه شامل خروجی اولیه ۵. مجموعه پرس‌وجوهای هدف. در حدود ۵۰ الگوی از پیش تعیین شده برای پرس و جوها در نظر گرفته می‌شود و پرس و جو به فرمت ساخت‌یافته (مشابه SPARQL) در می‌آید. ۶. واسط کاربری ۷. سند نحوه ارزیابی سیستم. برای استخراج متن خام، ارزیابی به یکی از چهار روش ارائه شده در بخش روالهای تایید صحت و کیفیت خروجیهای پروژه هدف ما دقت بالای ۷۰ درصد است. ۸. پیشنهادهای مربوط به رفع تناقض‌ها و مشخص کردن روش نهایی ۹. نسخه آزمایشی سیستم ارزیابی ۱۰. طرح مورد نظر از هستان شناسی ۱۱. سیستم پالایش اولیه. و ساز و کار مناسب برای تأیید سه‌تایی‌ها توسط افراد خبره. ۱۲. دادگان اولیه به صورت پالایش شده (در حدود ۷۰۰ کلاس، ۳ هزار موجودیت‌های غیر نامدار و ۵۰ هزار رابطه (مجموع روابط is و غیر is). تعداد موجودیت‌های نامدار در حدود ۲۵ هزار خواهد بود.) ۱۳. رابط کاربری سیستم نظارت و تصحیح سه‌تایی‌ها توسط افراد خبره بر اساس مکانیزم‌های پالایش ۱۴. لیست موجودیت‌ها و روابط پرکاربرد فاز سوم: ۱. محصول و داده نهایی ۲. سیستم بازخورد کاربران (محصول نهایی) ۳. هستان‌شناسی پالایش شده توسط خبره‌ها و تایید اتصال بیرونی به مفاهیم فارس‌نت (با دقت ۹۰ درصد). تعداد این ارتباطات حداقل در حدود ۱۰ هزار عدد است. ۴. سامانه نهایی پالایش اطلاعات ۵. سیستم ارزیابی و گزارش ارزیابی نهایی ۶. مستندات نهایی ۷. سامانه نهایی ۸. سند ارزیابی ۹. هستان‌شناسی نهایی شامل ۶۰۰ الی ۱۰۰۰ کلاس و ۸۰۰ هزار رابطه (مجموع روابط is و غیر is). تعداد موجودیت‌های نامدار در حدود ۲۰۰ هزار خواهد بود. ۱۰. گزارش داخلی ۱۱. دادگان نهایی
هدف:
به طور خلاصه، اهداف اصلی پروژه گراف دانش را می‌توان در موارد زیر خلاصه کرد: • ایجاد گراف دانش که امکان ذخیره‌سازی، یکپارچه‌سازی و پاسخ‌گویی به پرس‌و‌جو را فراهم نماید. • بهبود مربوط بودن نتایج موتورهای جستجوی بومی • جمع‌آوری مهم‌ترین موجودیت‌های فارسی در وب و ارتباط میان آن‌ها • توسعه ابزارهای پردازش معنایی زبان فارسی برای استخراج مفاهیم از دانش موجود در وب • ایجاد بستری جهت پرس‌و‌جوهای معنایی • ارائه اطلاعات مفید و یکپارچه‌ای از مهم‌ترین موجودیت‌های فارسی به کاربران بدون مراجعه به سایت‌های مختلف • ورود به عرصه فناوری‌های جدید مرتبط با وب معنایی مانند RDF‌، OWL، SPARQL و…

توسعه ساخت تجاری‌سازی سامانه ترجمه ماشینی انگلیسی به فارسی (مترجم پارس)

توسعه ساخت تجاری‌سازی سامانه ترجمه ماشینی انگلیسی به فارسی (مترجم پارس)
توضیحات:

با توجه به اینکه زبان انگلیسی به عنوان عمومی‌ترین زبان علمی جهان مورد استفاده اکثر محققان است و بیشتر مستندات علمی، پژوهشی، خبری و…در دنیا به این زبان تولید شده و می‌شوند، ترجمه سریع و صحیح از جملات انگلیسی به عنوان یک نیاز عمومی در کشور وجود دارد. مترجم پارس طی ۱۵ سال گذشته سعی نموده است با ارائه سرویس‌های مختلف برخط و برون خط به حل این مشکل اقدام نماید. با توجه به اینکه کیفیت ترجمه ماشینی هنوز فاصله زیادی تا ترجمه انسانی دارد لازم است تا با سرمایه گذاری روی سرویس موجود، کیفیت آن ارتقاء یافته و خدمات بهتری را به کاربران فارسی زبان ارائه نماید.ضمنا با توجه به تغییر رویکرد بازار در چند سال گذشته و افزایش استفاده از سرویس‌های برخط و ابزارهای همراه لازم است تا ضمن ارتقای سرویس مترجم پارس، امکان استفاده از آن در ابزارهای همراه نیز فراهم شود.همچنین با توجه به اینکه گسترش مستمر سرویس نیازمند حضور تجاری بهتر در بازار و کسب درآمد از بازار می‎باشد، عرضه سرویس تجاری با امکانات خاص نیز در برنامه کاری قرار گرفته است.

بازه اجرای پروژه
۱۳۹۵/۰۷/۲۶ الی۱۳۹۶/۰۷/۲۶

ارتقا سامانه ترجمه ماشینی دوسویه (فارسی-انگلیسی) با ترکیب دو سیستم آماری و قاعده مند

ارتقا سامانه ترجمه ماشینی دوسویه (فارسی-انگلیسی) با ترکیب دو سیستم آماری و قاعده مند
توضیحات:

اهداف عملیاتی انجام این پروژه‌ها توسعه سامانه‌های ترجمه ماشینی از منظر: (افزایش کیفیت -افزایش تعداد کاربران -افزایش دامنه‌های کاربری -چندزبانگی -ایجاد مدل تجاری-درآمد زایی)
تولید محتوا متناسب با خط و زبان فارسی و توسعه ابزارهای پایه و تکمیلی است.

بازه اجرای پروژه
۱۳۹۵/۱۲/۰۸ الی۱۳۹۶/۱۲/۰۸

تولید بانک درختی سازه‌ای فارسی به همراه نرم‌افزار تجزیه‌گر نحوی زبان فارسی (دانشگاه تهران )

تولید بانک درختی سازه‌ای فارسی به همراه نرم‌افزار تجزیه‌گر نحوی زبان فارسی (دانشگاه تهران )
توضیحات:

با حجم مناسب در زبان فارسی وجود نداشته و اجرای این پروژه میتواند کمک شایانی به امر پردازش زبان فارسی نماید. بانک‌های درختی در دو نوع وابستگی و سازهای میباشد در این پروژه در ابتدا به دنبال توسعه دادگان لازم می‌باشیم. در حال حاضر پیکره دادگان با ۰۳۳۳۳ جمله از نوع وابستگی موجود می‌باشد.. با توجه به اینکه این مجموعه قرار است که به عنوان دادگان برای ساخت بانک درختی سازه ای مورد استفاده قرار گیرد و جامعیت و تنوع لازم را برای بانک درختی داشته و نماینده خوبی از زبانفارسی باشد لازم است اصلاحات مورد نیاز در آن درنظر گرفته شود. توسعه بانک درختی از نوع سازه ای در دو مرحله توسعه بانک درختی سازه ای و مرحله بررسی و اصلاح یا تکمیل بانک درختی انجام میگیرد.

بازه اجرای پروژه
۱۳۹۵/۰۷/۱۰ الی۱۳۹۶/۰۷/۱۰

تولید بانک درختی سازه‌ای فارسی به همراه نرم‌افزار تجزیه‌گر نحوی زبان فارسی (خواجه نصیر)

تولید بانک درختی سازه‌ای فارسی به همراه نرم‌افزار تجزیه‌گر نحوی زبان فارسی (خواجه نصیر)
توضیحات:

با حجم مناسب در زبان فارسی وجود نداشته و اجرای این پروژه میتواند کمک شایانی به امر پردازش زبان فارسی نماید. بانک‌های درختی در دو نوع وابستگی و سازهای میباشد.
در این پروژه در ابتدا به دنبال توسعه دادگان لازم می‌باشیم. در حال حاضر پیکره دادگان با ۰۳۳۳۳ جمله ازنوع وابستگی موجود می‌باشد.. با توجه به اینکه این مجموعه قرار است که به عنوان دادگان برای ساخت بانک درختی سازه ای مورد استفاده قرار گیرد و جامعیت و تنوع لازم را برای بانک درختی داشته و نماینده خوبی از زبان فارسی باشد لازم است اصلاحات مورد نیاز در آن درنظر گرفته شود. توسعه بانک درختی از نوع سازه ای در دو مرحله توسعه بانک درختی سازه ای و مرحله بررسی و اصلاح یا تکمیل بانک درختی انجام میگیرد.

بازه اجرای پروژه
۱۳۹۵/۰۷/۱۰ الی۱۳۹۶/۰۷/۱۰

تأمین سخت‌افزاری مرکز داده اینترنتی، پهنای باند و سرویس و نگهداری

تأمین سخت‌افزاری مرکز داده اینترنتی، پهنای باند و سرویس و نگهداری
توضیحات:

به منظور اجرای طرح جویشگر بومی، تامین سخت افزارهای مورد نیاز برای مرکز داده اینترنتی، فراهم آوری پهنای باند مورد نیاز برای سرویس‌های طرح جویشگر و همچنین نگهداری این منابع امر بسیار مهمی می‌باشد، لذا در این پروژه به ارائه سخت افزارهای مورد نیاز برای طرح جویشگر، پیکربندی و هم بندی مراکز داده اصلی و پشتیبان، طراحی، ایجاد، راه اندازی، تکمیل و توسعه زیرساخت‌های فعال و غیرفعال مراکز داده اصلی و پشتیبان و همچنین فراهم آوری پهنای باند شبکه مورد نیاز برای طرح و نهایتا نگهداری، پشتیبانی و حفظ تداوم ارائه سرویس مراکز داده پرداخته می‌شود.

بازه اجرای پروژه
۱۳۹۳/۱۱/۲۸ الی۱۳۹۶/۱۱/۲۸
دستاورد:
۱-پهنای باند مورد نیاز برای موتور جستجو (با انعقاد قرارداد سرویس خریداری‌شده است) ۲- ۲۰۰ سرور سوپر میکرو (مناقصه برگزار و خرید انجام و تحویل پروژه شده است) ۳-مرکز داده اینترنت تجهیز شده با SAN(مناقصه برگزار خرید انجام و تحویل‌شده است) ۴-مرکز داده تجهیز شده با سوئیچ‌های nexus (مناقصه برگزار خرید انجام و در حال راه‌اندازی است) ۵-پست برق (پست برق+ راه‌اندازی دیزل+راه‌اندازی ups انجام و تحویل‌شده است) ۶- سرویس و نگهداری تجهیزات مرکز داده
هدف:
هدف از اجرای این پروژه، فراهم آوری سخت افزارهای مور نیاز برای مرکز داده اینترنتی و همچنین پهنای باند مناسب به منظور اجرای پروژه‌های طرح جویشگر بومی است و پس از فراهم آوری این سرویس‌ها، نگهداری مناسب آنها نیز در این پروژه مورد توجه می‌باشد.

بازاریابی مبتنی بر جویشگر (سکوی تبلیغات هوشمند)- هما پلاس

بازاریابی مبتنی بر جویشگر (سکوی تبلیغات هوشمند)- هما پلاس
توضیحات:

هدف از محصول پیشنهادی، ارائه دو سرویس هوشمند برای فراهم سازی بستر تبلیغات در موتور جستجو (شبیه به AdWords گوگل) و تبلیغات در وبسایت‌های نمایش دهنده (شبیه به AdSense گوگل) است. در کسب و کار تبلیغات آنلاین سه عامل، تاثیرگذار هستند. ۱) آگهی‌دهنده (مشتری): فردی که قصد تبلیغات و بازاریابی دارد. ۲) نمایش‌دهنده (موتور جستجوگر یا وب‌سایت‌ها): فردی که دارای وب‌سایتی است که می‌خواهد از طریق نمایش آگهی، کسب درآمد کند. ۳) سرویس پیشنهادی: بستری برای رساندن آگهی دهنده به نمایش دهنده را فراهم می‌کند، به عبارت دیگر بستری فراهم می‌کند که تبلیغات آگهی‌دهنده را گرفته و بر اساس الگوریتم‌های هوشمند و هدف گذاری‌های مشخص شده برای آگهی، آن را به نمایش‌دهنده (موتور جستجو یا وب سایت‌ها) ارسال کند.

بازه اجرای پروژه
۱۳۹۵/۰۹/۱۵ الی۱۳۹۶/۰۹/۱۵

تبلیغات (بازاریابی) هوشمند مبتنی بر جویشگر بومی

تبلیغات (بازاریابی) هوشمند مبتنی بر جویشگر بومی
توضیحات:

تبلیغات از مهم‌ترین منابع درآمدی در فضای کسب‌وکار موتور جستجو و خدمات جانبی آن محسوب می‌گردد که می‌تواند رضایت کاربران و همچنین منفعت کسب‌وکارها از موتور جستجو را افزایش دهد. هوشمند سازی این فرایند علاوه بر آنکه به شکل مستقیم در درآمدزایی مؤثر خواهد بود، در انتخاب به‌موقع و مناسب تبلیغات در راستای افزایش درآمد موتور جستجو کمک می‌نماید. همچنین شرکت‌ها نیز به دنبال خدمات مشاوره برای گسترش اعتبار نشان تجاری آن‌ها با توجه رتبه آن‌ها در موتور جستجو خواهند بود که منبع درآمدزایی غیرمستقیم برای جویشگرها خواهد بود.

بازه اجرای پروژه
۱۳۹۵/۰۷/۱۰ الی۱۳۹۶/۰۷/۱۰

توسعه جویشگر متنی( پاز اندیش)

توسعه جویشگر متنی( پاز اندیش)
توضیحات:

امروزه فضای مجازی جزء جدایی ناپذیر زندگی شهروندان هر کشور محسوب می‌شود. بسیاری از فعالیت‌های روزانه افراد از طریق ابزارهای موجود در فضای مجازی و یا داده‌های موجود در آن انجام می‌گیرد. یافتن و خرید کالاهای موردنیاز، انجام امور مالی و بانکی و حتی تفریح و سرگرمی ازجمله اموری است که کاربران با استفاده از فضای مجازی انجام می‌دهند. از طرفی با توجه به حجم و تنوع گسترده اطلاعات و سرویس‌های موجود در فضای مجازی، کاربران برای یافتن موارد مدنظر خود ناگزیرند از جستجوگرها استفاده نمایند. همچنین آمارها نشان می‌دهند که بیش از ۸۰% کاربران شبکه وب، اطلاعات، سرویس‌ها و سایت‌های موردنیاز خود را از طریق موتورهای جستجو شناسایی می‌کنند. به عبارت دیگر، موتورهای جستجو درگاه ورود کاربران به شبکه وب محسوب می‌شوند. وجود سه موتور جستجو (گوگل، بایدو و یاهو) درمیان ۵ سایت پر بازدید دنیا، اقبال کاربران به این ابزار را به خوبی نشان می‌دهد. موتورهای جستجو، با استفاده از داده‌های وب و کاربران، قادر هستند به سادگی رفتار کاربران در فضای مجازی را کنترل کرده و جهت‌دهی نمایند. در این میان، جستجوهای متنی، بیشترین سهم جستجوهای کاربران را به خود اختصاص داده‌اند. لذا بهره‌مندی از یک موتور جستجوی متنی که نیازهای کاربران را در فضای وب پوشش دهد، برای مسئولین هر جامعه یک نیاز ضروری محسوب می‌شود. چراکه می‌توانند با استفاده از آن، علاوه‌بر مدیریت رفتار و افکار کاربران خود در فضای مجازی، از درز اطلاعات آن‌ها نیز جلوگیری نمایند. علاوه‌بر این، درصورت ارائه سرویس با کیفیت، موتورهای جستجو، بستر مناسبی برای کسب‌وکار تبلیغات در فضای وب و کسب درآمد نیز محسوب می‌شوند.

بازه اجرای پروژه
۱۳۹۵/۰۵/۲۵ الی۱۳۹۵/۱۱/۲۵
دستاورد:
فاز اول: ۱- برنامه رشد برند و انجام اصلاحات مدنظر برنامه برندینگ ۲- واسط کاربری بهبود یافته از سرویس‌های موجود ۳- واسط کاربری موبایل برای سرویس‌های وب فاز دوم: ۱- ماژول تشخیص صفحات اسپم ۲- ماژول تشخیص صفحات مرده و فیلترشده ۳- ماژول پردازش پرس‌وجو ۴- الگوریتم‌های بهبود یافته برای رتبه‌بندی مبتنی بر گراف وب ۵- الگوریتم‌های بهبود یافته برای رتبه‌بندی مبتنی بر محتوا ۶- ماژول ارزیابی و بهینه‌سازی خودکار پارامترهای رتبه‌بندی ۷- زیرساخت‌های پردازش گراف وب ۸- سیستم پاسخ هوشمند ۹- ماژول‌های یکپارچه رتبه‌بندی فاز سوم: ۱- معماری سامانه و شناسایی واحدها و فرآیندهای ناکارآمد و غیر بهینه ۲- معماری کلان سامانه و بازنویسی / بهینه‌سازی بخش‌های ناکارآمد ۳- قسمت‌های جداگانه جستجو و تولید نتایج در نمایه ۴- تکرار (replica) برای بخش‌های حساس و پرفشار سامانه مانند نمایه‬‬ ۵- نرم‌افزارهای زیرساختی متن‌باز‬‬ به روز رسانی شده ۶- قابلیت نهان‌سازی برای پاسخ سریع به پرس‌وجوهای متناوب ۷- قابلیت نهان‌سازی در سطح نمایه برای افزایش سرعت بازیابی صفحات مهم‬‬ ۸- سامانه جامع پایش وضعیت بخش‌های مختلف سامانه فاز چهارم: ۱- پشتیبانی از فرمت‌های متداول داده‌ای ۲- ماژول حذف نتایج تکراری ۳- قابلیت پشتیبانی از encodingهای متداول در وب‬‬ ۴- سیستم آماده‌سازی نتایج جستجو ۵- سامانه پیشنهاد پرس‌وجو و اصلاح پرس‌وجو ۶- سامانه جستجوی پیشرفته با عملگرهای محبوب و متداول‬‬ ۷- سرویس‌های جدید فاز پنجم: ۱- خزشگر جدید برای رفع اشکالات و دست‌یابی به کارایی و کیفیت مدنظر‬‬ ۲- واحد تعیین سیاست خزش وب‬‬ ۳- خزشگرهای بسته‌ای و جریانی‬‬ به صورت یکپارچه شده‬‬
هدف:
هدف از این پروژه، توسعه کمی و کیفی خدمات این سامانه و همچنین هوشمند سازی این محصول در درک نیاز کاربر و ارائه نتایج متناسب با آن می‌باشد. به عبارت دیگر هدف از این پروژه طراحی و پیاده‌سازی یک موتور جستجوی مستقل و کارا جهت مرتفع نمودن نیاز کاربران فارسی زبان در حوزه‌های مختلف جهت جستجوی محتوای فارسی و انگلیسی وب است به نحوی که بتواند تمامی مستندات الکترونیکی موجود به زبان فارسی و اسناد مهم و جذاب به زبان انگلیسی را نمایه‌سازی نموده و خدمات جستجو ارائه نماید.

توسعه جویشگر متنی (پارسی جو)

توسعه جویشگر متنی (پارسی جو)
توضیحات:

با توجه به اهمیت ویژه موتور جستجو برای کشور و همینطور با در نظر گفتن بحث درآمدزایی و تولید محصولات داخلی، به یک موتور جستجوی بومی با سرویس‌های متنوع (برای پاسخگویی به نیازهای کاربران ایرانی در فضای مجازی) نیاز مبرم
می باشد. هدف از این پروژه ارائه سرویس موتور جستجوی متنی با خزش بیش از دو میلیارد سند و پوشش هفتصد میلیون صفحه می‌باشد. این موتور در فاز نهائی خود قادر است بیش از ۱۰۰ هزار پرس وجو در روز بعلاوه ۲۰ هزار کاربر یکتا را جذب کرده و پاسخگو باشد. با توجه به تجربه قبلی مجری در این زمینه (موتور جستجوی پارسی جو) و با ارائۀ سرویس‌های ویژه و ترکیبی، رسیدن به این اهداف کاملا عملی و قابل دسترس می‌باشد. در این پروژه موتور جستجو برای رسیدن به کیفیت، پوشش و دقت بالاتر توسعه داده می‌شود و در کنار خدمات ارائه شده در این پروژه دادگان و API های قابل آزادرسانی نیز در اختیار محققین و کاربران آزاد قرار گرفته است.

بازه اجرای پروژه
۱۳۹۵/۰۵/۰۳ الی۱۳۹۵/۱۱/۰۳
دستاورد:
فاز اول: ۱. ۴ میلیون صفحه بازدیدشده در روز ۲. پارس و پاکسازی صفحات خزش شده در حداکثر ۹۶ ساعت ۳. خزش ۱ میلیارد و ۴۰۰ میلیون سند ۴. لیست اخراج شده از تعاملات بین بخشی ۵. تقسیم نمایه به چند بخش برای تسریع بازیابی ۶. مکانیزم‌های شخصی سازی ۷. رویدادهای درخور توجه فاز دوم: ۱. ۴.۵ میلیون صفحه بازدیدشده در روز ۲. پارس و پاکسازی صفحات خزش شده در حداکثر ۸۴ ساعت ۳. خزش ۱ میلیارد و ۵۰۰ میلیون سند ۴. تعاملات بین بخشی دسته بندی شده ۵. مکانیزم تقسیم اسناد در نمایه‌ها ۶. سرعت پاسخگویی به ۱۰ کاربر همزمان در یک ثانیه ۷. سیاست واکنش به رویدادها ۸. واسط نرم افزاری جستجو ۹. خطایاب با دادگان تاریخچه پرس و جوی ۲۴ ماه و بهبود تصحیح املایی فاز سوم: ۱. مکانیزم مدیریت خزش بیش از ۵ میلیون صفحه ۲. تشخیص اسپم بودن ۱ میلیون صفحه در زیر ۱۲ ساعت ۳. پارس و پاکسازی صفحات خزش شده در حداکثر ۷۲ ساعت ۴. خزش ۱ میلیارد و ۶۰۰ میلیون سند ۵. سیستم یکپارچه مدیریت مانیتورینگ بین بخشی ۶. مکانیزم پیاده سازی محاسبات رتبه بندی بخش‌های نمایه ۷. روش‌های دخالت اطلاعات تعامل کاربران در رتبه بندی ۸. نسخه اولیه سرویس شاخص فاز چهارم: ۱. دو خزشگر دسته ای و سریع ۲. نرخ بازدید ۵.۵ میلیون صفحه در روز ۳. خزش ۱ میلیارد و ۷۵۰ میلیون صفحه ۴. تشخیص اسپم بودن ۱ میلیون صفحه در زیر ۶ ساعت ۵. آزمون دسترس پذیری بخش‌های موتور جستجو به صورت خودکار ۶. رتبه بندی براساس اطلاعات تعامل کاربران ۷. سرعت پاسخگویی به ۱۵ کاربر همزمان در یک ثانیه ۸. نسخه اولیه افزونه فایرفاکس ۹. نسخه اولیه افزونه برای کروم فاز پنجم: ۱. نرخ بازدید ۸ میلیون صفحه در روز ۲. پارس و پاکسازی صفحات خزش شده توسط خزشگر دسته ای در حداکثر ۲۴ ساعت ۳. پارس و پاکسازی صفحات خزش شده توسط خزشگر سریع در حداکثر ۱۰ ساعت ۴. صف خزشگر دسته ای توسط محاسبات توزیع شده ۵. آموزش خطایاب با دادگان زبانی صفحات تازه خزش شده ۶. دسترس پذیری و سرویس دهی تمام بخش‌های برخط از طریق پیشخوان مدیریتی ۷. رتبه بندی براساس نتایج تصحیح املایی ۸. نتایج رویداد محور برای رویدادهای تعیین شده
هدف:
هدف از این پروژه ارائه سرویس جستجوی متنی است که در کنار خزش بیش از دو میلیارد صفحه باید بتواند کیفیت جستجو را افزایش داده به میزانی قابل قبول رسانده و در کنار آن بستری برای بهبود تجربه کاربری و کسب حداقل‌هایی از معیارهای رضایتمندی کاربران مانند بازگشت کاربران و ماندگاری آنها فراهم آمده است. برای کسب این معیارها و ارتقا به این قابلیتها دو دسته از اقدامات صورت گرفته اند که عبارتند از بهبود تجربه کاربری و اقدامات ساختاری. اقدامات بهبود تجربه کاربری بیشتر در حوزه ارائه خدمات جذب کننده کاربران جدید بوده است و از آن جمله میتوان به تعامل رویداد-محور، ارائه افزونه‌هایی برای مرورگرهای پرطرفدار، دخیل نمودن سابقه تعاملات کل کاربران در پیشنهاد پرس وجوهای مرتبط و استفاده از دو پرسوجوی متوالی مرتبط در رتبه بندی اشاره نمود.

صفحه‌ها

ارتباط با ما

  • نشانی:    تهران، خیابان کارگرشمالی، روبروی سازمان انرژی اتمی، پژوهشگاه ارتباطات و فناوری اطلاعات
  • تلفن تماس: ۸۴۹۷۷۱۹۴ و ۸۴۹۷۸۱۳۳
  • رایانامه: didras@itrc.ac.ir

خبرنامه

عضویت در خبر نامه دیدرس، جهت دریافت آخرین اخبار و وقایع در زمینه طرح جویشگر بومی

درباره طرح

به پایگاه اطلاع‌رسانی طرح جویشگر بومی خوش آمدید، این پایگاه در راستای اطلاع‌رسانی معرفی اهداف، رویکردها و دستاوردهای حوزه جویشگر بومی از تاریخ ۱۳۹۳/۱۱/۲۸ فعالیت خود را آغاز نموده است. با توجه به اینکه شناخت ظریفت‌ها در حوزه جویشگر همواره از اهم ماموریت‌های این طرح است، همواره پذیرای تماس‌های شما هستیم.