خروجی دادگان و ابزارهای پردازش خط و زبان فارسی آزادرسانی خواهد شد

خروجی دادگان و ابزارهای پردازش خط و زبان فارسی در پژوهشگاه ارتباطات و فناوری اطلاعات آزادرسانی خواهد شد.

به گزارش روابط عمومی پژوهشگاه ارتباطات و فناوری اطلاعات، دکتر علیرضا یاری رئیس پژوهشکده فناوری اطلاعات ضمن خبر از آزادرسانی ابزارها و دادگان پردازش خط و زبان فارسی در پژوهشگاه ارتباطات و فناوری اطلاعات گفت: رشد فناوری اطلاعات و گسترش اینترنت، مرزهای تاثیرگذاری خط و زبان را از مرزهای جغرافیایی فراتر برده و پردازش زبان به عنوان یک نیاز ملی/ بین المللی جهت استفاده بهینه از منابع اطلاعاتی مطرح گردیده است.

رئیس پژوهشکده فناوری اطلاعات ضمن توضیح از نگاه کاربردهای مبتنی بر پردازش زبان طبیعی مانند ترجمه ماشینی و جویشگرها که اهمیت زیادی پیدا کرده است، به سرمایه گذاری کشورها در این حوزه اشاره کرده و از اهمیت ارائه زیرساختهای پردازش خط و زبان فارسی برای نیل به اهداف کلان در فضای مجازی به عنوان دلیل اصلی این سرمایه گذاری یاد کرد.

در ادامه دکتر یاری، ضمن تشریح برنامه پیشنهادی برای توسعه خط و زبان فارسی، محورهای توسعه خط و زبان را در سه مقوله دادگان و محتوا، ابزارها و کاربردها دانسته و گفت: پژوهشگاه ارتباطات و فناوری اطلاعات از چندین سال قبل تاکنون فعالیت­های متعددی را در قالب ۳۰ پروژه درونسپاری و برونسپاری (۱۲ پروژه توسط شرکت­های دانش بنیان، ۱۳ پروژه توسط دانشگاه­ها و ۵ پروژه توسط پژوهشگاه ارتباطات و فناوری اطلاعات) آغاز نموده است که برخی از آنها خاتمه یافته و برخی نیاز به توسعه بیشتری دارند. وی  به نمونه‌هایی از دستاوردهای حاصله نظیر گراف دانش فارسی با حدود ۵۰۰ هزار موجودیت، وردنت عمومی زبان فارسی با عنوان فارس­نت شامل ۱۰۰هزار واژه عمومی زبان فارسی و نیز شبکه تصویری تصویرنت با حدود ۳۳هزار واژه و ۸ میلیون تصویر و ابزارهای خطایاب املایی و گرامری و نیز ابزارهای پایه پردازش زبان فارسی مانند ابزار تشخیص موجودیت نام­مند و مرجع­گزینی اشاره کرده و خبر از آزادرسانی کلیه دستاوردهای حاصله داد که به زودی انجام خواهد شد.

دکتر یاری افزود: در راستای توسعه خدمات وب بومی فعالیت­های متعددی در حوزه توسعه جویشگرهای متنی، تصویری، خبری، نقشه و مستندات علمی و نیز مترجم­های دوزبانه فارسی/انگلیسی انجام شده است که ابزارها و دادگان خط و زبان فارسی از زیرساختهای ضروری آنهاست.

وی  برنامه آتی پژوهشکده در این خصوص را توسعه ابزارهای مورد نیاز و بسط حوزه‌هایی نظیر خدمات مبتنی بر صوت، نویسه خوان نوری دست نوشته فارسی و همچنین ابزارهای معنایی خط و زبان فارسی و تاثیر آنها در بهبود کیفیت خدمات و کاربردهای بومی عنوان کرد.

گفتنی است کلیه اطلاعات و خروجیهای مربوط به این حوزه در سایت اطلاع رسانی دیدرس (didras.ir) قابل دسترسی می‌باشد.