رییس پژوهشکده فناوری اطلاعات گفت: خروجی دادگان و ابزارهای پردازش خط و زبان فارسی در پژوهشگاه ارتباطات و فناوری اطلاعات آزادرسانی خواهد شد.
به گزارش مرکز روابط عمومی و اطلاع رسانی وزارت ارتباطات و فناوری اطلاعات، علیرضا
یاری رییس پژوهشکده فناوری اطلاعات ضمن خبر از آزادرسانی ابزارها و دادگان
پردازش خط و زبان فارسی در پژوهشگاه ارتباطات و فناوری اطلاعات، گفت: رشد
فناوری اطلاعات و گسترش اینترنت، مرزهای تاثیرگذاری خط و زبان را از مرزهای
جغرافیایی فراتر برده و پردازش زبان به عنوان یک نیاز ملی و بین المللی جهت
استفاده بهینه از منابع اطلاعاتی مطرح شده است.
رییس پژوهشکده فناوری اطلاعات ضمن توضیح از نگاه کاربردهای مبتنی بر
پردازش زبان طبیعی مانند ترجمه ماشینی و جویشگرها که اهمیت زیادی پیدا کرده
است، به سرمایه گذاری کشورها در این حوزه اشاره کرده و از اهمیت ارائه
زیرساخت های پردازش خط و زبان فارسی برای نیل به اهداف کلان در فضای مجازی
به عنوان دلیل اصلی این سرمایه گذاری یاد کرد.
در ادامه یاری، ضمن تشریح برنامه پیشنهادی برای توسعه خط و زبان
فارسی، محورهای توسعه خط و زبان را در سه مقوله دادگان و محتوا، ابزارها و
کاربردها دانسته و گفت : پژوهشگاه ارتباطات و فناوری اطلاعات از چندین سال
قبل تاکنون فعالیتهای متعددی را در قالب 30 پروژه درون سپاری و برون سپاری
(12 پروژه توسط شرکتهای دانش بنیان، 13 پروژه توسط دانشگاهها و 5 پروژه
توسط پژوهشگاه ارتباطات و فناوری اطلاعات) آغاز کرده است که برخی از آنها
خاتمه یافته و برخی نیاز به توسعه بیشتری دارند.
وی به نمونه هایی از دستاوردهای حاصله
نظیر گراف دانش فارسی با حدود 500 هزار موجودیت، وردنت عمومی زبان فارسی با
عنوان فارسنت شامل 100هزار واژه عمومی زبان فارسی و نیز شبکه تصویری
تصویرنت با حدود 33هزار واژه و 8 میلیون تصویر و ابزارهای خطایاب املایی و
گرامری و نیز ابزارهای پایه پردازش زبان فارسی مانند ابزار تشخیص موجودیت
ناممند و مرجع گزینی اشاره کرده و خبر از آزادرسانی کلیه دستاوردهای حاصله
داد که به زودی انجام خواهد شد.
یاری افزود: در راستای توسعه خدمات وب بومی فعالیتهای متعددی در
حوزه توسعه جویشگرهای متنی، تصویری، خبری، نقشه و مستندات علمی و نیز
مترجمهای دوزبانه فارسی و انگلیسی انجام شده است که ابزارها و دادگان خط و
زبان فارسی از زیرساختهای ضروری آنها است .
وی برنامه آتی پژوهشکده در این خصوص را توسعه ابزارهای مورد نیاز و بسط
حوزه هایی نظیر خدمات مبتنی بر صوت، نویسه خوان نوری دست نوشته فارسی و
همچنین ابزارهای معنایی خط و زبان فارسی و تاثیر آنها در بهبود کیفیت خدمات
و کاربردهای بومی عنوان کرد.
کلیه اطلاعات و خروجی های مربوط به این حوزه در سایت اطلاع رسانی دیدرس (didras.ir) قابل دسترسی می باشد.