پرش به محتوای اصلی

رییس پژوهشکده فناوری اطلاعات: خروجی دادگان و ابزارهای پردازش خط و زبان فارسی آزادرسانی خواهد شد

رییس پژوهشکده فناوری اطلاعات: خروجی دادگان و ابزارهای پردازش خط و زبان فارسی آزادرسانی خواهد شد
رییس پژوهشکده فناوری اطلاعات گفت: خروجی دادگان و ابزارهای پردازش خط و زبان فارسی در پژوهشگاه ارتباطات و فناوری اطلاعات آزادرسانی خواهد شد.

به گزارش مرکز روابط عمومی و اطلاع رسانی وزارت ارتباطات و فناوری اطلاعات، علیرضا یاری رییس پژوهشکده فناوری اطلاعات ضمن خبر از آزادرسانی ابزارها و دادگان پردازش خط و زبان فارسی در پژوهشگاه ارتباطات و فناوری اطلاعات، گفت: رشد فناوری اطلاعات و گسترش اینترنت، مرزهای تاثیرگذاری خط و زبان را از مرزهای جغرافیایی فراتر برده و پردازش زبان به عنوان یک نیاز ملی و بین المللی جهت استفاده بهینه از منابع اطلاعاتی مطرح شده است.

رییس پژوهشکده فناوری اطلاعات ضمن توضیح از نگاه کاربردهای مبتنی بر پردازش زبان طبیعی مانند ترجمه ماشینی و جویشگرها که اهمیت زیادی پیدا کرده است، به سرمایه گذاری کشورها در این حوزه اشاره کرده و از اهمیت ارائه زیرساخت های پردازش خط و زبان فارسی برای نیل به اهداف کلان در فضای مجازی به عنوان دلیل اصلی این سرمایه گذاری یاد کرد.

در ادامه  یاری، ضمن تشریح برنامه پیشنهادی برای توسعه خط و زبان فارسی، محورهای توسعه خط و زبان را در سه مقوله دادگان و محتوا، ابزارها و کاربردها دانسته و گفت : پژوهشگاه ارتباطات و فناوری اطلاعات از چندین سال قبل تاکنون فعالیت­های متعددی را در قالب 30 پروژه درون سپاری و برون سپاری (12 پروژه توسط شرکت­های دانش بنیان، 13 پروژه توسط دانشگاه­ها و 5 پروژه توسط پژوهشگاه ارتباطات و فناوری اطلاعات) آغاز کرده است که برخی از آنها خاتمه یافته و برخی نیاز به توسعه بیشتری دارند.

وی  به نمونه هایی از دستاوردهای حاصله نظیر گراف دانش فارسی با حدود 500 هزار موجودیت، وردنت عمومی زبان فارسی با عنوان فارس­نت شامل 100هزار واژه عمومی زبان فارسی و نیز شبکه تصویری تصویرنت با حدود 33هزار واژه و 8 میلیون تصویر و ابزارهای خطایاب املایی و گرامری و نیز ابزارهای پایه پردازش زبان فارسی مانند ابزار تشخیص موجودیت نام­مند و مرجع ­گزینی اشاره کرده و خبر از آزادرسانی کلیه دستاوردهای حاصله داد که به زودی انجام خواهد شد.

یاری افزود: در راستای توسعه خدمات وب بومی فعالیت­های متعددی در حوزه توسعه جویشگرهای متنی، تصویری، خبری، نقشه و مستندات علمی و نیز مترجم­های دوزبانه فارسی و انگلیسی انجام شده است که ابزارها و دادگان خط و زبان فارسی از زیرساختهای ضروری آنها است .

وی  برنامه آتی پژوهشکده در این خصوص را توسعه ابزارهای مورد نیاز و بسط حوزه هایی نظیر خدمات مبتنی بر صوت، نویسه خوان نوری دست نوشته فارسی و همچنین ابزارهای معنایی خط و زبان فارسی و تاثیر آنها در بهبود کیفیت خدمات و کاربردهای بومی عنوان کرد.

کلیه اطلاعات و خروجی های مربوط به این حوزه در سایت اطلاع رسانی دیدرس (didras.ir) قابل دسترسی می باشد.

۲۷ دی ۱۳۹۶ ۱۱:۵۰
تعداد بازدید: ۱,۰۷۰

اظهارنظر

تعداد کاراکتر باقیمانده: 500
نظر خود را وارد کنید