الگوریتمی برای تشخیص هجاهای لغات فارسی وجود دارد؟

پرسیده شده 12 آبان 00

فعالیت 903 روز پیش

دیده شده 500 بار

سلام دوستان الگوریتمی وجود داره بشه هجاها یا همون سیلاب های لغات فارسی رو در آورد؟ حالا پیاده سازیش تو یه زبان برنامه نویسی خاص مهم نیست میخوام بدونم همچین کاری میشه کرد؟ اگه میشه این کارو کرد لطفا راهنمایی کنید.

پ.ن :ببخشید جایی پیدا نکردم مرتبط باشه واسه همین اینجا طرح کردم سوال رو.

امیر

12 آبان 00

حذف شده

سلام.

اگر تشخیص هجا راه ساده ای داشته باشه رو میشه بنویسیم ولی اگر نیاز به بررسی خیلی از شروط داشته باشه، کار پرحجمی رو میطلبه تا خیلی از شروط بررسی شه ضمن اینکه برنامه مون باید دایره ی زیادی از لغات رو پشتیبانی کنه.

تشخیصش به چه شکله؟

توسط

محسن موحد

13 آبان 00

حذف شده

چون کامنت طولانی شده پایین تر مینویسم

امیر

13 آبان 00

حذف شده

حالا طبق تعریف های رسمی هجا ها اینطوری محاسبه میشه :
در زبان فارسی سه نوع هجا به شکل زیر وجود دارد :
1- صامت + مصوّت مثل : ما ، که ، سی ، با
2- صامت + مصوّت + صامت مثل : کار ، د ل ، بود
3- صامت + مصوّت + صامت + صامت مثل : گفت ، کارد ، برف
حالا یسری ممکنه استثنا و شروط هم داشته باشه ولی غالبا به همین صورت.
بله درست میگید نیاز به یک دیتابیس کلمات فارسی و هجاهاشون داریم ولی فک نکنم همچین دیتابیسی پیدا بشه البته فقط برای لغات فارسی وجود داره ولی هجا ها نیست حداقل من ندیدم باشه.
یه نمونه انگلیسی پیدا کردم برای تشخیص سیلاب ها - ولی تشخیص سیلاب تو زبان فارسی با انگلیسی متفاوت برا همین وقتی جمله هارو فینگلیش میکنم بعد تست میکنم نتیجه مطلوب حاصل نمیشه و اشتباه درمیاد.

توسط

امیر

13 آبان 00

حذف شده

زبان انگلیسی از روی فونوتیکش میشه تشخیص داد. اینجا اول باید مصوت هارو مشخص کنیم و بعد صامت ها. ولی خیلی از کلمات بزرگتر از سه حرف هستن... میشه اینجوری نگاه کنیم که تمام کلمات رو به سه حرف سه حرف بشکنیم؟؟

محسن موحد

14 آبان 00

حذف شده

بله باید مصوت ها مشخص بشن ولی خود مصوت هام به دو دسته مصوت کوتاه ( ـَـِـُ) و مصوت های بلند (آ اي او) تقسیم میشن میشه مصوت های بلند رو مشخص کرد ولی مصوت های کوتاه رو نمیشه مشخص کرد، خب اگه سه حرف سه حرف اگه بشکنیم باید بعد دو حرفیا رو توشون چک بشن اونوقت

امیر

15 آبان 00

الگوریتمی برای تشخیص هجاهای لغات فارسی وجود دارد؟

سوالات مرتبط