سلام دوستان الگوریتمی وجود داره بشه هجاها یا همون سیلاب های لغات فارسی رو در آورد؟ حالا پیاده سازیش تو یه زبان برنامه نویسی خاص مهم نیست میخوام بدونم همچین کاری میشه کرد؟ اگه میشه این کارو کرد لطفا راهنمایی کنید.
پ.ن :ببخشید جایی پیدا نکردم مرتبط باشه واسه همین اینجا طرح کردم سوال رو.
سلام.
اگر تشخیص هجا راه ساده ای داشته باشه رو میشه بنویسیم ولی اگر نیاز به بررسی خیلی از شروط داشته باشه، کار پرحجمی رو میطلبه تا خیلی از شروط بررسی شه ضمن اینکه برنامه مون باید دایره ی زیادی از لغات رو پشتیبانی کنه.
تشخیصش به چه شکله؟
حالا طبق تعریف های رسمی هجا ها اینطوری محاسبه میشه :
در زبان فارسی سه نوع هجا به شکل زیر وجود دارد :
1- صامت + مصوّت مثل : ما ، که ، سی ، با
2- صامت + مصوّت + صامت مثل : کار ، د ل ، بود
3- صامت + مصوّت + صامت + صامت مثل : گفت ، کارد ، برف
حالا یسری ممکنه استثنا و شروط هم داشته باشه ولی غالبا به همین صورت.
بله درست میگید نیاز به یک دیتابیس کلمات فارسی و هجاهاشون داریم ولی فک نکنم همچین دیتابیسی پیدا بشه البته فقط برای لغات فارسی وجود داره ولی هجا ها نیست حداقل من ندیدم باشه.
یه نمونه انگلیسی پیدا کردم برای تشخیص سیلاب ها - ولی تشخیص سیلاب تو زبان فارسی با انگلیسی متفاوت برا همین وقتی جمله هارو فینگلیش میکنم بعد تست میکنم نتیجه مطلوب حاصل نمیشه و اشتباه درمیاد.