تمرین بیست و شش
سلام دوستان
تمرین بیست و ششم تکمیل تمرین هفدهم است. در این تمرین اطلاعات از فایل متنی خوانده می شود و نتیجه نیز در فایل متنی ذخیره می گردد.
در این تمرین فایل متنی یک کتاب را داریم؛ هدف این است که برنامه فراوانی کلمات فایل را محاسبه کرده در فایل دیگر قرار دهد. می توان از این فایل جدید برای یادگیری زبان استفاده کرد!
از آنجا که کلماتی مانند a, the, this, that, , ... کلمات پر تکراری هستند و
در راستای یادگیری زبان کاربرد چندانی ندارند (!) باید آنها را حذف کنیم.
به این کلمات اصطلاحاً stop word گفته می شود که می توانید فایل مربوط به آن را از اینجا دریافت کنید.
نکته ی دیگر این است که مانند تمرین 17 علائم نگارشی باید از کلمات جدا شوند. مثلاً در جمله ی زیر که از فایل آورده شده، کاما، گیومه و علامت سوال و ... باید از کلمات جدا شود تا کلمه ی جدیدی به حساب نیایند.
but it had no pictures or
conversations in it, 'and what is the use of a book,' thought Alice
'without pictures or conversation?'
در فایل خروجی باید کلمات به ترتیب فراوانی از بزرگ به کوچک ذخیره شوند و هر کلمه و تعداد فراوانی آن در یک سطر قرار گیرد.
فایل کتاب را از لینک زیر دریافت کنید.
مهلت ارسال: دوشنبه 12 ساعت 21 پنج شنبه 22 خرداد ساعت 20
با تاخیر: سه شنبه ساعت 20 جمعه 23خرداد ساعت 20 سه شنبه 27 خرداد ساعت 20
موفق باشید.
- ۹۳/۰۳/۱۰