وبلاگ سید جلال سیدیزدی

تمرین بیست و شش

شنبه, ۱۰ خرداد ۱۳۹۳، ۱۰:۰۰ ب.ظ


سلام دوستان

تمرین بیست و ششم تکمیل تمرین هفدهم است. در این تمرین اطلاعات از فایل متنی خوانده می شود و نتیجه نیز در فایل متنی ذخیره می گردد.

در این تمرین فایل متنی یک کتاب را داریم؛ هدف این است که برنامه فراوانی کلمات فایل را محاسبه کرده در فایل دیگر قرار دهد. می توان از این فایل جدید برای یادگیری زبان استفاده کرد!

از آنجا که کلماتی مانند a, the, this, that, , ... کلمات پر تکراری هستند و در راستای یادگیری زبان کاربرد چندانی ندارند (!) باید آنها را حذف کنیم. به این کلمات اصطلاحاً stop word گفته می شود که می توانید فایل مربوط به آن را از اینجا دریافت کنید.

نکته ی دیگر این است که مانند تمرین 17 علائم نگارشی باید از کلمات جدا شوند. مثلاً در جمله ی زیر که از فایل آورده شده، کاما، گیومه و علامت سوال و ... باید از کلمات جدا شود تا کلمه ی جدیدی به حساب نیایند.

 but it had no pictures or conversations in it, 'and what is the use of a book,' thought Alice 'without pictures or conversation?'

در فایل خروجی باید کلمات به ترتیب فراوانی از بزرگ به کوچک ذخیره شوند و هر کلمه و تعداد فراوانی آن در یک سطر قرار گیرد.

 فایل کتاب را از لینک زیر دریافت کنید. 

آلیس در سرزمین عجایب


مهلت ارسال: دوشنبه 12 ساعت 21 پنج شنبه 22 خرداد ساعت 20

با تاخیر: سه شنبه ساعت 20 جمعه 23خرداد ساعت 20 سه شنبه 27 خرداد ساعت 20


موفق باشید.


  • ۹۳/۰۳/۱۰

نظرات  (۲)

سلام میشه با تاخیر تا شنبه تمدید بشه؟
پاسخ:
سلام
بله. تمدید شد.
موفق باشید.
سلام استاد . خسته نباشید 
استاد ممنون 
بابت تمدید زمان این دو تا تمرین 
ارسال نظر آزاد است، اما اگر قبلا در بیان ثبت نام کرده اید می توانید ابتدا وارد شوید.
شما میتوانید از این تگهای html استفاده کنید:
<b> یا <strong>، <em> یا <i>، <u>، <strike> یا <s>، <sup>، <sub>، <blockquote>، <code>، <pre>، <hr>، <br>، <p>، <a href="" title="">، <span style="">، <div align="">
تجدید کد امنیتی