پروژه های آماده رپیدماینر

پروژه های آماده رپیدماینر

مرجع کامل پروژه های آماده رپیدماینر

  • تشخیص اسپم در ایمیل های فارسی با استفاده از الگوریتم های ماشین یادگیری
  • تشخیص اسپم در ایمیل های فارسی با استفاده از الگوریتم های ماشین یادگیری
کد : 3407

تشخیص اسپم در ایمیل های فارسی با استفاده از الگوریتم های ماشین یادگیری

قیمت : 99000 تومان

تشخیص اسپم یکی از حوزه‌های مطالعاتی متن‌کاوی است که بسیار موردتوجه است در این حوزه مطالعاتی به دنبال شناسایی و طبقه‌بندی اسپم‌ها هستیم. در فارسی به اسپم‌های ایمیل هرزنامه نیز گفته می‌شود. اسپم به پیام ناخواسته اطلاق می‌شود به‌طور مثال ایمیل‌های ناخواسته که از طرف شرکت‌های تولیدکننده به‌منظور تبلیغ ارسال می‌شود یک نوع اسپم هستند. این حوزه مطالعاتی دارای سابقه طولانی در حوزه متن‌کاوی انگلیسی است ولی در زبان فارسی کارهای مهمی انجام‌نشده است در این پروژه به دنبال شناسایی ایمیل‌های اسپم دار فارسی هستیم. مجموعه داده مورداستفاده از ایمیل‌های فارسی عادی و اسپم تشکیل‌شده است 500 ایمیل عادی و 500 ایمیل اسپم دار را شامل می‌شود. این ایمیل‌ها به زبان فارسی نوشته‌شده‌اند.
در این پروژه از الگوریتم های ماشین یادگیری برای ایجاد مدل طبقه بندی استفاده شده است. چهار الگوریتم بردار پشتیبان، بیز، شبکه عصبی و درخت تصمیم گیری مورد استفاده قرار گرفته و در نتایج به دست آمده در هر یک مقایسه شده و بهترین الگوریتم انتخاب شده است.