فروشگاه پروژه های هوش مصنوعی و داده کاوی

انجام پروژه های هوش مصنوعی و داده کاوی با متلب

فروشگاه پروژه های هوش مصنوعی و داده کاوی

انجام پروژه های هوش مصنوعی و داده کاوی با متلب

انجام پروژه ها و تمرینات دانشجویی در حوزه هوش مصنوعی و داده کاوی با نرم افزارهای متلب، پایتون، رپیدماینر و وکا

کلمات کلیدی

حل تمرینات شناسایی آمار و الگو دانشگاه امیرکبیر

حل تمرینات درس شناسایی آمار و الگو

حل تمرینات درس pattern recogntion

حل تمرینات کتاب فوکوناگا

حل تمرینات کامپیوتری درس شناسایی آمار و الگو

انجام پروژه های تخصصی متلب

انجام پروژه متلب

انجام پروژه دانشجویی

کدنویسی تمرینات pattern recognition

کد متلب تمرینات درس شناسایی آمار و الگو

کد متلب شبکه عصبی

پیاده سازی شبکه عصبی

کد آماده متلب

کد متلب الگوریتم درخت تصمیم

الگورینم دسته بندی

کد متلب دسته بندی توموز مغزی

ترکیب الگوریتم ژنتیک و ماشین بردار پشتیبان

ترکیب الگوریتم ژنتیک و الگوریتم دسته بندی

ترکیب الگوریتم ژنتیک و SVM

انتخاب بهینه ویژگی ها با الگوریتم ژنتیک

پروژه متلب

پروژه دانشجویی

ترکیب مدل های دسته بندی

ترکیب روش های دسته بندی درمتلب

کد متلب پیش پردازش تصاویر ماموگرافی برای تشخیص سرطان سینه

کد متلب پردازش تصاویر پزشکی

کد متلب پردازش تصاویر ماموگرافی

کد متلب تشخیص سرطان پستان

کد متلب تشخیص سرطان سینه

کد آماده پردازش تصاویر پزشکی

  • ۰
  • ۰

دسته بندی متون فارسی با استفاده از الگوریتم ماشین بردار پشتیبان SVM 


لینک خرید


متن کاوی یکی از حوزه های یادگیری ماشین محسوب میشود که با استفاده از تکنیک های یادگیری ماشین سعی در تجزیه و تحلیل متن، برایمقاصد تعریف شده دارد. این مقاصد میتواند شامل موارد زیر باشد
  1. دسته بندی متون
  2. خوشه بندی متون
  3. تشخیص احساسات از روی متن
  4. تشخیص نویسنده
  5. تشخیص اسپم 
  6. و موارد دیگر
 
دسته بندی متن یکی از زیرمجموعه های متن کاوی محسوب میشود که سعی دارد تا با استفاده از ویژگی های سندهای متنی، اقدام به دسته بندی آنها کند. این ویژگی ها میتواند به طرق مختلف استخراج شود. به عنوان مثال میتوان از ویژگی های ظاهری و لغوی استفاده کرد و یا حتی پا را فراتر گذاشت و از ویژگی های نحوی و معنایی هم بهره برد.
 
 
پس از استخراج این ویژگی ها، میتوان مدلهای دسته بندی را آموزش داد تا این مدل قادر به دسته بندی داده های جدید باشد. 
 
از کاربردهای دسته بندی متن میتوان به موارد زیر اشاره کرد
  1.  تشخیص اسپم
  2. دسته بندی آرشیو سایت ها و اخبار
  3. مورد استفاده در موتورهای جتسجو
  4. بخشی از سیستم های پیشنهاد دهنده در صفحات مجازی
  5. و موارد دیگر
 
مهم ترین بخش متن کاوی، بخش پردازش متن محسوب میشود زمانی که میخواهیم اسناد متنی را بخوانیم و آنها را پردازش کنیم تا یک متن خالص و غنی بدست آید. این پردازش ها میتواند شامل موارد زیر باشد
  1. حذف تگ های HTML
  2. حذف فاصله های اضافی
  3. حذف علائم نگارشی (بسته به کاربرد مسئله)
  4. حذف کلمات ایست واژه یا Stop words
  5. ریشه یابی کلمات
  6. استخراج قواعد نحوی و معنایی (بسته به کاربرد مسئله)
  7. و موارد دیگر
 
 
 
در این پست، کد متلبی را ارائه داده ایم که اقدام به دسته بندی متن های فارسی میکند. متن های ذکر شده توییت های کاربران در سایت توییتراست که به زبان فارسی درج شده اند. این دیتاست، به مانند بسیاری از دیتاست های فارسی دیگر، استانداردهای لازم یک دیتاست را ندارد و دارای نواقصی است. با اینحال میتواند به عنوان یک نمونه آموزشی مناسب در نظر گرفته شود.
 
بخش پیش پردازش متن در این مسئله به صورت ساده انجام شده است و مسائلی مثل ریشه یابی کلمات و حذف ایست واژه ها را نداریم چون در متلب دیتاستی برای این کار وجود ندارد. بیشتر تمرکز کد پیاده سازی شده، روی خواندن اسناد فارسی و جداسازی کلمات و استخراج ویژگی است و از جزییات پردازشی دستور زبان فارسی خودداری کرده ایم
 
این کد یک نمونه ساده برای آموزش نحوه کدنویسی در متلب برای متن کاوی و مخصوصا دسته بندی متن است و یک کد حرفه ای و پیچیده نیست و میتواند جنبه آموزشی داشته باشد.
 
در این کد، ابتدا یک دیتاست آموزشی را میخوانیم، متن ها را پردازش کرده و سپس ویژگی ها را به صورت bag of words استخراج میکنیم و در پایان ویژگی ها را به الگوریتم ماشین بردار پشتیبان (SVM) میدهیم. بعد از آموزش دسته بند، دیتاست تست را میخوانیم پردازش های لازم را انجام میدهیم و سپس ویژگی های استخراج شده را به مدل میدهیم تا برچسب داده های تست را مشخص کند. سپس توییت های تست  به همراه برچسب های بدست آمده  را در یک فایل خروجی به صورت اکسل در کنار کدها ذخیره میکند.
 
 
 
توجه: فایل دانلودی حاوی کدهای متلب، دیتاست توییت های فارسی و گزارش خط به خط کدهاست. همچنین توجه فرمایید که پروژه حاضر یک پروژه نمونه و ساده است برای یادگیری نحوه خواندن دیتاست های فارسی، پردازش متن و دسته بندی اسناد متنی است و به عنوان یک پروژه حرفه ای به آن نگاه نکنید. 
 
حتما در متلب نسخه 2017 به بالاتر اجرا شود
 
 

ویدیوی زیر نحوه اجرای این پیاده سازی را نشان میدهد.

ویدیو نحوه اجرای کدها

 
در صورت هر گونه سوال نسبت به کالای مورد نظر، با ایمیل msd.abasian@gmail.com  یا شماره 09132324263 و یا آیدی تلگرام masoudabasian مکاتبه نمایید.

همچنین در صورت دانلود فایل و مشاهده هر گونه مشکل در کدها و گزارش، میتوانید از طریق راه های ارتباطی ذکر شده، مشکل را اعلام فرمایید تا در اسرع وقت پشتیبانی لازم را انجام دهیم.

با تشکر از حسن اعتماد شما

مسعود عباسیان


لینک خرید

نظرات (۰)

هیچ نظری هنوز ثبت نشده است

ارسال نظر

ارسال نظر آزاد است، اما اگر قبلا در بیان ثبت نام کرده اید می توانید ابتدا وارد شوید.
شما میتوانید از این تگهای html استفاده کنید:
<b> یا <strong>، <em> یا <i>، <u>، <strike> یا <s>، <sup>، <sub>، <blockquote>، <code>، <pre>، <hr>، <br>، <p>، <a href="" title="">، <span style="">، <div align="">
تجدید کد امنیتی