جلسه اول آموزش رپید ماینر
وظیفه Rapid miner:
بیشتر کردن ارزش تحلیل ها و دقت در پیش بینی و همچنین ارائه راهکارهای الگوریتمی و مدلی جدید برای پیش بینی .
مزایای Rapid miner:
یکی از آسان ترین ابزار ها برای استفاده از داده ها و دارای گرافیک کاربری هوشمند برای طراحی فرایند های آنالیز .
همچنین قابلیت یکپارچه سازی با نرم افزار های داده کاوی دیگر را دارد.
نتایج مدل سازی را اعتبار سنجی می کند. و در همین قسمت به ما نشان می دهد که کدام محصول بهترین مدل برای پیش بینی داده ها است؟
این نرم افزار مناسب برای کار کردن با داده های زیاد است.
اجازه به اشتراک گذاشتن فرایند ها در صفحات وب را به کاربران می دهد.
شروع کار با نرم افزار Rapid miner:
این نرم افزار را می تونید از سایت www.rapidminer.com دانلود و نصب کنید.

اولین بخشی که می خواهم توضیح بدهم Repository هست که محل ذخیره انواع داده ، فرایندها و مدل های نهانی هست.
قسمت Operators انواع عملگرها برای تشکیل فرایند و ساختن مدل است.
Parameters : برای هر عملگر پارامترهایی وجود دارد که از این قسمت تنظیم می کنیم. تا زمانی که پارامترها را مشخص نکنیم نمی توانیم فرایند ها را ادامه دهیم. و در واقع مدل سازی صورت نمی گیرد.
Help هم راهنمای نرم افزار می باشد.
نرم افزار دو قسمت Views دارد:
- Design
- Results
در بخش Design فرایند ها را طراحی می کنیم. و در بخش Result نتایج فرایند ها و مدل سازی قرار می گیرد.
چطور داده ها را وارد محیط نرم افزار کنیم؟
برای ورود داده ۲ راه وجود دارد:
در روش اول که در شکل می بینید تعدادی پایگاه داده برای آموزش و یاد گیری ذخیره شده است.

در روش دوم ما خودمان پایگاه داده ای را وارد کنیم:
یک پایگاه داده نمونه را از وب سایت http:rapidminer.com/titanic دانلود و ذخیره می کنیم.
حالا این فایل را با فشردن دکمه Add Data و سپس ادرس دادن به فایل ذخیره شده فراخوانی می کنیم.

1- Sheet برای این است که انتخاب کنیم از کدام Sheet می خواهیم استفاده کنیم.
۲-Cell range حدود سلول هایی که قرار است استفاده کنیم مشخص می کند که می تواند کل سلول ها باشد و یا مثلا A1:D4 باشد و یا با درگ کردن حدودو مورد نظر خودمان را انتخاب کنیم.
۳-Define header row می گوید کدام سطر سر تیتر باشد.
در پایان دکمه Next را می زنیم.

1- Data format فرمت تاریخ را مشخص می کنیم.
۲- replace errors missing values اگر تیک این بخش را بزنیم همه missing داده ها را پاک میکند . راه دیگه اش این است که خودمان تعریف کنیم با این داده ها چه کند. بنابراین فعلا تیک نمی زنیم.
اگر داده های ما مشکل خاصی نداشته باشد در پایین نرم افزار تیک سبز، کنار no problems می خورد.
۳- همین جا روی attribute ها (همان تب هایی که مشخص شده) می تونیم ویرایش انجام بدهیم.
با زدن دکمه next به مرحله بعد میرویم که باید محل قرار گرفتن داده (local repository) و همچنین اسم داده را مشخص کنیم.

Rapid miner بصورت پیش فرض وارد محیط result می شود ما می خواهیم از محیط Design نرم افزار date set را وارد کنیم:
بنابراین از بخش Repository دیتاست مورد نظر خودموان را به بخش Design درگ می کنیم.
هر کدام از دیتا ست ها و Operator (عملگرها) دارای پورتهای ورودی و خروجی هستند. داده ها در واقع وارد عملگر می شوند و فقط دارای پورت خروجی هستند. اما عملگرها چون باید داده ها را بگیرند پورت وردی دارند و از قسمت خروجی به Result متصل می شوند و ما بازدن دکمه ابی (RUN) در بالای برنامه می تواتنیم نتیجه را ببینیم.

همانطور که ملاحظه می کنید جدول داده با تمام اطلاعاتش در این قسمت دیده میشود.
سلام
بابت توضیحات خوبتون ممنون
ادامه ی آموزش و روی وب سایت قرار می دین؟
خیلی خوب بود مرسی
لطفا کاملش کنید