آشنایی و شروع کار با Mahout

زیر پروژه Mahout که جزء جدایی ناپذیر پروژه هدوپ است یک محیط برای ایجاد برنامه ها و الگوریتم های یادگیری ماشین به صورت توزیع شده می باشد. این زیرپروژه شامل الگوریتم ها و کتابخانه های مختلفی برای داده کاوی می شود که می توان به الگوریتم های خوشه بندی نظیر K-Means و دسته بندی نظیر Naïve Bayes اشاره کرد.


Mahout همچنین کتابخانه های محسابات ریاضی بر طبق جبر خطی و آمار را نیز برای جاوا فراهم می کند. این زیر پروژه هنوز در حال تکمیل شدن است اما تا به حال الگوریتم های زیادی برای آن پیاده سازی شده است. هرچند Mahout بیشتر به عنوان یکی از زیرپروژه های هدوپ شناخته می شود ولی این به این معنی نیست که وابسته به هدوپ باشد. Mahout می تواند بدون هدوپ و بر روی Single Node و حتی کلاستر غیر هدوپی مورد استفاده قرار گیرد. Mahout به زبان جاوا و اسکالا نوشته شده است.

 

شروع کار با Mahout
به دلیل اینکه Mahout در بسته عمومی هدوپ وجود ندارد می بایست بسته Mahout را از این آدرس دریافت نمایید. پس از دریافت و استخراج بسته فشرده Mahout باید مطمئن شوید که Maven را نیز نصب کرده اید. 


پس از استخراج و اطمینان از نصب Maven ، دو متغیر محلی زیر را می بایست مقدار دهی نمایید:

  • HADOOP_HOME : مسیر اصلی مربوط به فایل های هدوپ
  • MAHOUT_HOME : مسیر اصلی مربوط به فایل های Mahout


پس از اینکار با اجرای دستور زیر در خط فرمان می توانید Mahout را نصب نمایید:

mvn -DskipTests clean install

لینک های مفید:

از سرورهای ما برای اجرای پروژه های داده های کلان خود بدون اینکه درگیر پیچیدگی نصب شوید استفاده کنید. برای سفارش اینجا را کلیک کنید.
ما حتی می توانیم کلاستر و سرورهای هدوپ را برای شما ایجاد کنیم. برای درخواست راه اندازی اینجا را کلیک کنید.
اگر نیاز به مشاوره و یا کلاس آموزشی داشتید به اینجا مراجعه کنید.

لیست نظرات

  1. سلام عزیز یه سوال دیگه

    برای این که خروجی کلاستر شده رو بخواهیم به متن تبدیل کنیم از چه کدی باید استفاده کنیم؟

    اصلا میشه یه همچین چیزی؟

     

  2. سلام

    خیلی ممنون از مطالب مفیدتون

    یه سوال دارم. اینکه از کجا بفهمیم که یه الگوریتم خوشه بندی را میشه به صورت توزیع شده پیاده سازی کرد؟

    با تشکر

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *