زیر پروژه Mahout که جزء جدایی ناپذیر پروژه هدوپ است یک محیط برای ایجاد برنامه ها و الگوریتم های یادگیری ماشین به صورت توزیع شده می باشد. این زیرپروژه شامل الگوریتم ها و کتابخانه های مختلفی برای داده کاوی می شود که می توان به الگوریتم های خوشه بندی نظیر K-Means و دسته بندی نظیر Naïve Bayes اشاره کرد.
Mahout همچنین کتابخانه های محسابات ریاضی بر طبق جبر خطی و آمار را نیز برای جاوا فراهم می کند. این زیر پروژه هنوز در حال تکمیل شدن است اما تا به حال الگوریتم های زیادی برای آن پیاده سازی شده است. هرچند Mahout بیشتر به عنوان یکی از زیرپروژه های هدوپ شناخته می شود ولی این به این معنی نیست که وابسته به هدوپ باشد. Mahout می تواند بدون هدوپ و بر روی Single Node و حتی کلاستر غیر هدوپی مورد استفاده قرار گیرد. Mahout به زبان جاوا و اسکالا نوشته شده است.
شروع کار با Mahout
به دلیل اینکه Mahout در بسته عمومی هدوپ وجود ندارد می بایست بسته Mahout را از این آدرس دریافت نمایید. پس از دریافت و استخراج بسته فشرده Mahout باید مطمئن شوید که Maven را نیز نصب کرده اید.
پس از استخراج و اطمینان از نصب Maven ، دو متغیر محلی زیر را می بایست مقدار دهی نمایید:
- HADOOP_HOME : مسیر اصلی مربوط به فایل های هدوپ
- MAHOUT_HOME : مسیر اصلی مربوط به فایل های Mahout
پس از اینکار با اجرای دستور زیر در خط فرمان می توانید Mahout را نصب نمایید:
mvn -DskipTests clean install
لینک های مفید:
سلام من یه پروژه کلاسترینگ متن فارسی دارم با ماهوت میتونید کمکم کنید.
amirhossiensz@gmail.com
.یه آنالایزر متنهای فارسی می خوام.
بخش مربوط به آنالیز متن فارسی رو نمیتونم کمکی بهتون کنم ولی در رابطه با ماهوت سوالات و اشکالات خودتون و میتونید در این انجمن بپرسید :
http://barnamenevis.org/forumdisplay.php?203-NoSQL
سلام عزیز یه سوال دیگه
برای این که خروجی کلاستر شده رو بخواهیم به متن تبدیل کنیم از چه کدی باید استفاده کنیم؟
اصلا میشه یه همچین چیزی؟
دوست من شما کلاسیفیکیشن را با کلاسترینگ اشتباه گرفته اید.
فرقشون چیه؟
من از کجا باید بفهمم که متن کلاستر شدم درست کلاستر شده؟
سلام
خیلی ممنون از مطالب مفیدتون
یه سوال دارم. اینکه از کجا بفهمیم که یه الگوریتم خوشه بندی را میشه به صورت توزیع شده پیاده سازی کرد؟
با تشکر
درود. سوالاتتون را در بخش پرسش و پاسخ مطرح کنید:
http://hadoop.ir/qa/