داده های آماده

در این بخش می توانید به داده های آماده عمومی که در پروژه های تحقیقاتی حوزه داده های کلان و هدوپ نیاز دارید دسترسی پیدا کنید:

دیتاست های جهانی:

توضیحات دیتاست لینک
دیتاست عمومی شرکت گوگل http://www.google.com/publicdata/directory
دیتاست بانک جهانی http://datacatalog.worldbank.org/
دیتاست سازمان ملل http://data.un.org/Explorer.aspx
دیتاست شرکت آمازون http://aws.amazon.com/public-data-sets/

*این جدول به مرور تکمیل می شود.

 

دیتاست های ایرانی:

توضیحات دیتاست لینک
بانک مرکزی http://www.cbi.ir
آموزش عالی کشور http://www.irphe.ac.ir/
وزارت صنعت و معدن و تجارت http://www.mimt.gov.ir
اتاق تعاون ایران http://www.icccoop.ir/
گمرک ایران http://www.irica.gov.ir/
اتاق بازرگانی تهران http://www.tccim.ir/
مرکز آمار ایران http://www.amar.org.ir/
بورس ایران

http://www.tsetmc.com/

http://www.new.tes.ir/

مرکز لرزه نگاری کشوری http://www.irsc.ut.ac.ir/
سازمان اسناد و کتابخانه ملی http://nlai.ir/

*این جدول به مرور تکمیل می شود.

براساس حجم :

توضیحات دیتاست لینک
ویکی پدیا – داده های بازدید صفحات در هر ثانیه ( حجم : 255 مگابایت ) https://datahub.io/dataset/english-wikipedia-pageviews-by-second
ویکی پدیا – داده های کلیک های کاربر ( حجم : 1.2 گیگابایت ) https://datahub.io/dataset/wikipedia-clickstream
ویکی پدیای انگلیسی ( حجم : 54 گیگابایت ) https://meta.wikimedia.org/wiki/Data_dump_torrents
ویکی پدیای انگلیسی به همراه آخرین ویرایش ها ( حجم : 13 ترابایت ) https://dumps.wikimedia.org/enwiki/
ویکی پدیا – داده های مربوط به شمارش صفحات ( حجم : 22 ترابایت ) https://dumps.wikimedia.org/other/pagecounts-raw/

*این جدول به مرور تکمیل می شود.