داده های آماده
در این بخش می توانید به داده های آماده عمومی که در پروژه های تحقیقاتی حوزه داده های کلان و هدوپ نیاز دارید دسترسی پیدا کنید:
دیتاست های جهانی:
توضیحات دیتاست | لینک |
دیتاست عمومی شرکت گوگل | http://www.google.com/publicdata/directory |
دیتاست بانک جهانی | http://datacatalog.worldbank.org/ |
دیتاست سازمان ملل | http://data.un.org/Explorer.aspx |
دیتاست شرکت آمازون | http://aws.amazon.com/public-data-sets/ |
*این جدول به مرور تکمیل می شود.
دیتاست های ایرانی:
توضیحات دیتاست | لینک |
بانک مرکزی | http://www.cbi.ir |
آموزش عالی کشور | http://www.irphe.ac.ir/ |
وزارت صنعت و معدن و تجارت | http://www.mimt.gov.ir |
اتاق تعاون ایران | http://www.icccoop.ir/ |
گمرک ایران | http://www.irica.gov.ir/ |
اتاق بازرگانی تهران | http://www.tccim.ir/ |
مرکز آمار ایران | http://www.amar.org.ir/ |
بورس ایران | |
مرکز لرزه نگاری کشوری | http://www.irsc.ut.ac.ir/ |
سازمان اسناد و کتابخانه ملی | http://nlai.ir/ |
*این جدول به مرور تکمیل می شود.
براساس حجم :
توضیحات دیتاست | لینک |
ویکی پدیا – داده های بازدید صفحات در هر ثانیه ( حجم : 255 مگابایت ) | https://datahub.io/dataset/english-wikipedia-pageviews-by-second |
ویکی پدیا – داده های کلیک های کاربر ( حجم : 1.2 گیگابایت ) | https://datahub.io/dataset/wikipedia-clickstream |
ویکی پدیای انگلیسی ( حجم : 54 گیگابایت ) | https://meta.wikimedia.org/wiki/Data_dump_torrents |
ویکی پدیای انگلیسی به همراه آخرین ویرایش ها ( حجم : 13 ترابایت ) | https://dumps.wikimedia.org/enwiki/ |
ویکی پدیا – داده های مربوط به شمارش صفحات ( حجم : 22 ترابایت ) | https://dumps.wikimedia.org/other/pagecounts-raw/ |
*این جدول به مرور تکمیل می شود.