公開數(shù)據(jù)集參考
如果您已開通MaxCompute服務(wù),可以通過MaxComputeSQL分析連接獲取到公開數(shù)據(jù)集中的表,并查詢這些表,以便您快速試用MaxCompute。本文為您介紹公開數(shù)據(jù)集信息,并指導(dǎo)您如何通過MaxComputeSQL分析連接查詢并分析數(shù)據(jù)。
MaxCompute開放的公開數(shù)據(jù)集類別包括:股票、二手房產(chǎn)、影視及票房、手機(jī)號碼歸屬、行政及城鄉(xiāng)區(qū)劃代碼信息。所有的數(shù)據(jù)均存儲在MaxCompute產(chǎn)品的公開項(xiàng)目MAXCOMPUTE_PUBLIC_DATA中。
聲明
MaxCompute提供的公開數(shù)據(jù)集數(shù)據(jù)只能用于產(chǎn)品測試,數(shù)據(jù)將不做周期更新,且不保障數(shù)據(jù)準(zhǔn)確性,因此請您勿用于正式生產(chǎn)。
注意事項(xiàng)
公開數(shù)據(jù)集通過MaxCompute的特殊授權(quán)機(jī)制實(shí)現(xiàn)公開授權(quán),對所有的MaxCompute用戶開放。在使用過程中,您需要注意:
公開數(shù)據(jù)集的數(shù)據(jù)均存儲在一個(gè)名為MAXCOMPUTE_PUBLIC_DATA的項(xiàng)目中,但所有用戶并未被加入到該項(xiàng)目中,即非項(xiàng)目空間成員。因此,用戶需要跨項(xiàng)目訪問數(shù)據(jù),在編寫SQL腳本時(shí),必須在表名前指定項(xiàng)目名稱。命令示例如下。
SELECT * FROM MAXCOMPUTE_PUBLIC_DATA.ods_enterprise_share_basic WHERE ds = '20170114';
說明公開數(shù)據(jù)集的數(shù)據(jù)無需付費(fèi)即可查看,但是執(zhí)行查詢語句會產(chǎn)生相應(yīng)計(jì)算費(fèi)用。費(fèi)用計(jì)算規(guī)則請參見計(jì)算費(fèi)用(包年包月)或計(jì)算費(fèi)用(按量計(jì)費(fèi))。
由于公開數(shù)據(jù)集需要跨項(xiàng)目訪問,您在DataWorks的數(shù)據(jù)地圖中無法查找到公開數(shù)據(jù)集中的表。
公開數(shù)據(jù)集
MAXCOMPUTE_PUBLIC_DATA項(xiàng)目數(shù)據(jù)集中的表詳細(xì)信息如下。
股票
項(xiàng)目名稱
MAXCOMPUTE_PUBLIC_DATA
表名稱
股票相關(guān)表信息如下:
ods_enterprise_share_basic(股票基本信息表)
ods_enterprise_share_quarter_cashflow(季度現(xiàn)金流報(bào)表)
ods_enterprise_share_quarter_growth(季度業(yè)務(wù)增長數(shù)據(jù)表)
ods_enterprise_share_quarter_operation(季度財(cái)務(wù)周轉(zhuǎn)數(shù)據(jù)表)
ods_enterprise_share_quarter_profit(季度利潤表)
ods_enterprise_share_quarter_report(季度報(bào)表)
ods_enterprise_share_trade_h(股票價(jià)格表)
更新周期
提供固定日期分區(qū)的數(shù)據(jù),不再做增量更新。
查詢表結(jié)構(gòu)
DESC MAXCOMPUTE_PUBLIC_DATA.table_name;
查詢示例
SELECT * FROM MAXCOMPUTE_PUBLIC_DATA.ods_enterprise_share_basic WHERE ds ='20170114';
二手房產(chǎn)
項(xiàng)目名稱
MAXCOMPUTE_PUBLIC_DATA
表名稱
dwd_prouduct_house_basic_info_out(二手房數(shù)據(jù))
更新周期
提供固定日期分區(qū)的數(shù)據(jù),不再做增量更新。
查詢表結(jié)構(gòu)
DESC MAXCOMPUTE_PUBLIC_DATA.table_name;
查詢示例
SELECT * FROM MAXCOMPUTE_PUBLIC_DATA.dwd_prouduct_house_basic_info_out WHERE ds= '20170113';
影視及票房
項(xiàng)目名稱
MAXCOMPUTE_PUBLIC_DATA
表名稱
影視及票房相關(guān)表信息如下:
dwd_product_movie_basic_info(電影基本信息表)
ods_product_movie_box(票房基本信息表)
更新周期
提供固定日期分區(qū)的數(shù)據(jù),不再做增量更新。
查詢表結(jié)構(gòu)
DESC MAXCOMPUTE_PUBLIC_DATA.table_name;
查詢示例
SELECT * FROM MAXCOMPUTE_PUBLIC_DATA.dwd_product_movie_basic_info WHERE ds ='20170112' limit 10;
行政及城鄉(xiāng)區(qū)劃代碼
項(xiàng)目名稱
MAXCOMPUTE_PUBLIC_DATA
表名稱
dwd_product_areacode_basic_info_2020(2020年行政及城鄉(xiāng)區(qū)劃代碼基本信息表)
更新周期
提供固定數(shù)據(jù),不再做增量更新。
查詢表結(jié)構(gòu)
DESC MAXCOMPUTE_PUBLIC_DATA.table_name;
查詢示例
SELECT * FROM MAXCOMPUTE_PUBLIC_DATA.dwd_product_areacode_basic_info_2020 limit 10;
手機(jī)號碼歸屬地
項(xiàng)目名稱
MAXCOMPUTE_PUBLIC_DATA
表名稱
dwd_product_phoneno_basic_info_2020(2020年手機(jī)號歸屬地基本信息表)
更新周期
提供固定數(shù)據(jù),不再做增量更新。
查詢表結(jié)構(gòu)
DESC MAXCOMPUTE_PUBLIC_DATA.table_name;
查詢示例
SELECT * FROM MAXCOMPUTE_PUBLIC_DATA.dwd_product_phoneno_basic_info_2020 limit 10;
原始樣本骨架
從淘寶網(wǎng)站中隨機(jī)抽樣100+萬用戶8天內(nèi)的展示廣告點(diǎn)擊日志,構(gòu)成原始的樣本骨架。
項(xiàng)目名稱
MAXCOMPUTE_PUBLIC_DATA
表名稱
raw_sample
更新周期
提供固定數(shù)據(jù),不再做增量更新。
查詢表結(jié)構(gòu)
DESC MAXCOMPUTE_PUBLIC_DATA.table_name;
查詢示例
SELECT * FROM MAXCOMPUTE_PUBLIC_DATA.raw_sample limit 10;
廣告基本信息
涵蓋了raw_sample表中部分廣告的基本信息。
項(xiàng)目名稱
MAXCOMPUTE_PUBLIC_DATA
表名稱
ad_feature
更新周期
提供固定數(shù)據(jù),不再做增量更新。
查詢表結(jié)構(gòu)
DESC MAXCOMPUTE_PUBLIC_DATA.table_name;
查詢示例
SELECT * FROM MAXCOMPUTE_PUBLIC_DATA.ad_feature limit 10;
用戶基本信息
涵蓋了raw_sample中全部用戶的基本信息。
項(xiàng)目名稱
MAXCOMPUTE_PUBLIC_DATA
表名稱
user_profile
更新周期
提供固定數(shù)據(jù),不再做增量更新。
查詢表結(jié)構(gòu)
DESC MAXCOMPUTE_PUBLIC_DATA.table_name;
查詢示例
SELECT * FROM MAXCOMPUTE_PUBLIC_DATA.user_profile limit 10;
用戶的行為日志
涵蓋了raw_sample中全部用戶22天內(nèi)的購物行為。
項(xiàng)目名稱
MAXCOMPUTE_PUBLIC_DATA
表名稱
behavior_log
更新周期
提供固定數(shù)據(jù),不再做增量更新。
查詢表結(jié)構(gòu)
DESC MAXCOMPUTE_PUBLIC_DATA.table_name;
查詢示例
SELECT * FROM MAXCOMPUTE_PUBLIC_DATA.behavior_log limit 10;
使用公開數(shù)據(jù)集
開通MaxCompute服務(wù)后,您可以登錄MaxCompute控制臺,單擊查詢編輯,進(jìn)入DataWorks數(shù)據(jù)分析頁面,執(zhí)行SQL語句查詢、分析和下載公開數(shù)據(jù)集中的表數(shù)據(jù)。快速使用操作請參見快速體驗(yàn)MaxCompute。
例如,您可以通過MAXCOMPUTE_PUBLIC_DATA.dwd_product_phoneno_basic_info_2020(手機(jī)號碼歸屬地信息表)查詢號碼段1779980的詳細(xì)信息。命令示例如下。
SELECT * FROM MAXCOMPUTE_PUBLIC_DATA.dwd_product_phoneno_basic_info_2020 WHERE phoneno='1779980';
返回結(jié)果如下。