初学者,老师即布置难题,求帮助
数据说明:数据见附件crm_for_cluster_mini,列名分别是:age:年龄,sex:性别,scomb_msg:crm全量数据中的套餐名,scomb_msg_bxl:crm不限量数据中的套餐名(非不限量套餐则为空),register_time(注册时间),is_school_user(是否高校用户),flow_12(2018年12月流量),flow_11(2018年11月流量),flow_10(2018年10月流量),flow_09(2019年9月流量),flow_08(2018年8月流量)。
其中,crm不限量套餐如果有套餐名,就以这个套餐名为准,如果没有crm不限量套餐名,就以全量套餐名为准
请用python对附件数据进行聚类分析和可视化呈现
注:1、需要对数据进行预处理;
2、按照自己的理解和思路,选取合适特征及算法进行聚类分析;
3、提交代码及结果的同时请将自己操作的思路描述清晰