企业需要具备什么基础才能应用数据挖掘技术呢?SPSS数据挖掘项目经理戴庆祝表示,理想的起点是建立一个数据仓库,里面保存好所有客户的数据,以及市场竞争对手的相关数据。如果数据仓库还没有建起来就直接上数据挖掘应用,结果很可能中途夭折,因为数据挖掘前期几乎80%的工作都是在准备数据,把数据整合、抽取、清洗、转换、装载。如果给出的最初数据质量不高,模型再好,最后做出的预测也难如人意。 除此之外企业还要储备实施人员,除了项目管理者之外,还需要三类具有不同专长的人员,一是业务分析人员,精通业务,能够解释业务对象,并根据业务对象确定用于数据定义和挖掘算法的业务需求;二是数据分析人员,精通数据分析技术,熟练掌握统计学,能把业务需求转化为具体操作,并为每步操作选择合适的技术;三是数据管理人员,精通数据管理技术,了解数据源,负责数据准备过程。 同样,要成功完成一次数据挖掘过程,用户也既要熟悉业务,也要熟悉算法和模型,才能知道取出来的数据代表什么,算出来的结果又代表什么。而电信、金融等行业主导数据挖掘系统建设的大都是工科出身,不但业务不熟悉,对统计学也很生疏。由于双方面都对复合型人才有极大的需求,以致常出现用户挖厂商墙角、厂商再花大价钱回挖的人才拉锯战。
" ]/ x$ z: |; g3 S. r$ ~# q+ | |