1、摘 要:随着计算机信息技术的发展,信息共享使得人们能得到越来越多的数据,与此同时也出现了分析这些海量数据的一门技术数据挖掘技术。基于数据挖掘的烟草销售行业可以将抽象的管理和服务理念数字化、直观化,从而发掘潜在的有价值的信息,帮助企业寻找新客户和新商机,制定更符合烟草销售市场的经营策略,提高企业竞争力。关键词:数据挖掘;烟草销售;数据烟草销售部门在每天的销售业务中都会产生大量数据,而利用目前的数据库系统只能实现数据的录入、查询、统计等基本功能,却无法发现数据中存在的关系和规则,更无法根据现有的数据预测未来的发展趋势。由于缺乏挖掘数据背后隐藏的知识的手段,导致了数据爆炸时代知识贫乏现象的产生。数据
2、挖掘是信息领域发展最快的技术之一,它可以高度自动化地分析所获得的数据,通过对市场信息的分析与挖掘,更好地进行销售分析与预测,帮助其决策者做出正确的决策。此外,烟草销售行业还可以利用数据挖掘技术与消费者建立紧密关系,促使企业不断改进服务质量,提高企业竞争力。1 数据挖掘概述1.1 数据挖掘的定义对于数据挖掘,一种比较公认的定义是w.j.frawley,g.piatetsk shapiro等人提出的。所谓的数据挖掘,就是从大型数据库的数据中提取人们感兴趣的知识,这些知识是隐含的、事先未知的、潜在有用的信息。提取的知识表示为概念(concepts),规则(rules)、规律(regularities
3、)、模式(patterns)等形式。从技术角度看,数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的,但又是潜在的和有用的信息和知识的过程。它是一门广义的交叉学科,涉及数据库技术、人工智能、机器学习、神经网络、统计学、模式识别、知识库系统、知识获取、信息检索、高性能计算和数据可视化等多学科领域且本身还在不断发展。从商业角度看,数据挖掘是一种深层次的商业信息分析技术。其主要特点是对商业数据库中的大量业务数据进行制取、转换、分析,从中提取辅助商业决策的关键性数据。数据挖掘最吸引人的地方是它能建立预测模型而不是回顾旧的模型。利用功能强大的数据挖
4、掘技术,可以使企业把数据转化为有用的信息帮助决策,从而在市场竞争中获得优势地位。1.2 数据挖掘的过程(1)数据准备阶段:分析问题,选择相关的数据,再对数据进行净化,消除噪声数据、无关数据和冗余数据,完成数据的转化。(2)挖掘阶段:该阶段是数据挖掘的核心步骤,根据数据挖掘的目标,应用相应的数据挖掘算法,分析数据并通过可视化工具表述所获得的模式或规则。(3)结果分析:对数据挖掘的结果进行解释和评价,转换成为能够最终被用户理解的知识。(4)知识运用:将分析所得到的知识集成到业务信息系统的组织结构中去。其挖掘过程可由图1所示:1.3 数据挖掘的主要方法(1)关联分析:用关联规则挖掘大量数据中项集之间
5、的有趣联系。它的主要应用领域是购物篮分析,也可对市场促销活动的有效性进行挖掘。此外,关联规则也可用于序列模式发现。序列模式发现的侧重点在于分析数据项集在时间上或序列上的前后(因果) 规律,可以看作是一种特定的关联规则。(2)分类分析:它能将数据库中的数据项,映射到给定类别中的一个。分类方法在人们的日常生活和商务领域中普遍存在。分类定义了一种从属性到类别的映射关系,给定样本的属性值,根据已知的模式将其划分到特定的类中。(3)聚类分析:聚类是根据一定的规则, 按照相似性把样本归成若干类别。在对样本合理划分后,对不同的类进行描述。聚类通常用于将客户细分成不同的客户群, 如有相同爱好的客户群。聚类方法
6、包括统计方法、机器学习方法、神经网络方法和面向数据库的方法。(4)孤立点分析。孤立点的存在不符合数据的一般模型,它们极有可能是度量或执行错误所导致的。许多数据挖掘算法试图使孤立点的影响最小化,或者排除它们。但是由于一个人的噪声可能是另一个人的信号,这可能导致重要的隐藏信息的丢失。在烟草市场分析中对这些数据进行分析,可用于确定极低或极高收人的客户的消费行为。2 数据挖掘在烟草销售行业中的应用数据挖掘技术已经被广泛应用于各级商业系统中,笔者认为,在烟草销售行业中可以通过对客户信息的数据挖掘对其进行分析,以便制定有效、灵活的销售策略。2.1 对目标市场客户的聚类与分类销售部门可以将具有相同销售习惯和
7、消费行为的客户分为一组。将客户划分为不同类别进行服务与管理,体现了客户群策略和客户发展策略。有效的聚类和协同过滤方法有助于识别客户组,以及推动目标市场。然后利用分类技术,对客户特征进行建模,描述出客户群的特征,设定相应的客户级别,以便对不同类别的客户实施个性服务。2.2 客户价值分析在实施客户分类之后根据“二八原则”,找出重点客户,即对给销售部门创造了80%价值的20%客户实施最优质的服务。重点客户的发现通常采用一系列数据处理、转换过程、人工智能等数据挖掘技术来实现。在不预先确定特征化目标的前提下, 将重点客户的销售数据进行适当的聚类分析, 可以获得许多信息, 哪些客户、哪些地区喜爱某产品?哪
8、些地区、客户对于某一新产品销售好(或差)?特别要重视对孤立点分析:对于偏离聚点的对象, 即孤立点, 这些客户的忠诚度值得警惕, 有可能流失。同时根据历史数据, 分析商品销售随时变化的群体趋势, 包括分析对于时间相关的数据以便保留已有客户和发展新客户。2.3 客户行为分析找到重点消费主体之后,可对其进行客户行为分析,发现客户的行为偏好,为客户贴身定制特色服务。我们需要通过销售量、销售额在不同客户类型上的分布情况, 确定为企业创造高利润的重点客户, 确定增长最快的客户群体, 发现流失或即将严重流失的客户群体等。进一步研究区域、客户对不同类型烟草的偏好, 挖掘潜在烟草市场, 为市场开拓、保持客户提供
9、决策依据。如: 对于企业销售量最大, 创造利润最多的重点客户分析其销售量(或销售额)占40%以上的产品或销售量增加20% 以上的产品分别作为目标类, 确定重点客户的偏好, 以提供生产及客户服务。同时,通过对不同客户群组之间的交叉挖掘分析,可以发现客户群体间的变化规律,并可通过数据仓库的数据清洁与集中过程,将客户对市场的反馈自动输入到数据仓库中。通过对客户的理解和客户行为规律的发现,企业可以制定相应的销售策略。数据挖掘技术可以用来发现数据库中对象演变特征或对象变化趋势,这些信息对于决策或规划是有用的,烟草行业数据的挖掘有助于根据顾客的流量安排工作人员。可以挖掘烟草制品交易数据,发现可能帮助你制定
10、投资策略的趋势数据。挖掘给企业带来的潜在的投资回报几乎是无止境的。当然,数据挖掘中得到的模式必须要在现实生活中进行验证。参考文献1张雪莲bp神经网络图书文献经费预测模型j情报杂志,2006,(6):115-116.2张文彤spss统计分析教程 m北京:希望电子出版社,2002.3仲东亭,张王月.bp神经网络对烟草销售量预测方法的改进研究j工业技术经济,2007, (9):115-118.4滕昕西安市旅游客源预测的人工神经网络方法分析 j西安电子科技大学学报,2006,(5):21-22.5刘向峰,于洪鹏基于数据挖掘的烟草消费者数据库营销研究 j物流科技,2010,(6):140-142.6欧阳秀军数据挖掘技术在卷烟市场中的应用j集团经济研究,2007,(10):316.7虞文进数据挖掘技术在烟草企业中的应用j计算机工程,2002,(4):269.8欧阳秀军,刘文数据挖掘技术在烟草crm 中的应用j井冈山学院学报,2009,(6):42.