当前位置:大学毕业论文> 技师论文>材料浏览

关于数据仓库论文范文写作 基于数据仓库银行个人信贷系统分析和设计相关论文写作资料

主题:数据仓库论文写作 时间:2024-03-29

基于数据仓库银行个人信贷系统分析和设计,这是一篇与数据仓库论文范文相关的免费优秀学术论文范文资料,为你的论文写作提供参考。

数据仓库论文参考文献:

数据仓库论文参考文献 论文系统信息系统项目管理论文数据挖掘论文论文查询系统

摘 要:近年来个人信贷在银行贷款中比例不断提高,但不良率也有攀升的趋势,强化个人信贷信用管理成为银行急需解决的问题.本文提出了利用数据仓库技术整合银行历史数据,构建了个人信贷数据仓库的整体架构,并对其数据的ETL、逻辑设计、安全性进行了探讨,为银行的个人信贷业务数据仓库的设计提供了实现方法.

关键词:银行个人信贷;数据仓库;主题;数据整合

文章编号:1003-4625(2011)01-0071-04中图分类号:F830.589文献标识码:A

数据仓库是一个面向主题的、集成的、非易失的且随时间变化的数据集合,用来支持管理人员的决策.信息社会带来了新的契机,构建成功的数据仓库已经成为许多行业的迫切需要.随着市场经济的发展,人们的消费观念发生了很大的变化,来自家庭和个人的融资需求急剧增加,个人贷款业务日渐升温,个人贷款消费群体不断扩大.为了满足个人的资金需求,我国商业银行开办了个人消费信贷业务.由于客户数量庞大,个人信贷已经成为银行利润新的增长点.但我国银行个人信贷业务仍存在不少问题,主要表现在:信贷管理机制尚未健全,难以确认消费信贷申请者的真实收入,常有发放出去的贷款难以收回;对个人信用档案的建立缺乏足够认识且技术落后,尤其是信贷管理数据库的技术落后;个人的信用评估机制尚未健全,缺乏对个人信用相关数据的分析,而通过让申请者提供抵押担保等方式,在审核上几番周折,业务效率低下.

在我国银行个人信贷业务发展的几年中,各业务系统已储存了大量的客户资料.若能建立起有效的数据管理机制,利用这些数据进行客户关系管理,不仅能使银行处于主动地位来进行有效的风险防范,也将极大提高个人信贷的业务效率.基于数据仓库技术构建了银行个人信贷系统(也称个人信贷数据仓库),可以充分利用银行已有数据为信贷业务提供决策支持.

一、个人信贷数据仓库的总体设计

需求是数据仓库的价值体现,基础数据的准备必须是从个人信贷业务需要解决的具体问题出发.根据不同的应用规模和应用要求,可以组建全局数据仓库和数据集市,形成有主有从的数据仓库目标系统,提高数据仓库的使用效率.

银行个人信贷数据仓库的数据来源主要是综合业务系统数据、信贷管理系统数据和外部数据.根据银行个人信贷业务的功能需求,提出了银行信贷决策支持系统的方案框架是一个具有三层体系结构的解决方案,系统的底层为数据仓库服务器端,中间层是OLAP服务器(决策支持分析引擎),前端是集成化的数据分析展现工具.数据仓库服务器使用后端工具和实用程序从操作数据库和外部信息源加载和刷新数据,主要功能包括数据采集、数据抽取转换以及数据的存储功能.本系统采用Microso SQLServer 2005建立数据仓库服务器,该工具提供了若干管理和开发组件,如关系数据库、数据ETL服务(SSIS)、联机分析工具、元数据服务和复制工具等.OLAP服务器是数据仓库和前端分析工具的桥梁,对需要分析的数据进行有效地集成,按多维模式予以组织,以便进行多角度、多层次的分析并传送给前端的分析工具显示.

二、个人信贷数据仓库的ETL实现

数据仓库的ETL系统是数据仓库中数据整理阶段的一个主要工具,它负责将分布的、异构数据源中数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础.ETL占用整个数据仓库设计工作量的60%-70%.

(一)数据抽取方法

数据抽取是捕获数据源的过程,主要方法有完全刷新和增量更新.数据的抽取需要既能满足决策的需要,又不影响业务系统的性能,所以进行数据提取时应制定相应的策略.通常情况下,流水型增长且数据量大的数据适合采用增量更新的方式;经常变化更新的数据适合采用完全刷新的方式;对于两者结合的数据,优先考虑增量更新的方式,其次考虑完全刷新的方式.对于提取周期要考虑实际业务的需要和提取进行的系统代价,在可能的情况下,尽量缩短提取周期.

(二)数据清洗和转换方法

因数据仓库数据取自不同数据库,需要经过清洗和转换才能进入数据仓库.在不同的数据库中对相对意义的字段可能有不同的值来表示,或者需要对数据库中的源表计算才能进入数据仓库的目标表.典型的数据清洗和转换方法有如下几种:

1.类型转换.在信贷管理系统中对客户性别采用0和1表示男和女,而在客户信息管理系统中采用M和F表示男和女.在本系统中将全部转换成M和F表示方法.

2.串操作.在客户资料目标表中客户地址是以国家、省市、区县、街道(镇)等表示方法,在客户信息目标表中就集成一个地址列.

3.数学函数.在客户分户清理过程中,需要对贷款分近期、远期等分类进行统计,在清理过程中直接对数据源数据进行统计获得.

4.参照完整性.在贷款数据加载中,首先要对客户信息目标表进行客户号完整性检查,以确保该客户已经存在域数据仓库中.

5.键字翻译.各种数据源数据都具有其业务处理过程中的关键字,需要转换成数据仓库的 关键字,以适应时间维等多维数据处理的需要.

6.聚类运算.数据仓库中大量聚集和概况的数据都可以在源数据向数据仓库清洗过程中计算,可以减少加载中程序的特别处理.

(三)个人信贷数据仓库ETL模型建立过程

本系统中采用的ETL工具是Microsoh SSIS工具.SSIS通过包来管理复杂的数据整合任务,通过控制流、数据流和事件处理程序等组件来处理这些任务.控制流由容器、任务和优先约束等控制流元素构成.容器提供包中的结构并给任务提供服务,任务在包中提供功能,优先约束将容器和任务连接成一个控制流.数据流由提取数据的源、修改和聚合的转换、加载数据的目标,以及将数据流组件的输出和输入连接为数据流的路径等元素构成.

SSIS的数据流任务封装数据流引擎.数据流引擎提供将数据从源移动到目标的内存中的缓冲区,并调用从文件和关系数据库中提取的数据的源.数据源系统是Sql server2005数据库,数据处理全部过程在SSIS平台上完成,处理的结果最终导入到Sqlsewer2005平台的数据仓库中.

这里通过一个案例说明数据仓库ETL的建立过程.银行总行在甲、乙、丙三个城市建立了分行机构,因此在个人信贷数据仓库中需要加入这三个分行的客户信息.三个分行的建立时间都不长,积累的数据量不多,首先把分行的业务数据库系统中的相关数据汇总到一个文本文件中,然后按分行建立三个表,通过SSIS的ETL功能把这些数据按照分行号(Branth_NO)将其分类,最后把数据导入新表中.图2和图3分别为SSIS处理过程的控制流图和数据流图.

三、数据仓库建模

结论:适合不知如何写数据仓库方面的相关专业大学硕士和本科毕业论文以及关于大数据仓库论文开题报告范文和相关职称论文写作参考文献资料下载。

基于数据仓库电力系统负荷预测
摘要:在现代化的社会中,数据仓库的性能和特点已经成为了电力系统负荷预测的重要内容。本文笔者针对电力系统负荷预测中引入数据仓库的好处等内容进行简单。

数据仓库在我国商业银行应用
摘要:随着我国商业银行改革、创新和国际化进程的不断深化,商业银行的公司治理必须同步改善,才能在激烈的竞争中谋求发展壮大。目前中国银行信息化的基础。

兴业银行绿色信贷业务风险
摘 要:全球环境的恶化,气候的变暖使人们开始意识到转变当前经济发展模式的重要性。银行业作为现代经济发展的核心,也逐步认识到自身经营模式与产品业务。

论文大全