本文由中国科学软件网整理
IBM SPSS Statistics统计分析应用软件介绍
利用数据分析解决严峻的业务和研究挑战
IBMSPSS Statistics 是集成的系列产品,有助于应对整个分析流程,从规划和数据收集到分析、报告和部署。提供数十种完全集成的模块供您选择,您可以找到增加收入、超越竞争对手和改善决策所需的专业化的功能。
IBM SPSS Statistics各模块介绍
IBM SPSS Advanced Statistics
功能强大的建模技术,用于分析复杂的关系
IBM SPSS Advanced Statistics 提供单变量和多变量的建模技术,帮助用户在处理描述复杂关系的数据时,得到最准确的结论。通过频繁应用这些成熟的分析技术,可以从各学科(例如,医学研究、制造、制药和市场研究)使用的数据中获得更深入的洞察力。
SPSS Advanced Statistics 提供以下功能:
一般线性模型 (GLM)和混合模型程序。
广义线性模型 (GENLIN),包括广泛使用的统计模型,例如针对正态分布数据的线性回归、针对二元数据的逻辑模型,以及针对计数数据的对数线性模型。
线性混合模型(也称为分层线性模型,HLM)扩展了 GLM 程序中使用的一般线性模型,使您能够分析具有相关性和非恒定可变性(non-constant variability)的数据。
广义估算方程 (GEE) 程序扩展了广义线性模型,适用于关联的纵向数据和聚类数据。
广义线性混合模型 (GLMM),用于分层数据和各种结果,包括序数值。
生存分析程序,用于检验生存期数据或持续时间数据。
线性混合模型的估算平均值
GLMM 提供估算的边际均值,用于说明预测变量的影响。
广义线性混合模型的模型摘要
GLMM 模型摘要展示了模型与数据的拟合程度。
广义线性混合模型可视化
GLMM 提供了模型的可视表示,您可以直观看到每个预测因素的强弱。在本示例中,promo 变量对销售影响最大。
IBM SPSS Bootstrapping
创建更可靠的模型并生成更准确的结果
IBM SPSS Bootstrapping 是一种确保分析模型可靠且能生成准确结果的有效方式。它可用于测试整个 SPSS Statistics 产品家族中分析模型和程序的稳定性,包括描述性统计信息、平均值、交叉表、相关、回归等。
SPSS Bootstrapping 支持您:
通过对原始样本的替代项进行重抽样,快速轻松地估算抽样分布特征。
为数据集合创建数以千计的可替换版本,以更准确地了解哪些数据最有可能存在于总体中。
减少离群值和异常值的影响,帮助确保模型的稳定性和可靠性。
估算总体参数的标准误和置信度区间,这些总体参数包括平均值、中值、比值、优势率、相关系数、回归系数等。
描述性表格
描述性表格提供了描述性的统计信息,以及这些统计信息的 bootstrap 置信区间。平均值的 bootstrap 置信区间 (86.39, 105.20) 与参数化的置信区间 (86.42, 105.30) 类似,表示“典型”员工大约具有 7 到 9 年的工作经验。但是,工作经验(月)呈偏态分布,因此平均值不能够很理想地代表当前的“典型”工资,这里使用中值会稍好一些。
IBM SPSS Categories
预测结果,揭示分类数据中的关系
IBM SPSS Categories 方便地直观呈现和探索数据中的关系,并根据您的发现预测结果。您可以使用先进的技术(例如,预测分析、统计学习、感知图和首选项缩放),了解消费者心目中认为与您的产品或品牌相关性最高的特征有哪些,并了解消费者对于您的产品与其他产品之间关联的认知。
SPSS Categories 包含先进的分析技术,用于帮助您:
更完整更轻松地分析和解释多变量数据及这些数据之间的关系。
通过对分类数据执行额外的统计操作,将定性变量转变为定量变量。
无论您调研的是何种类别类型,包括消费群、医疗诊断、政治党派或生物物种,都能以图形化方式显示底层关系。
IBM SPSS Complex Samples
分析复杂样本的统计数据并解释调查结果
IBM SPSS Complex Samples 帮助市场研究人员、民意调查人员和社会学家通过将样本设计整合到其调研分析中,提供更有效的统计推论。 SPSS Complex Samples 为您提供实施复杂样本设计(例如,分层抽样、整群抽样或多阶段抽样)所需的专门规划工具和统计信息。
将样本设计整合到调研分析中,以获得更准确的结果。
保留调查规划参数供将来使用,从而加快分析速度,提高效率。
管理复杂的调查数据以开展彻底的详细分析。
使用直观的界面和实用的向导,更快速地分析数据和解释调研结果。
分析规划向导
要分析样本数据,请使用由“分析规划向导(Analysis Plan Wizard)”创建的分析设计,作为“复杂样本描述性统计数据(Complex Sample Descriptives)”或“复杂样本制表(Complex Sample Tabulate)”的输入。
通用线性模型
构建线性回归和方差分析模型,预测考虑样本设计的情况下的数字结果。该程序在估算方差时将样本设计考虑在内,抽样方法包括等概率抽样方法、PPS 抽样方法以及 WR 与 WOR 抽样方法。
参数估算
参数估算显示每个预测变量对所花费金额造成的影响。截距项的值 518.249 说明,杂货连锁店可以预测,使用报纸以及有针对性的邮寄广告上优惠券的家庭平均花费为 518.25 美元。参数估算有助于量化每个模型项的影响,但是估算的边界均值表格也能轻松解释模型结果。
抽样规划向导
指定抽样框架以创建复杂样本设计,该设计由复杂样本附加模块中的伴随程序所使用。要对个例进行抽样,请使用由抽样规划向导所创建的样本设计,作为复杂样本选择程序的输入。
IBM SPSS Conjoint
了解和衡量购买决策
IBM SPSS Conjoint 帮助市场研究人员增加对消费者喜好的了解,以便更有效地设计、定价和营销成功产品。它支持研究人员对消费者决策过程进行建模,以便设计出包含对目标市场最重要的功能和属性的产品。
SPSS Conjoint 可帮助研究人员:
使用设计生成器 ORTHOPLAN设计产品属性组合的正交阵列。
制作并打印卡片供调研受访者对备选产品进行挑选、排序或评级。
使用结合分析(conjoint analysis,一种专门定制的回归版本)分析研究数据。
正交设计
正交设计的输出结果是每个剖面(profile)具有对应的一行,而各种因素显示为列。脚注可使实验人员(而非其他测试参与者)了解哪些个例(如果有)为保留个例。
结果表
该表指出,在使用三个不同选择概率模型的情况下,选择每个模拟个案作为首选的预测概率。
模拟个案
联合分析的真正威力在于,能够对未经主体评级的产品概要信息预测首选项。这些即所说的模拟个案。模拟个案、来自正交设计的概要信息(profile)以及检验用的概要信息(profile)都包含在计划中。
实用程序评分
该表显示了实用程序(效用值)评分及其每个因子级别的标准误。实用程序值越高,表示首选项越好。
IBM SPSS Custom Tables
分析数据并在更短的时间内创建定制表
使用 IBM SPSS Custom Tables 能轻松针对不同受众以不同样式总结 IBM SPSS Statistics 数据。它结合了多种分析功能,您可以构建人们非常容易阅读和明白的表,帮助您从数据中了解更多信息。
该软件对于那些定期创建和更新报告的用户很实用,尤其是那些从事调查或市场研究、社会科学、数据库或直销、院校研究工作的人。
SPSS Custom Tables 帮助您:
执行深入的分析,以便更好地了解自己的数据并为决策者提供改进的报告。
在构建表时进行预览,确保在更短时间内创建精炼、准确的报告。
定制表的布局和外观,以清晰准确地表达结果。
通过提供人们无需进一步处理即可作为行动依据的信息,保证结果的易用性。
拖放式表构建方法
SPSS Custom Tables 直观的图形用户界面使您不再需要靠猜测来构建表。其拖放功能和预览窗格使您可在单击“确定”之前,对表格的内容和外观进行检查。
图形用户界面
直观的界面可帮助您轻松构建复杂的表,包括嵌套和堆积表。
可定制的表格式
SPSS Custom Tables 提供一系列选项,帮助您控制表格的外观,包括添加标题和文字说明、指定列宽以及排列和隐藏类别的功能。
多个汇总统计
将各种统计信息添加至各个表单元格(从针对分类变量的简单计数到离差测定),并按照使用的任何汇总统计信息对类别进行排序。
IBM SPSS Data Preparation
改进数据准备过程,生成更准确的结果
IBM SPSS Data Preparation 执行先进技术,以简化分析过程的数据准备阶段,从而更快速、更准确地提供数据分析结果。分析人员可以从完全自动化的数据准备过程中进行选择,从而最快地获得结果,或者从其他几种方法中进行选择来准备更具有挑战性的数据集。
利用该软件,您可以轻松发现可疑或无效的个例、变量和数据值。验证数据工具帮助您发现活动数据集中可疑和无效的个例、变量及数据值。
SPSS Data Preparation 有助于:
自动执行数据准备过程- 消除复杂且耗时的人工数据准备工作。
无需人工检查即可验证数据- 更快速更准确地执行数据验证。
防止异常值破坏分析- 自动检测可能影响结果的异常情况。
自动数据准备
自动数据准备帮助用户通过自动执行冗长且重复的任务,为分析准备数据。这可提高分析速度、预测能力和可信度,帮助用户将可能在原始状态下被排除的数据包含在内。
验证数据
验证数据工具帮助您发现活动数据集中可疑和无效的案例、变量及数据值。例如,为客户提供月度客户满意度报告的数据分析人员,可使用该功能检查不完整的客户标识、范围之外的变量值和经常错误输入的变量值组合。
异常检测原因汇总
该表汇总了每个变量作为主要原因的作用。此表汇总变量影响的统计信息,包括针对每个变量报告的最小影响、最大影响和平均影响,以及作为多个个例原因的变量的标准偏差。
验证数据个例报告
该个例报告显示了违反多变量规则的个例,以及违反单变量规则的个例。这些个例都需要进行报告,作为数据输入以进行纠正。
IBM SPSS Decision Trees
轻松标识群组并预测成果
IBM SPSS Decision Trees 帮助您更好地标识群组,发现各个群组之间的关系,并预测未来事件。该模块包含可视化程度非常高的分类和决策树,支持您以直观方式提供分类结果,以便更清晰地向非技术受众解释分类分析。它包含四种 tree-growing 算法,您可以尝试不同的类型并发现最适合自己数据的算法。
该模块提供专门的树构建技术,用于在 IBM SPSS Statistics 环境内进行分类。四种 tree-growing 算法分别是:
CHAID- 一种快速、统计型的多向树算法,用于快速高效地探索数据,并针对期望的结果构建分段和概要信息。
穷举式 CHAID- CHAID 的一种变体,用于检查每个预测项所有可能的分支。
分类和回归树 (C&RT)- 一个完整的二叉树算法,用于对数据进行分区,并生成准确的同构子集。
QUEST- 一种统计算法,可快速高效地选择不包含偏差的变量,并构建准确的二叉树。
打开对话框
使用“决策”树对话框,选择要测量的因变量和自变量以及选择树生长方法。
CHAID 方法
树形图是树模型的图形表示。该树形图显示,使用 CHAID 方法时,收入级别是信用评级的最佳预测变量。
风险和分类表
风险和分类表可以快速评估用于按信用等级对客户分类的模型的有效性。
基于树的分类模型
“决策”树过程用于创建基于树的分类模型。它将个例分类成群组,或根据自变量(预测变量)来预测因变量(目标)的值。
SPSS Direct Marketing
轻松识别合适的客户,改进营销活动结果
IBM SPSS Direct Marketing 帮助您更深入地了解客户,改进营销活动,最大程度实现市场营销预算的投资回报 (ROI)。该软件提供针对您客户或联系人的复杂分析 - 使您的结果具有极高的可信度。SPSS Direct Marketing 使用功能强大的分析、直观的界面和“记分向导”帮助简化数据记分。运行分析后,输出的重要性已不言而喻。
SPSS Direct Marketing 支持数据库工作人员和直销人员:
针对各个客户群开发市场营销战略。
确定哪些客户有可能响应特定的促销报价。通过仅向可能响应的客户发送邮件,推动收入增长并降低成本。
比较直邮营销活动的效果,并按邮政编码标识对营销活动的响应。
连接至 Salesforce.com来抽取客户信息、收集商机详细信息并执行分析。
从各种分析选项中进行选择,包含 RFM 分析(recency, frequency and monetary value) - 最近购买时间,购买频率和总购买金额)、集群分析、潜在客户概要分析、邮政编码分析、倾向性记分和控制包测试。
预防垃圾邮件投诉,方法是监控发送至每个客户组的电子邮件的频率。
IBM SPSS Exact Tests
准确分析小型数据集或包含偶发事件的数据集
IBM SPSS Exact Tests 支持您使用小型样本,但仍能够保持结果的可信度。如果您具有少量案例变量,其中某个类别响应百分比较高,或者必须将数据分为多个细目,那么传统测试可能不正确。SPSS Exact Tests 可以消除这种风险。
利用 SPSS Exact Tests,您可以:
随时运行测试,只需单击按钮即可。
从 30 余项精确测试中进行选择,这些测试涵盖从非参数数据到分类数据的整个数据范围,包括小型或大型数据集、偶发事件表和关联性测量。
将数据详细分割为细目。不存在要求每个单元格中预期数据计数达到五个或更多才能获得正确结果的限制。
在大型数据集中搜索偶发事件。
保留原始设计或自然分类(例如,区域、收入或年龄组)并按您的意图进行分析。
IBM SPSS Forecasting
无需技能即可构建复杂的时间序列预测
IBM SPSS Forecasting 使分析人员能够快速轻松地预测趋势和制定预测,而无需具备专业的统计技能。不太熟悉预测的人员即可创建考虑多个变量的复杂预测,而经验丰富的预测人员可以使用 SPSS Forecasting 来验证其模型。时间序列预测示例包括预测每天呼叫中心所需员工数量或者预测特定产品或服务的需求。SPSS Forecasting 可为您的每一个步骤提供帮助,使您可以更快速地获得所需信息。
SPSS Forecasting 可提供各种功能,例如:
指导性分析,通过模型构建过程为经验欠缺的用户提供支持。
更多选择和定制选项,使经验丰富的分析人员可以控制预测流程。
强大的时间序列建模过程,帮助您快速开发可靠的预测。
节省时间功能,允许您以快速可靠的方式创建和更新预测。
灵活的输出选项,简化向组织决策制定者提供易于理解的实用信息的过程。
时间因果关系模型
此图显示了与时间因果关系模型系统中的前 10 个模型(最匹配的模型)关联的因果关系。监控关键绩效指标并跟踪各种可控指标(称为杠杆)数据的企业希望确定杠杆与 KPI 之间的因果关系,以便了解哪些杠杆影响哪些 KPI。该公司还希望了解在各 KPI 之间是否存在因果关系。
IBM SPSS Missing Values
估算缺失数据时构建更好的模型
IBM SPSS Missing Values 软件供调查研究人员、社会学家、数据挖掘人员和市场研究人员等用于验证数据。该软件支持您检验数据来发现缺失数据模式,然后使用统计算法估算摘要统计并对缺失值进行归因。
利用 SPSS Missing Values 软件,您可以对缺失数据进行归因,得出更有效的结论并消除隐藏的偏差。
使用诊断报告快速诊断缺失数据归因问题。
使用多个归因模型将缺失数据值替换为估算值。
显示和分析模式以获取洞察并改善数据管理。
IBM SPSS Neural Networks
发现数据中更复杂的关系
IBM SPSS Neural Networks 软件提供非线性数据建模程序,使您能够发现数据中更为复杂的关系。您可以使用该软件设置网络学习的条件。您可以控制培训停止规则和网络体系结构,或者让程序自动为您选择体系结构。
利用 SPSS Neural Networks 软件,您可以开发更准确且更有效的预测模型。
使用“多层感知器 (Multilayer Perceptron, MLP)”或“径向基函数网络 (Radial Basis Function, RBF)”程序,挖掘数据中的隐藏关系。
通过指定变量,从始至终控制过程。
结合其他统计程序或技术以获取更深入的洞察。
多层感知器程序 (MLP)
多层感知器程序根据预测变量的值,针对一个或多个因(目标)变量产生预测模型。在本例中,我们通过构建模型来预测顾客流失率。
IBM SPSS Regression
利用高级回归过程提高预测的准确性
IBM SPSS Regression 软件使您能够预测分类结果,并应用各种非线性回归过程。您可以将这些过程应用于某些业务和分析项目,在这些项目中,普通回归技术受限或者不适用,例如,研究消费者购买习惯、对治疗进行响应或者分析信贷风险。
利用 SPSS Regression 软件,您可以扩展 IBM SPSS Statistics Base 的能力,将其用于分析过程中的数据分析阶段。
使用多项式逻辑回归 (MLR),针对两个以上的类别预测分类结果。
使用二元逻辑回归,轻松将数据分类到各组。
使用非线性回归 (NLR) 和受限非线性回归 (CNLR)估算非线性模型的参数。
使用加权最小二乘法和二阶段最小平方法满足统计假定。
使用概率分析估算刺激值。
IBM SPSS Statistics Base
统计分析必不可少的工具
IBM® SPSS® Statistics Base 是一款统计分析软件,提供执行全程分析所需的核心功能。它易于使用,包含范围广泛的过程和技术,能帮助您增加收入,超越竞争对手,开展研究并制定更好的决策。
SPSS Statistics Base 为分析过程的每一步都提供了必要的统计分析工具。
范围全面的统计过程,用于执行准确的分析。
内置的技术用于快速方便地准备分析数据。
复杂的报告功能,以高效地创建图表。
强大的可视化功能,清晰显示您发现的重要性。
支持所有数据类型,包括超大型数据集。
登录页面
重新设计了登录页面,使用户能够快速轻松地找到所需的 SPSS Statistics 功能。