• US
  • China
  • France
  • DACH
  • Italy
  • Japan
  • UK
  • 主页
  • JMP软件
    • JMP
    • JMP Pro
    • JMP Clinical
    • JMP Genomics
    • 免费试用
    • 购买JMP
    • 白皮书
    • 关于我们
  • 使用JMP
    • 应用行业
    • 应用领域
    • 学术教育
    • 客户案例
    • Capabilities
  • 新闻及活动
    • 近期活动
    • JMP新闻
    • JMP Blog
  • 用户资源
    • 技术支持
    • 专业培训
    • 交流论坛
    • Resource Center
    • File Exchange
    • User Community
  • 联系我们
  • 业务可视化
  • 探索性数据分析
  • 六西格玛及持续改善
  • 试验设计(DOE)
  • 可靠性
  • 统计分析
  • 统计建模
  • 交互式数据挖掘
  • 分析程序开发
  • 应用案例

多因子试验设计(DOE)的魅力

通过前面的介绍,我们已经初步认识到了DOE的强大分析功能。但是有的读者可能会不以为然:在此之前的两个案例中因子的数量太少(只有3个),而实际需要解决的问题会复杂得多,涉及的因子数量也可能会很多(至少有6个)。因此,他就可能会得出一个结论:DOE只适合于少数因子的问题分析,至于处理多因子问题,则显得无能为力了。

这个结论显然有失偏颇,其实DOE的一大特点就是可以处理包含多达50个(并不限于50个)因子的复杂问题,本期的主要内容就是向读者介绍多因子DOE的方法。

从理论上讲,上一期的DOE案例实质上采用的是完全因子设计(Full Factorial Design),这类方法在因子数量较少的时候实施起来比较方便。但是正如表一所示,当试验中的因子数量逐步增加时,试验次数却呈指数增加,庞大的试验规模意味着巨额的试验费用,意味着实施DOE的可行性越来越小。

表一 完全因子DOE的局限

因子数量 试验次数
2 4
3 8
4 16
5 32
6 64
7 128
8 256
9 512
10 1024
…… ……

为了解决这个矛盾,我们可以用一种更具魅力的方法——部分因子设计(Fractional Factorial Design)来替代一般的完全因子设计。顾名思义,部分因子设计源于完全因子设计,是与其对应的完全因子设计中的一部分。但究竟是哪一部分,是否可以随机选取?举一个简单的例子来说明。

表二显示的是一个完全因子设计的计划表,A、B和C表示三个主因子,+1和-1表示因子的两个不同水平,AB、AC和BC表示二阶交互作用,ABC表示三阶交互作用,总共需要做8次不同的水平组合来完成1次完全因子设计的计划。

表二 3因子的完全因子设计计划表

Run A B C AB AC BC ABC
1 -1 -1 -1 1 1 1 -1
2 1 -1 -1 -1 -1 1 1
3 -1 1 -1 -1 1 -1 1
4 1 1 -1 1 -1 -1 -1
5 -1 -1 1 1 -1 -1 1
6 1 -1 1 -1 1 -1 -1
7 -1 1 1 -1 -1 1 -1
8 1 1 1 1 1 1 1

以上这个试验计划适用于3个或以下因子,可支持8次试验运行的DOE。如果增加了第四个因子D,但依然只能支持8次试验运行时,我们应该怎么办呢?原来表二中的计划表有 8行7列,任意两列间是相互正交的。我们希望增加一列来安排因子D,而且希望此列仍然能与前面各列保持正交性。数学上可以证明,“找出一个与前 7 列不同的列而与前3 列保持正交”是不可能的。换句话说,D 列必须与第4、5、6、7列中的某列完全相同。完全相同意味着这两列的效应会被“混杂”(Confounded),即获得计算所得的分析结果后,分不清两种效应各是多少。权衡之下,我们认为取D=ABC 是最好的安排,因为通常主因子作用与三阶交互作用混杂的可能性最小。

根据上述决定,将D列取值设定与ABC列相同,并将其前移至第 4 列,可以得到表三所列的计划表

表三4因子的部分因子设计计划表

Run A B C D AB AC BC ABC(=D)
1 -1 -1 -1 -1 1 1 1 -1
2 1 -1 -1 1 -1 -1 1 1
3 -1 1 -1 1 -1 1 -1 1
4 1 1 -1 -1 1 -1 -1 -1
5 -1 -1 1 1 1 -1 -1 1
6 1 -1 1 -1 -1 1 -1 -1
7 -1 1 1 -1 -1 -1 1 -1
8 1 1 1 1 1 1 1 1

聪明的读者一定会猜到还可以使用图二的计划表继续构建出第5、第6乃至第7个因子,但试验的规模依然保留在8次。当然,当同等规模的试验中所涉及的因子数量越多时,产生“混杂”的概率会越大,后期分析结果的精确程度也会有所降低。这就是试验成本与分析精度这对矛盾的平衡,也是“部分因子设计”产生的基本原理。值得一提的是,在制定部分因子设计的具体方案时,不必如此繁琐地逐一推算,成熟的六西格玛统计分析软件JMP早已能够自动地实现了这一功能。

下面我们想通过一个发生在国外的DOE案例来体会部分因子设计的实际意义。

案例场景 :

ACB公司是一家网络公司,主要为个人用户提供服务。近阶段以来公司网站的点击数总体偏低,排名在同行业中持续下滑,高层管理层决定通过一个DOE项目找到少数几个关键因素,提高公司网站的每周访问量。经过初步分析,项目团队发现关键词的个数、关键词的类型、URL标题、每周的更新频率、关键词在标题中的位置和免费礼物是最具可能性的关键因子。但是如果按传统的完全因子设计的思路,至少要做26=64次试验,项目的时间跨度超过一年,分析结果的价值性大大降低,有什么好办法来克服这个困难呢?

实施:

显然,这个案例用部分因子设计的DOE来实现是再合适不过了。针对已知的6个关键因子,各取两个最具代表性的水平值,鉴于该项目的主要目的是寻找关键因子,选择筛选效率最高的设计方案26-3(=8),不同水平组合时分别运行1周,八周后统计相应的点击数量,结果如表四所示。

表四  DOE实施记录

URL标题 关键词的个数 关键词的类型 每周的更新频率 关键词在标题中的位置 免费礼物 点击数
短 5 旧 4 第70个字符 有 5083
长 5 旧 1 第40个字符 有 2272
短 10 旧 1 第70个字符 无 2012
长 10 旧 4 第40个字符 无 4328
短 5 新 4 第40个字符 无 6359
长 5 新 1 第70个字符 无 3676
短 10 新 1 第40个字符 有 4779
长 10 新 4 第70个字符 有 6549

接着,专业六西格玛统计分析软件JMP可以帮助我们做出具体的定性和定量的分析,不仅如此,它还等借助丰富生动的图形甚至动画将分析结果展现给我们。在此笔者不想强调过多的统计概念,只想用形象直观的图形说明分析结果。

图一  主因子作用的Pareto图

图二  主因子作用的正态性图

 

 

 

 

 

 

 

 

 

无论是从图一的Pareto图,还是从图二的正态性图,我们都能清晰地发现每周的更新频率和关键词的类型是影响点击数的关键因子。由此可见,在部分因子设计的思想指引下,多因子试验的时间成本、经济成本大大减少,而主要的分析目的没有受到丝毫的影响,多因子DOE的魅力正吸引着更多的工作人员将DOE的分析方法应用到更多的应用领域中。

试验设计的功效与应用

用试验设计获取突破性改进收益

试验设计知识

试验设计DOE及其应用知识目录

为什么用JMP做试验设计

试验设计五部曲

试验设计应用案例

白皮书

Interactive Data Mining and Design of Experiments

Split-Plot Designs: What, Why, and How

Efficient Modeling & Simulation of Biological Warfare Using Innovative Design of Experiments Methods

更多资源

JMP中国区案例库

JMP中国区课程录像

更多试验设计视频

六西格玛绩效突破及案例

什么是质量的“西格玛”水平

六西格玛改进(DMAIC)

六西格玛设计(DFSS)

六西格玛的中国式成功路径

JMP对六西格玛的的帮助

六西格玛新特点及软件的趋势

六西格玛相关案例及评论

更多...

SAS | JMP is a business unit of SAS.

  • JMP中国区 电话: 86 21 61633088 • 上海市浦东新区陆家嘴环路1233号汇亚大厦15楼
  • Terms of Use
  • Privacy Policy
  • Site Map
  • Contact