Table Of ContentSYSTAT 11
®
Statistics
®
WWW.SYSTAT.COM
For more information about SYSTAT® software products, please visit our WWW site
at http://www.systat.com or contact
Marketing Department
SYSTAT Software, Inc.
501,Canal Boulevard, Suite C
Richmond, CA 94804
Tel: (800)-797-7401
Fax: (510) 231-4789
Windows is a registered trademark of Microsoft Corporation.
General notice: Other product names mentioned herein are used for identification
purposes only and may be trademarks of their respective companies.
The SOFTWARE and documentation are provided with RESTRICTED RIGHTS. Use,
duplication, or disclosure by the Government is subject to restrictions as set forth in
subdivision (c)(1)(ii) of The Rights in Technical Data and Computer Software clause at
52.227-7013. Contractor/manufacturer is SYSTAT Software, Inc., 501,Canal
Boulevard, Suite C Richmond, CA 94804.
SYSTAT® 11 Statistics
Copyright © 2004 by SYSTAT Software, Inc.
501,Canal Boulevard, Suite C
Richmond, CA 94804.
All rights reserved.
Printed in the United States of America.
No part of this publication may be reproduced, stored in a retrieval system, or
transmitted, in any form or by any means, electronic, mechanical, photocopying,
recording, or otherwise, without the prior written permission of the publisher.
1 2 3 4 5 6 7 8 9 0 05 04 03 02 01 00
C o n t e n t s
Statistics I
List of Examples
xxxi
1 Introduction to Statistics
I-1
Descriptive Statistics . . . . . . . . . . . . . . . . . . . . . . . . . .I-1
Know Your Batch . . . . . . . . . . . . . . . . . . . . . . . . .I-2
Sum, Mean, and Standard Deviation . . . . . . . . . . . . . . .I-3
Stem-and-Leaf Plots . . . . . . . . . . . . . . . . . . . . . . . .I-3
The Median . . . . . . . . . . . . . . . . . . . . . . . . . . . .I-4
Sorting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .I-5
Standardizing . . . . . . . . . . . . . . . . . . . . . . . . . . .I-6
Inferential Statistics. . . . . . . . . . . . . . . . . . . . . . . . . . .I-7
What Is a Population? . . . . . . . . . . . . . . . . . . . . . . .I-7
Picking a Simple Random Sample. . . . . . . . . . . . . . . . .I-8
Specifying a Model . . . . . . . . . . . . . . . . . . . . . . . I-10
Estimating a Model . . . . . . . . . . . . . . . . . . . . . . . I-10
Confidence Intervals. . . . . . . . . . . . . . . . . . . . . . . I-11
Hypothesis Testing. . . . . . . . . . . . . . . . . . . . . . . . I-12
Checking Assumptions . . . . . . . . . . . . . . . . . . . . . I-14
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I-16
iii
2 Bootstrapping and Sampling
I-17
Statistical Background. . . . . . . . . . . . . . . . . . . . . . . . I-17
Resampling in SYSTAT. . . . . . . . . . . . . . . . . . . . . . . I-20
Resampling Tab. . . . . . . . . . . . . . . . . . . . . . . . . I-20
Using Commands . . . . . . . . . . . . . . . . . . . . . . . . I-21
Usage Considerations. . . . . . . . . . . . . . . . . . . . . . I-21
Examples. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I-22
Computation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I-32
Algorithms . . . . . . . . . . . . . . . . . . . . . . . . . . . I-32
Missing Data . . . . . . . . . . . . . . . . . . . . . . . . . . I-32
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I-33
3 Classification and Regression Trees
I-35
Statistical Background. . . . . . . . . . . . . . . . . . . . . . . . I-36
The Basic Tree Model. . . . . . . . . . . . . . . . . . . . . . I-36
Categorical or Quantitative Predictors . . . . . . . . . . . . . I-39
Regression Trees . . . . . . . . . . . . . . . . . . . . . . . . I-39
Classification Trees . . . . . . . . . . . . . . . . . . . . . . . I-40
Stopping Rules, Pruning, and Cross-Validation . . . . . . . . I-41
Loss Functions . . . . . . . . . . . . . . . . . . . . . . . . . I-42
Geometry . . . . . . . . . . . . . . . . . . . . . . . . . . . . I-42
Classification and Regression Trees in SYSTAT . . . . . . . . . . I-43
Classification and Regression Trees Dialog Box. . . . . . . . I-44
Using Commands . . . . . . . . . . . . . . . . . . . . . . . . I-47
Usage Considerations. . . . . . . . . . . . . . . . . . . . . . I-48
Examples. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I-48
Computation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I-55
Algorithms . . . . . . . . . . . . . . . . . . . . . . . . . . . I-55
Missing Data . . . . . . . . . . . . . . . . . . . . . . . . . . I-56
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I-56
iv
4 Cluster Analysis
I-57
Statistical Background. . . . . . . . . . . . . . . . . . . . . . . . .I-58
Types of Clustering. . . . . . . . . . . . . . . . . . . . . . . .I-58
Correlations and Distances . . . . . . . . . . . . . . . . . . . .I-59
Hierarchical Clustering. . . . . . . . . . . . . . . . . . . . . .I-60
Partitioning via K-Means. . . . . . . . . . . . . . . . . . . . .I-64
Additive Trees . . . . . . . . . . . . . . . . . . . . . . . . . .I-66
Cluster Analysis in SYSTAT . . . . . . . . . . . . . . . . . . . . .I-68
Hierarchical Clustering Dialog Box . . . . . . . . . . . . . . .I-68
K-Means Clustering Dialog Box . . . . . . . . . . . . . . . . .I-71
Additive Trees Clustering Dialog Box . . . . . . . . . . . . . .I-72
Using Commands. . . . . . . . . . . . . . . . . . . . . . . . .I-74
Usage Considerations. . . . . . . . . . . . . . . . . . . . . . .I-75
Examples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .I-76
Computation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .I-89
Algorithms . . . . . . . . . . . . . . . . . . . . . . . . . . . .I-89
Missing Data . . . . . . . . . . . . . . . . . . . . . . . . . . .I-90
References. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .I-90
5 Conjoint Analysis
I-93
Statistical Background. . . . . . . . . . . . . . . . . . . . . . . . .I-93
Additive Tables. . . . . . . . . . . . . . . . . . . . . . . . . .I-94
Multiplicative Tables . . . . . . . . . . . . . . . . . . . . . . .I-95
Computing Table Margins Based on an Additive Model . . . .I-97
Applied Conjoint Analysis . . . . . . . . . . . . . . . . . . . .I-98
Conjoint Analysis in SYSTAT . . . . . . . . . . . . . . . . . . . I-100
Conjoint Analysis Dialog Box . . . . . . . . . . . . . . . . . I-100
Using Commands. . . . . . . . . . . . . . . . . . . . . . . . I-101
Usage Considerations. . . . . . . . . . . . . . . . . . . . . . I-102
Examples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I-102
v
Computation . . . . . . . . . . . . . . . . . . . . . . . . . . . . .I-119
Algorithms . . . . . . . . . . . . . . . . . . . . . . . . . . .I-119
Missing Data . . . . . . . . . . . . . . . . . . . . . . . . . .I-120
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .I-120
6 Correlations, Similarities, and
Distance Measures
I-123
Statistical Background. . . . . . . . . . . . . . . . . . . . . . . .I-124
The Scatterplot Matrix (SPLOM). . . . . . . . . . . . . . . .I-125
The Pearson Correlation Coefficient . . . . . . . . . . . . . .I-125
Other Measures of Association . . . . . . . . . . . . . . . . .I-127
Transposed Data . . . . . . . . . . . . . . . . . . . . . . . .I-130
Hadi Robust Outlier Detection . . . . . . . . . . . . . . . . .I-131
Simple Correlations in SYSTAT . . . . . . . . . . . . . . . . . .I-132
Simple Correlations Dialog Box . . . . . . . . . . . . . . . .I-132
Using Commands . . . . . . . . . . . . . . . . . . . . . . . .I-137
Usage Considerations. . . . . . . . . . . . . . . . . . . . . .I-138
Examples. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .I-138
Computation . . . . . . . . . . . . . . . . . . . . . . . . . . . . .I-155
Algorithms . . . . . . . . . . . . . . . . . . . . . . . . . . .I-155
Missing Data . . . . . . . . . . . . . . . . . . . . . . . . . .I-155
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .I-155
7 Correspondence Analysis
I-157
Statistical Background. . . . . . . . . . . . . . . . . . . . . . . .I-157
The Simple Model . . . . . . . . . . . . . . . . . . . . . . .I-157
The Multiple Model. . . . . . . . . . . . . . . . . . . . . . .I-158
Correspondence Analysis in SYSTAT . . . . . . . . . . . . . . .I-159
Correspondence Analysis Dialog Box . . . . . . . . . . . . .I-159
vi
Using Commands. . . . . . . . . . . . . . . . . . . . . . . . I-160
Usage Considerations. . . . . . . . . . . . . . . . . . . . . . I-160
Examples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I-161
Computation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . I-167
Algorithms . . . . . . . . . . . . . . . . . . . . . . . . . . . I-167
Missing Data . . . . . . . . . . . . . . . . . . . . . . . . . . I-167
References. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I-167
8 Crosstabulation
(One-Way, Two-Way, and Multiway)
I-169
Statistical Background. . . . . . . . . . . . . . . . . . . . . . . . I-170
Making Tables . . . . . . . . . . . . . . . . . . . . . . . . . I-170
Significance Tests and Measures of Association. . . . . . . . I-172
Crosstabulations in SYSTAT . . . . . . . . . . . . . . . . . . . . I-178
One-Way Tables Dialog Box. . . . . . . . . . . . . . . . . . I-178
Two-Way Tables Dialog Box . . . . . . . . . . . . . . . . . I-179
Multiway Tables Dialog Box. . . . . . . . . . . . . . . . . . I-183
Using Commands. . . . . . . . . . . . . . . . . . . . . . . . I-184
Usage Considerations. . . . . . . . . . . . . . . . . . . . . . I-185
Examples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I-186
References. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I-216
9 Descriptive Statistics
I-217
Statistical Background. . . . . . . . . . . . . . . . . . . . . . . . I-218
Location. . . . . . . . . . . . . . . . . . . . . . . . . . . . . I-219
Spread. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I-219
The Normal Distribution . . . . . . . . . . . . . . . . . . . . I-219
Test for Normality . . . . . . . . . . . . . . . . . . . . . . . I-220
Non-Normal Shape . . . . . . . . . . . . . . . . . . . . . . . I-221
vii
Subpopulations . . . . . . . . . . . . . . . . . . . . . . . . .I-222
Descriptive Statistics in SYSTAT. . . . . . . . . . . . . . . . . .I-224
Column Statistics Dialog Box. . . . . . . . . . . . . . . . . .I-224
Column Stem-and-Leaf Plot Dialog Box . . . . . . . . . . . .I-230
Basic Statistics for Rows . . . . . . . . . . . . . . . . . . . .I-231
Row Stem-and-Leaf Plot Dialog Box. . . . . . . . . . . . . .I-234
Cronbach Dialog Box. . . . . . . . . . . . . . . . . . . . . .I-234
Using Commands . . . . . . . . . . . . . . . . . . . . . . . .I-236
Usage Considerations. . . . . . . . . . . . . . . . . . . . . .I-237
Examples. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .I-237
Computation . . . . . . . . . . . . . . . . . . . . . . . . . . . . .I-254
Algorithms . . . . . . . . . . . . . . . . . . . . . . . . . . .I-254
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .I-254
10 Design of Experiments
I-255
Statistical Background. . . . . . . . . . . . . . . . . . . . . . . .I-256
The Research Problem . . . . . . . . . . . . . . . . . . . . .I-256
Types of Investigation . . . . . . . . . . . . . . . . . . . . .I-257
The Importance of Having a Strategy. . . . . . . . . . . . . .I-258
The Role of Experimental Design in Research . . . . . . . . .I-259
Types of Experimental Designs. . . . . . . . . . . . . . . . .I-259
Factorial Designs . . . . . . . . . . . . . . . . . . . . . . . .I-260
Response Surface Designs . . . . . . . . . . . . . . . . . . .I-264
Mixture Designs. . . . . . . . . . . . . . . . . . . . . . . . .I-267
Optimal Designs . . . . . . . . . . . . . . . . . . . . . . . .I-272
Choosing a Design . . . . . . . . . . . . . . . . . . . . . . .I-276
Design of Experiments in SYSTAT. . . . . . . . . . . . . . . . .I-278
Design of Experiments Wizard . . . . . . . . . . . . . . . . .I-278
Classic Design of Experiments . . . . . . . . . . . . . . . . .I-279
Using Commands . . . . . . . . . . . . . . . . . . . . . . . .I-280
Usage Considerations. . . . . . . . . . . . . . . . . . . . . .I-280
Examples. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .I-281
viii
References. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I-299
11 Discriminant Analysis
I-301
Statistical Background. . . . . . . . . . . . . . . . . . . . . . . . I-302
Linear Discriminant Model. . . . . . . . . . . . . . . . . . . I-302
Robust Discriminant Analysis . . . . . . . . . . . . . . . . . I-310
Discriminant Analysis in SYSTAT . . . . . . . . . . . . . . . . . I-310
Classical Discriminant Analysis Dialog Box. . . . . . . . . . I-310
Robust Discriminant Analysis Dialog Box. . . . . . . . . . . I-316
Using Commands. . . . . . . . . . . . . . . . . . . . . . . . I-317
Usage Considerations. . . . . . . . . . . . . . . . . . . . . . I-318
Examples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I-319
References. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I-358
12 Factor Analysis
I-359
Statistical Background. . . . . . . . . . . . . . . . . . . . . . . . I-359
A Principal Component. . . . . . . . . . . . . . . . . . . . . I-360
Factor Analysis . . . . . . . . . . . . . . . . . . . . . . . . . I-363
Principal Components versus Factor Analysis . . . . . . . . . I-366
Applications and Caveats. . . . . . . . . . . . . . . . . . . . I-367
Factor Analysis in SYSTAT. . . . . . . . . . . . . . . . . . . . . I-367
Factor Analysis Dialog Box . . . . . . . . . . . . . . . . . . I-367
Using Commands. . . . . . . . . . . . . . . . . . . . . . . . I-373
Usage Considerations. . . . . . . . . . . . . . . . . . . . . . I-373
Examples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I-374
Computation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . I-397
Algorithms . . . . . . . . . . . . . . . . . . . . . . . . . . . I-397
Missing Data . . . . . . . . . . . . . . . . . . . . . . . . . . I-397
References. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I-397
ix
13 Fitting Distributions
I-399
Statistical Background. . . . . . . . . . . . . . . . . . . . . . . .I-399
Goodness-of-Fit Tests. . . . . . . . . . . . . . . . . . . .I-400
Fitting Distributions in SYSTAT . . . . . . . . . . . . . . . . . .I-402
Fitting Distributions: Discrete Dialog Box . . . . . . . . . . .I-402
Fitting Distributions: Continuous Dialog Box . . . . . . . . .I-403
Using Commands . . . . . . . . . . . . . . . . . . . . . . . .I-405
Usage Considerations. . . . . . . . . . . . . . . . . . . . . .I-406
Examples. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .I-407
Computation . . . . . . . . . . . . . . . . . . . . . . . . . . . . .I-422
Algorithms . . . . . . . . . . . . . . . . . . . . . . . . . . .I-422
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .I-422
14 Hypothesis Testing
I-423
Statistical Background. . . . . . . . . . . . . . . . . . . . . . . .I-424
One-Sample Tests and Confidence Intervals
for Mean and Proportion . . . . . . . . . . . . . . . . . . . .I-424
Two-Sample Tests and Confidence Intervals
for Means and Proportions . . . . . . . . . . . . . . . . . . .I-424
Tests for Variances and Confidence Intervals . . . . . . . . .I-425
Tests for Correlations and Confidence Intervals . . . . . . . .I-425
Multiple Tests . . . . . . . . . . . . . . . . . . . . . . . . .I-426
Hypothesis Testing in SYSTAT. . . . . . . . . . . . . . . . . . .I-427
Tests for Mean(s) . . . . . . . . . . . . . . . . . . . . . . . . . .I-427
One-Sample z-Test Dialog Box. . . . . . . . . . . . . . . . .I-427
Two-Sample z-Test Dialog Box . . . . . . . . . . . . . . . .I-428
One-Sample t-Test Dialog Box . . . . . . . . . . . . . . . . .I-430
Paired t-Test Dialog Box . . . . . . . . . . . . . . . . . . . .I-431
Two-Sample t-Test Dialog Box. . . . . . . . . . . . . . . . .I-433
Poisson Test Dialog Box . . . . . . . . . . . . . . . . . . . .I-434
Tests for Variance(s). . . . . . . . . . . . . . . . . . . . . . . . .I-436
x