首页 第五章 主成分分析(2)(主成分回归、经验正交分解EOF)

第五章 主成分分析(2)(主成分回归、经验正交分解EOF)

举报
开通vip

第五章 主成分分析(2)(主成分回归、经验正交分解EOF)5.4 主成分聚类与主成分回归 5.4.1  变量聚类与样品分类 主成分分析可用于聚类:变量聚类与样品聚类。 变量聚类:由主成分系数的差异,可将变量聚类。例如例5.5中第2主成分中murder,rape, assult系数为负的, burglary,larceny, auto系数是正的。按系数正负可把7个变量分为两类: murder, rape, assult属于暴力程度严重的一类;burglary,larceny,auto属于暴力程度较轻的一类。按照这种方法,根据主成分系数的正负可以将变量聚类。 样品聚类:如果...

第五章 主成分分析(2)(主成分回归、经验正交分解EOF)
5.4 主成分聚类与主成分回归 5.4.1  变量聚类与样品分类 主成分 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 可用于聚类:变量聚类与样品聚类。 变量聚类:由主成分系数的差异,可将变量聚类。例如例5.5中第2主成分中murder,rape, assult系数为负的, burglary,larceny, auto系数是正的。按系数正负可把7个变量分为两类: murder, rape, assult属于暴力程度严重的一类;burglary,larceny,auto属于暴力程度较轻的一类。按照这种方法,根据主成分系数的正负可以将变量聚类。 样品聚类:如果2个主成分能很好的概括随机向量的信息,计算每个样品的这两个主成分得分,把他们的散点图画出来,就能从图上将样品分类。 例5.5(续2) 按照第一、第二主成分得分,画出散点图 data crime;        /*建立数据集crime*/ input state $ 1-15 murder rape robbery assult burglary larceny auto; /*建立变量state murder rape robbery assult burglary larceny auto。state $ 1-15 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 示前15列存州名。murder rape robbery assult burglary larceny auto 表7种罪的犯罪率*/ cards;              /*以下为数据体*/ Albama        14.2    25.2      96.8      278.3    1135.5      1881.9    280.7 Alaska        10.8    51.6      96.8      284.0    1331.7      3369.8    753.3 Arirona        9.5    34.2    138.2      312.3    2346.1      4467.4    439.5 Arkansas      8.8    34.2    138.2      312.3    2346.1      4467.4    439.5 Califonia    11.5    49.4    287.0      358.0    2139.4      3499.8    663.5 Colorado      6.3    42.0    170.7      292.9    1935.2      3903.2    477.1 Conecticat      4.2    16.8    129.5      131.8    1346.0      2620.7    593.2 Delaware      6.0    24.9    157.0      194.2    1682.6      3678.4    467.0 Florida      10.2    39.6    187.9      449.1    1859.9      3840.5    351.4 Geogia        11.7    31.1    140.5      256.5    1351.1      2170.2    297.9 Hawaii        7.2    25.5    128.0      64.1    1911.5      3920.4    489.4 Idaho          5.5    19.4      39.6      172.5    1050.8      2599.6    237.6 Illinois        9.9    21.8    211.3      209.0    1085.0      2828.5    528.6 Indiana        7.4    26.5    123.2      153.5    1086.2      2498.7    377.4 Iowa          2.3    10.6      41.2      89.8      812.5      2685.1    219.9 Kansas        6.6    22.0    100.7      180.5    1270.4      2739.3    244.3 Kentaky      10.1    19.1      81.1      123.3      872.2      1662.1    245.4 Loisana      15.5    30.9    142.9      335.5    1165.5      2469.9    337.7 Maine          2.4    13.5      38.7      170.0    1253.1      2350.7    246.9 Maryland        8.0    34.8    292.1      358.9    1400.0      3177.7    428.5 Masschusetts    3.1    20.8    169.1      231.6    1532.2      2311.3    1140.1 Michigan        9.3    38.9    261.9      274.6    1522.7      3159.0    545.5 Minnesota      2.7    19.5      85.9      85.8    1134.7      2559.3    343.1 Mississippi    14.3    19.6      65.7      189.1      915.6      1239.9    144.4 Missouri      9.6    28.3    189.0      233.5    1318.3      2424.2    378.4 Montana        5.4    16.7      39.2      156.8      804.9      2773.2    309.3 Nebraska      3.9    18.1      64.7      112.7      760.0      2316.1    249.1 Nevada      15.8    49.1    323.1      355.0    2453.1      4212.6    559.2 Mew Hampashare  3.2    10.7      23.2      76.0    1041.7      2343.9    293.4 New Jersey    5.6    21.0    180.4      185.1    1435.8      2774.5    511.5 New Maxico    8.8    39.1    109.6      343.4    1418.7      3008.6    259.5 New York      10.7    29.4    472.6      319.1    1728.0      2782.0    745.8 North Carolina  10.6    17.0      61.3      318.3    1154.1      2037.8    192.1 North Dakoda  100.9    9.0      13.3      43.8      446.1      1843.0    144.7 Ohio          7.8    27.3    190.5      181.1    1216.0      2696.8    400.4 Oklahoma      8.6    29.2      73.8      205.0    1288.2      2228.1    326.8 Oregan        4.9    39.9    124.1      286.9    1636.4      3506.1    388.9 Pennsyvania    5.6    19.0    130.3      128.0      877.5      1624.1    333.2 Rhode Island    3.6    10.5      86.5      201.0    1849.5      2844.1    791.4 South Carolina  11.9    33.0    105.9      485.3    1613.6      2342.4    245.1 South Dakoda    2.0    13.5      17.9      155.7      570.5      1704.4    147.5 Tennessee      10.1    29.7    145.8      203.9    1259.7      1776.5    314.0 Texas          13.3    33.8    152.4      208.2    1603.1      2988.7    397.6 Utah          3.5    20.3      68.8      147.3    1171.6      3004.6    334.5 Vermont        1.4    15.9      30.8      101.2    1348.2      2201.0    265.2 Virginia      9.0    23.3      92.1      165.7      986.2      2521.2    226.7 Wasinton      4.3    39.6    106.2      224.8    1605.6      3386.9    360.3 West Viginia    6.0    13.2      42.2      90.9      597.4      1341.7    163.3 Wiskonsin      2.8    12.9      52.2      63.7      846.9      2614.2    220.7 Wyoming        5.4    21.9      39.7      173.9      811.6      2772.2    282.0 ; proc princomp out=crimprin  n=2; var murder rape robbery assult burglary larceny auto; run; PROC  PLOT data=crimprin;    PLOT PRIN2*PRIN1=STATE/VPOS=31; TITLE2 ‘PLOT OF THE FIRST TWO PRINCIPAL COMPONENTS’; RUN; 例5.7  (气温分析) 本例的输入资料文件(TEMPERAT)是美国六十四个城市一月与七月的平均日温。 DATA TEMPERAT; TITLE2 'MEAN TEMPERATURE IN JANUARY AND JULY FOR SELECTED CITIES'; INPUT CITY $1-15 JANUARY JULY; CARDS; MOBILE          51.2  81.6 PHOENIX        51.2  91.2 LITTLE ROCK    39.5  81.4 SACRAMENTO      45.1  75.2 DENVER          29.9  73.0 HARTFORD        24.8  72.7 WILMINGTON      32.0  75.8 WASHINGTON DC  35.6  78.7 JACKSONVILLE    54.6  81.0 MIAMI          67.2  82.3 ATLANTA        42.4  78.0 BOISE          29.0  74.5 CHICAGO        22.9  71.9 PEORIA          23.8  75.1 INDIANAPOLIS    27.9  75.0 DES MOINES      19.4  75.1 WICHITA        31.3  80.7 LOUISVILLE      33.3  76.9 NEW ORLEANS    52.9  81.9 PORTLAND, MAINE 21.5  68.0 BALTIMORE      33.4  76.6 BOSTON          29.2  73.3 DETROIT        25.5  73.3 SAULT STE MARIE 14.2  63.8 DULUTH          8.5  65.6 MINNEAPOLIS    12.2  71.9 JACKSON        47.1  81.7 KANSAS CITY    27.8  78.8 ST LOUIS        31.3  78.6 GREAT FALLS    20.5  69.3 OMAHA          22.6  77.2 RENO            31.9  69.3 CONCORD        20.6  69.7 ATLANTIC CITY  32.7  75.1 ALBUQUERQUE    35.2  78.7 ALBANY          21.5  72.0 BUFFALO        23.7  70.1 NEW YORK        32.2  76.6 CHARLOTTE      42.1  78.5 RALEIGH        40.5  77.5 BISMARCK        8.2  70.8 CINCINNATI      31.1  75.6 CLEVELAND      26.9  71.4 COLUMBUS        28.4  73.6 OKLAHOMA CITY  36.8  81.5 PORTLAND, OREG  38.1  67.1 PHILADELPHIA    32.3  76.8 PITTSBURGH      28.1  71.9 PROVIDENCE      28.4  72.1 COLUMBIA        45.4  81.2 SIOUX FALLS    14.2  73.3 MEMPHIS        40.5  79.6 NASHVILLE      38.3  79.6 DALLAS          44.8  84.8 EL PASO        43.6  82.3 HOUSTON        52.1  83.3 SALT LAKE CITY  28.0  76.7 BURLINGTON      16.8  69.8 NORFOLK        40.5  78.3 RICHMOND        37.5  77.9 SPOKANE        25.4  69.7 CHARLESTON, WV  34.5  75.0 MILWAUKEE      19.4  69.9 CHEYENNE        26.6  69.1 ; PROC PLOT; PLOT JULY*JANUARY=CITY/VPOS=36; PROC PRINCOMP COV OUT=PRIN; VAR JULY JANUARY; PROC PLOT; PLOT PRIN2*PRIN1=CITY/VPOS=26; TITLE3 'PLOT OF PRINCIPAL COMPONENTS'; Run; 例5.8  美国大学生篮球队排名 data bballm; label  csn  = 'Community Sports News (Chapel Hill NC)' dursun  = 'Durham Sun' durher  = 'Durham Morning Herald' waspost  = 'Washington Post' usatoda  = 'USA Today' spormag  = 'Sport Magazine' insport  = 'Inside Sports' upi      = 'United Press International' ap      = 'Associated Press' sporill  = 'Sports Illustrated' ; title1 'Pre-Season 1985 College Basketball Rankings'; input school $13. csn  dursun  durher  waspost  usatoda spormag  insport  upi  ap  sporill; format csn -- sporill 5.1; cards; Louisville    1  8  1  9  8  9  6 10  9  9 Georgia Tech  2  2  4  3  1  1  1  2  1  1 Kansas        3  4  5  1  5 11  8  4  5  7 Michigan      4  5  9  4  2  5  3  1  3  2 Duke          5  6  7  5  4 10  4  5  6  5 UNC            6  1  2  2  3  4  2  3  2  3 Syracuse      7 10  6 11  6  6  5  6  4 10 Notre Dame    8 14 15 13 11 20 18 13 12  . Kentucky      9 15 16 14 14 19 11 12 11 13 LSU          10  9 13  . 13 15 16  9 14  8 DePaul        11  . 21 15 20  . 19  .  . 19 Georgetown    12  7  8  6  9  2  9  8  8  4 Navy          13 20 23 10 18 13 15  . 20  . Illinois      14  3  3  7  7  3 10  7  7  6 Iowa          15 16  .  . 23  .  . 14  . 20 Arkansas      16  .  .  . 25  .  .  .  . 16 Memphis State 17  . 11  . 16  8 20  . 15 12 Washington    18  .  .  .  .  .  . 17  .  . UAB          19 13 10  . 12 17  . 16 16 15 UNLV          20 18 18 19 22  . 14 18 18  . NC State      21 17 14 16 15  . 12 15 17 18 Maryland      22  .  .  . 19  .  .  . 19 14 Pittsburg    23  .  .  .  .  .  .  .  .  . Oklahoma      24 19 17 17 17 12 17  . 13 17 Indiana      25 12 20 18 21  .  .  .  .  . Virginia      26  . 22  .  . 18  .  .  .  . Old Dominion  27  .  .  .  .  .  .  .  .  . Auburn        28 11 12  8 10  7  7 11 10 11 St. Johns    29  .  .  .  . 14  .  .  .  . UCLA          30  .  .  .  .  .  . 19  .  . St. Joseph's  .  . 19  .  .  .  .  .  .  . Tennessee      .  . 24  .  . 16  .  .  .  . Montana        .  .  . 20  .  .  .  .  .  . Houston        .  .  .  . 24  .  .  .  .  . Virginia Tech  .  .  .  .  .  . 13  .  .  . ; proc princomp data=bball n=1 out=pcbball standard; var csn --sporill; weight weight; proc sort data=pcbball; by prin1; proc print; var school prin1; title2 'College Teams as Ordered by PRINCOMP'; run; 例5.9   55个地区或国家的赛跑纪录如表5-7,试作主成分分析,并将55个国家或地区按赛跑成绩分类。 表  5-7 55个地区或国家的赛跑纪录 序号 国家或地区 100m (秒) 200m (秒) 400m (秒) 800m (分) 1500m (分) 5000m (分) 10000m(分) 马拉松(分) 1 argentin 10.39 20.81 46.84 1.81 3.70 14.04 29.36 137.72 2 australi 10.31 20.06 44.84 1.74 3.57 13.28 27.66 128.30 3 austria 10.44 20.81 46.82 1.79 3.60 13.26 27.72 135.90 4 belgium 10.34 20.68 45.04 1.73 3.60 13.22 27.45 129.95 5 bermuda 10.28 20.58 45.91 1.80 3.75 14.68 30.55 146.62 6 brazil 10.22 20.43 45.21 1.73 3.66 13.62 28.62 133.13 7 burma 10.64 21.52 48.30 1.80 3.85 14.45 30.28 139.95 8 canada 10.17 20.22 45.68 1.76 3.63 13.55 28.09 130.15 9 chile 10.34 20.80 46.20 1.79 3.71 13.61 29.30 134.03 10 china 10.51 21.04 47.30 1.81 3.73 13.90 29.13 133.53 11 columbia 10.43 21.05 46.10 1.82 3.74 13.49 27.88 131.35 12 cookis 12.18 23.20 52.94 2.02 4.24 16.70 35.38 164.70 13 costa 10.94 21.90 48.66 1.87 3.84 14.03 28.81 136.58 14 czech 10.35 20.65 45.64 1.76 3.58 13.42 28.19 134.32 15 denmark 10.56 20.52 45.89 1.78 3.61 13.50 28.11 130.78 16 domrep 10.14 20.65 46.80 1.82 3.82 14.91 31.45 154.12 17 finland 10.43 20.69 45.49 1.74 3.61 13.27 27.52 130.87 18 france 10.11 20.38 45.28 1.73 3.57 13.34 27.97 132.30 19 gdr 10.12 20.33 44.87 1.73 3.56 13.17 27.42 129.92 20 frg 10.16 20.37 44.50 1.73 3.53 13.21 27.61 132.23 21 gbni 10.11 20.21 44.93 1.70 3.51 13.01 27.51 129.13 22 greece 10.22 20.71 46.56 1.78 3.64 14.59 28.45 134.60 23 guatemal 10.98 21.82 48.40 1.89 3.80 14.16 30.11 139.33 24 hungary 10.26 20.62 46.02 1.77 3.62 13.49 28.44 132.58 25 india 10.60 21.42 45.73 1.76 3.73 13.77 28.81 131.98 26 indonesi 10.59 21.49 47.80 1.84 3.92 14.73 30.79 148.83 27 ireland 10.61 20.96 46.30 1.79 3.56 13.32 27.81 132.35 28 israel 10.71 21.00 47.80 1.77 3.72 13.66 28.93 137.55 29 italy 10.01 19.72 45.26 1.73 3.60 13.23 27.52 131.08 30 japan 10.34 20.81 45.86 1.79 3.64 13.41 27.72 128.63 31 kenya 10.46 20.66 44.92 1.73 3.55 13.10 27.38 129.75 32 korea 10.34 20.89 46.90 1.79 3.77 13.96 29.23 136.25 33 dprkorea 10.91 21.94 47.30 1.85 3.77 14.13 29.67 130.87 34 luxembou 10.35 20.77 47.40 1.82 3.67 13.64 29.08 141.27 35 malaysia 10.40 20.92 46.30 1.82 3.80 14.64 31.01 154.10 36 mauritiu 11.19 22.45 47.70 1.88 3.83 15.06 31.77 152.23 37 mexico 10.42 21.30 46.10 1.80 3.65 13.46 27.95 129.20 38 netherla 10.52 20.95 45.10 1.74 3.62 13.36 27.61 129.02 39 nz 10.51 20.88 46.10 1.74 3.54 13.21 27.70 128.98 40 norway 10.55 21.16 46.71 1.76 3.62 13.34 27.69 131.48 41 png 10.96 21.78 47.90 1.90 4.01 14.72 31.36 148.22 42 philippi 10.78 21.64 46.24 1.81 3.83 14.74 30.64 145.27 43 poland 10.16 20.24 45.36 1.76 3.60 13.29 27.89 131.58 44 portugal 10.53 21.17 46.70 1.79 3.62 13.13 27.38 128.65 45 rumania 10.41 20.98 45.87 1.76 3.64 13.25 27.67 132.50 46 singapor 10.38 21.28 47.40 1.88 3.89 15.11 31.32 157.77 47 spain 10.42 20.77 45.98 1.76 3.55 13.31 27.73 131.57 48 sweden 10.25 20.61 45.63 1.77 3.61 13.29 27.94 130.63 49 switzerl 10.37 20.46 45.78 1.78 3.55 13.22 27.91 131.20 50 taipei 10.59 21.29 46.80 1.79 3.77 14.07 30.07 139.27 51 thailand 10.39 21.09 47.91 1.83 3.84 15.23 32.56 149.90 52 turkey 10.71 21.43 47.60 1.79 3.67 13.56 28.58 131.50 53 usa 9.93 19.75 43.86 1.73 3.53 13.20 27.43 128.22 54 ussr 10.07 20.00 44.60 1.75 3.59 13.20 27.53 130.55 55 wsamoa 10.82 21.86 49.00 2.02 4.24 16.28 34.71 161.83                               可用下列SAS程序作主成分分析,并将第1,2主成分画散点图 data runrecod; input  country $ x1-x8; cards; argentin          10.39  20.81  46.84  1.81  3.70  14.04  29.36  137.72 australi          10.31  20.06  44.84  1.74  3.57  13.28  27.66  128.30 austria            10.44  20.81  46.82  1.79  3.60  13.26  27.72  135.90 belgium            10.34  20.68  45.04  1.73  3.60  13.22  27.45  129.95 bermuda            10.28  20.58  45.91  1.80  3.75  14.68  30.55  146.62 brazil            10.22  20.43  45.21  1.73  3.66  13.62  28.62  133.13 burma              10.64  21.52  48.30  1.80  3.85  14.45  30.28  139.95 canada            10.17  20.22  45.68  1.76  3.63  13.55  28.09  130.15 chile              10.34  20.80  46.20  1.79  3.71  13.61  29.30  134.03 china              10.51  21.04  47.30  1.81  3.73  13.90  29.13  133.53 columbia          10.43  21.05  46.10  1.82  3.74  13.49  27.88  131.35 cookis            12.18  23.20  52.94  2.02  4.24  16.70  35.38  164.70 costa              10.94  21.90  48.66  1.87  3.84  14.03  28.81  136.58 czech              10.35  20.65  45.64  1.76  3.58  13.42  28.19  134.32 denmark            10.56  20.52  45.89  1.78  3.61  13.50  28.11  130.78 domrep            10.14  20.65  46.80  1.82  3.82  14.91  31.45  154.12 finland            10.43  20.69  45.49  1.74  3.61  13.27  27.52  130.87 france            10.11  20.38  45.28  1.73  3.57  13.34  27.97  132.30 gdr                10.12  20.33  44.87  1.73  3.56  13.17  27.42  129.92 frg                10.16  20.37  44.50  1.73  3.53  13.21  27.61  132.23 gbni              10.11  20.21  44.93  1.70  3.51  13.01  27.51  129.13 greece            10.22  20.71  46.56  1.78  3.64  14.59  28.45  134.60 guatemal          10.98  21.82  48.40  1.89  3.80  14.16  30.11  139.33 hungary            10.26  20.62  46.02  1.77  3.62  13.49  28.44  132.58 india              10.60  21.42  45.73  1.76  3.73  13.77  28.81  131.98 indonesi          10.59  21.49  47.80  1.84  3.92  14.73  30.79  148.83 ireland            10.61  20.96  46.30  1.79  3.56  13.32  27.81  132.35 israel            10.71  21.00  47.80  1.77  3.72  13.66  28.93  137.55 italy              10.01  19.72  45.26  1.73  3.60  13.23  27.52  131.08 japan              10.34  20.81  45.86  1.79  3.64  13.41  27.72  128.63 kenya              10.46  20.66  44.92  1.73  3.55  13.10  27.38  129.75 korea              10.34  20.89  46.90  1.79  3.77  13.96  29.23  136.25 dprkorea          10.91  21.94  47.30  1.85  3.77  14.13  29.67  130.87 luxembou          10.35  20.77  47.40  1.82  3.67  13.64  29.08  141.27 malaysia          10.40  20.92  46.30  1.82  3.80  14.64  31.01  154.10 mauritiu          11.19  22.45  47.70  1.88  3.83  15.06  31.77  152.23 mexico            10.42  21.30  46.10  1.80  3.65  13.46  27.95  129.20 netherla          10.52  20.95  45.10  1.74  3.62  13.36  27.61  129.02 nz                10.51  20.88  46.10  1.74  3.54  13.21  27.70  128.98 norway            10.55  21.16  46.71  1.76  3.62  13.34  27.69  131.48 png                10.96  21.78  47.90  1.90  4.01  14.72  31.36  148.22 philippi          10.78  21.64  46.24  1.81  3.83  14.74  30.64  145.27 poland            10.16  20.24  45.36  1.76  3.60  13.29  27.89  131.58 portugal          10.53  21.17  46.70  1.79  3.62  13.13  27.38  128.65 rumania            10.41  20.98  45.87  1.76  3.64  13.25  27.67  132.50 singapor          10.38  21.28  47.40  1.88  3.89  15.11  31.32  157.77 spain              10.42  20.77  45.98  1.76  3.55  13.31  27.73  131.57 sweden            10.25  20.61  45.63  1.77  3.61  13.29  27.94  130.63 switzerl          10.37  20.46  45.78  1.78  3.55  13.22  27.91  131.20 taipei            10.59  21.29  46.80  1.79  3.77  14.07  30.07  139.27 thailand          10.39  21.09  47.91  1.83  3.84  15.23  32.56  149.90 turkey            10.71  21.43  47.60  1.79  3.67  13.56  28.58  131.50 usa                9.93  19.75  43.86  1.73  3.53  13.20  27.43  128.22 ussr              10.07  20.00  44.60  1.75  3.59  13.20  27.53  130.55 wsamoa            10.82  21.86  49.00  2.02  4.24  16.28  34.71  161.83 proc princomp out=w; var x1-x8; run; 由执行程序后得到的表可作如下分析。以下是特征值表 Eigenvalues Eigenvalue      Difference      Proportion      Cumulative PRIN1        6.62215        5.74453        0.827768        0.82777 PRIN2        0.87762        0.71830        0.109702        0.93747 PRIN3        0.15932        0.03527        0.019915        0.95739 PRIN4        0.12405        0.04417        0.015506        0.97289 PRIN5        0.07988        0.01192        0.009985        0.98288 PRIN6        0.06797        0.02155        0.008496        0.99137 PRIN7        0.04642        0.02382        0.005802        0.99717 PRIN8        0.02260          .              0.002825        1.00000 两个主成分的累计方差贡献率为0.9375,可见只要两个主成分就够了。以下是由特征向量表 Eigenvectors PRIN1    PRIN2    PRIN3    PRIN4    PRIN5    PRIN6      PRIN7      PRIN8 X1 0.317556 0.566878 0.332262 0.127628  0.262555  -.593704  0.136241    0.105542 X2 0.336979 0.461626 0.360657 -.259116 -.153957  0.656137  -.112640    -.096054 X3 0.355645 0.248273-.560467 0.652341 -.218323  0.156625    -.002854    -.000127 X4  0.368684 0.012430  -.532482 -.479999 0.540053 -.014692  -.238016    -.038165 X5  0.372810 -.139797 -.153443  -.404510 -.487715 -.157843  0.610011    0.139291 X6  0.364374 -.312030 0.189764 0.029588 -.253979 -.141299  -.591299    0.546697 X7  0.366773 -.306860  0.181752  0.080069 -.133176 -.219017 -.176871    -.796795 X8  0.341926 -.438963 0.263209  0.299512  0.497928 0.315285 0.398822    0.158164 第1主成分个分量系数是大体相同的正数,第1主成分反映各国或地区跑步实力,它越小速度快,实力越强。第2主成分在100米,200米,400米的系数为正,1500米,5000米,10000米和马拉松系数为负,且距离越长,负的越多,反映短距离跑速度与长距离跑速度差异,即长距离跑相对短距离跑的实力,它越小短距离相对长距离实力越强。 为了将第1主成分作为横轴,第2主成分作为立轴画出散点图,可用下列程序 proc gplot data=w; plot prin2*prin1=country; run; 得图5.1 图5.1  径塞记录第1,2主成分散点图 从图5.1可见这些国家或地区可分为4类:第1类只有库克群岛,第1,2主成分都最大, 说明 关于失联党员情况说明岗位说明总经理岗位说明书会计岗位说明书行政主管岗位说明书 跑步速度慢,长距离跑相对短距离跑的实力大(短距离跑速度特别慢);第2类包括百慕大,多米尼加,马来西亚,新加坡,泰国第1主成分较大,第2主成分为负值,说明总体来说,跑步速度不快,短距离跑相对长距离跑的实力强,即短距离跑得快而长距离跑得慢;第3类包括中国台北,朝鲜,哥斯达尼加,巴布亚新几内亚,危地马拉,毛里求斯,缅甸,菲律宾,印度尼西亚,第1主成分较大,说明总体来说,跑步速度不快,第2主成分为正值,说明短距离跑相对长距离跑的实力小(长距离跑速度较快);其他国家或地区为一类;第1主成分较小,说明跑步速度总的较快,第2主成分为正值,说明短距离跑得快而长距离跑得慢。 5.4.2  主成分回归 在回归分析中,常遇到自变量存在多重共线性问题,即自变量的观测值存在线性相关,或近似线性相关。这时 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 矩阵满足 ,第4章中已指出,用公式 估计参数会造成较大方差。选取自变量的主成分,它们是彼此正交的。用少量主成分作回归,再将主成分化为原始变量,这样得到的回归方程就不存在较大方差了。与逐步回归相比,这样做的好处是,所有变量都被计算,而逐步回归略去一些自变量,这些自变量不被计算。主成分回归原理见例5.10。 例5.10(主成分回归的原理) 设自变量x1,x2,x3和因变量y的观测值如表5-8,以x1,x2,x3为自变量y为因变量作回归。由于x3的值近似为x1与x2 的和,存在多重共线性,直接以x1,x2,x3为自变量不好,作主成分回归。 首先将x1,x2,x3零均值化,得到x1*,x2*,x3* x1*=(x1-0.22)/0.49193, x2*=(x2-0.24)/0.53666, x3*=(x3-0.46)/0.50794 用相关阵计算主成分(计算所得表略去),主成分得分见表5-9,因为前一、两个主成分的累计百分比分别为0.576和0.992,取前两个主成分为自变量(略去1个主成分)。由表5-9数据作以y为因变量,Prin1和Prin2为自变量的回归方程 y=1.48+1.40128Prin1+0.31623Prin2 有主成分分析算得结果,Prin1,Prin2可用x1*,x2*,x3*表示: prin1=0.461761x1*+0.461761x2*+0.757333x3* prin2=0.707107x1*-0.707107x2* 通过变量替换,变成以x1,x2,x3为自变量的回归方程 y=-0.0598224+1.7699x1+0.789043x2+2.08929x3 这就是主成分回归所得方程。 表5-8 变量观测值 X1 x2 x3 y 1.1 0 1 4 0 1.2 1 3 0 0 0.3 0.3 0 0 0 0.1 0 0 0 0         表5-9 变量主成分得分(用协差阵计算) Y Prin1 Prin2 Prin3 4.0 0.55132 0.90525 0.01335 3.0 0.88824 -0.68739 0.01118 0.3 -0.33232 -0.04123 -0.13951 0.1 -0.55362 -0.08832 0.05749 0.0 -0.55362 -0.08832 0.05749         上述步骤很麻烦,可用SAS-REG过程实现:在proc reg语句中,加选项outest=文件名(存储主成分回归的输出数据集)在model语句自变量后加“/”号,再加选项pcomit=k(k为略去的主成分个数) 。执行后看最后一张表最后一行即可。 例5.11  1978-1993我国民航客运量y(万人),国民收入x1(亿元),消费额x2(亿元),铁路客运量x3(万人),民航航线里程数x4(万公里),来华旅游人数x5(万人)如表5-10。试建立以民航客运量为因变量的回归方程。 表5-10 我国民航数据表 year y x1 x2 x3 x4 x5 1978 231 3010 1888 81491 14.89 180.92 1979 298 3350 2195 86389 16.00 420.39 1980 343 3688 2531 92204 19.53 570.25 1981 401 3941 2799 95300 21.82 776.71 1982 445 4258 3054 99922 23.27 792.43 1983 391 4736 3358 106044 22.91 947.70 1984 554 5652 3905 110353 26.02 1285.22 1985 744 7020 4879 112110 27.72 1783.30 1986 997 7859 5552 108579 32.43 2281.95 1987 1310 9313 6386 112429 38.91 2690.23 1988 1442 11738 8038 122645 37.38 3169.48 1989 1283 13176 9005 113807 47.19 2450.14 1990 1660 14384 9663 95712 50.68 1746.20 1991 2178 16557 10969 95081 55.91 3335.65 1992 2886 20223 12985 99693 83.66 3311.50 1993 3383 24882 15949 105458 96.08 4152.70               解 直接建立回归方程发现,回归方程消费额x2的系数是负的,这与实际情况不符:消费额越多,应当乘飞机人数越多;而回归方程x2的系数是负的,导出错误结论:消费额越多,则乘飞机人数越少。通过检验发现,x2的系数是负的原因是:自变量出现多重共线性。本例中自变量有5个,主成分也有5个。通过主成分分析,前3个主成分累计百分比为99.61,可以选用前3个主成分,即去掉2个主成分,于是可用如下SAS程序计算 data airpline; do  year= 1978  to 1993; input  y  x1-x5; output; end; cards; 231  3010 1888  81491 14.89  180.92 298  3350 2195  86389 16.00  420.39 343  3688 2531  92204 19.53  570.25 401  3941 2799  95300 21.82  776.71 445  4258 3054  99922 23.27  792.43 391  4736 3358 106044 22.91  947.70 554  5652 3905 110353 26.02 1285.22 744  7020 4879 112110 27.72 1783.30 997  7859 5552 108579 32.43 2281.95 1310  9313 6386 112429 38.91 2690.23 1442 11738 8038 122645 37.38 3169.48 1283 13176 9005 113807 47.19 2450.14 1660 14384 9663 95712  50.68 1746.20 2178 16557 10969 95081 55.91 3335.65 2886 20223 12985 99693 83.66 3311.50 3383 24882 15949 105458 96.08 4152.70 ; proc reg; model y=x1-x5/selection=stepwise; model y=x1-x5/selection=stepwise; run; proc reg outest=w;                  /*主成分回归计算结果存数据集wu*/ model y=x1-x5/pcomit=2;            /*实行主成分分析,去掉2个主成分*/ proc print data=w; run; 执行后输出的最后一个表为 _    _              I _            D  _  P              N M      _    E  R  C    _        T O      T    P  I  O    R        E D      Y    V  D  M    M        R O    E      P    A  G  I    S        C B    L      E    R  E  T    E        E        X        X        X        X        X S    _      _    _  _  _    _        P        1        2        3        4        5      Y 1  MODEL1  PARMS  Y  .  .  75.9488  622.327  0.13433  -0.15715  -0.009738  18.4435  0.29278  -1 2  MODEL1  IPC    Y  .  2  96.1468  702.573  0.03878    0.05967  -0.010648  9.9057  0.21851  -1 这表倒数第2行和最后一行分别是:不减少主成分和减少两个主成分所得参数估计。由这表最后一行可见主成分方法得到的回归方程就是 y=702.573+0.03878x1+0.05967x2-.010648x3+9.9057 x4+0.21851x5 其中消费额x2的系数就是正的了。 data USairpollution; input city$  SO2  temp  manu  popul  wind  precip  predays; cards; Albany          46 47.6  44  116  8.8  33.36    135 Albuquerque    11 56.8  46  244  8.9  7.77      58 Atlanta        24 61.5  368  497  9.1  48.34    115 Baltimore      47 55.0  625  905  9.6  41.31    111 Buffalo        11 47.1  391  463 12.4  36.11    166 Charleston      31 55.2  35    71  6.5  40.75    148 Chicago        110 50.6 3344  3369 10.4  34.44    122 Cincinnati      23 54.0  462  453  7.1  39.04    132 Cleveland      65 49.7 1007  751 10.9  34.99    155 Columbus        26 51.5  266  540  8.6  37.01    134 Dallas          9 66.2  641  844 10.9  35.94      78 Denver          17 51.9  454  515  9.0  12.95      86 Des Moines      17 49.0  104  201 11.2  30.85    103 Detroit        35 49.9 1064  1513 10.1  30.96    129 Hartford        56 49.1  412  158  9.0  43.37    127 Houston        10 68.9  721  1233 10.8  48.19    103 Indianapolis    28 52.3  361  746  9.7  38.74    121 Jacksonville    14 68.4  136  529  8.8  54.47    116 Kansas City    14 54.5  381  507 10.0  37.00      99 Little Rock    13 61.0  91  132  8.2  48.52    100 Louisville      30 55.6  291  593  8.3  43.11    123 Memphis        10 61.6  337  624  9.2  49.10    105 Miami          10 75.5  207  335  9.0  59.80    128 Milwaukee      16 45.7  569  717 11.8  29.07    123 Minneapolis    29 43.5  699  744 10.6  25.94    137 Nashville      18 59.4  275  448  7.9  46.00    119 New Orleans      9 68.3  204  361  8.4  56.77    113 Norfolk        31 59.3  96  308 10.6  44.68    116 Omaha          14 51.5  181  347 10.9  30.18      98 Philadelphia    69 54.6 1692  1950  9.6  39.93    115 Phoenix        10 70.3  213  582  6.0  7.05      36 Pittsburgh      61 50.4  347  520  9.4  36.22    147 Providence      94 50.0  343  179 10.6  42.75    125 Richmond        26 57.8  197  299  7.6  42.59    115 SaltLakeCity  28 51.0  137  176  8.7  15.17      89 SanFrancisco  12 56.7  453  716  8.7  20.66      67 Seattle        29 51.1  379  531  9.4  38.79    164 St. Louis      56 55.9  775  622  9.5  35.89    105 Washington      29 57.3  434  757  9.3  38.89    111 Wichita          8 56.6  125  277 12.7  30.58      82 Wilmington      36 54.0  80    80  9.0  40.25    114 ; proc reg; model SO2=temp  manu  popul  wind  precip  predays/selection=stepwise; run; proc reg outest=w;                  /*主成分回归计算结果存数据集wu*/ model SO2=temp  manu  popul  wind  precip  predays/pcomit=3; proc print data=w; run; Model: MODEL1 Dependent Variable: SO2 Number of Observations Read                        41 Number of Observations Used                        36 Number of Observations with Missing Values          5 Analysis of Variance Sum of          Mean Source                  DF        Squares        Square    F Value    Pr > F Model                    6          13786    2297.61950      10.46    <.0001 Error                    29    6369.92191      219.65248 Corrected Total          35          20156 Root MSE            14.82068    R-Square    0.6840 Dependent Mean      31.19444    Adj R-Sq    0.6186 Coeff Var            47.51063 Parameter Estimates Parameter      Standard Variable    DF      Estimate          Error    t Value    Pr > |t| Intercept    1      133.67616      50.05524      2.67      0.0123 temp          1      -1.52992        0.65951      -2.32      0.0276 manu          1        0.06692        0.01717      3.90      0.0005 popul        1      -0.04236        0.01649      -2.57      0.0156 wind          1      -3.38346        1.88276      -1.80      0.0827 precip        1        0.80416        0.39760      2.02      0.0524 predays      1      -0.17206        0.17864      -0.96      0.3434 5.5  经验正交 关于工期滞后的函关于工程严重滞后的函关于工程进度滞后的回复函关于征求同志党风廉政意见的函关于征求廉洁自律情况的复函 数分解 经验正交函数分解也称为经验正交分解或自然正交分解,其算法类似主成分分析,但含义不同,分析方法不同。主成分分析是对随机向量作分析,而经验正交函数分解是对确定性变量进行分析。由于经验正交函数分解在气象上的用途较大,在气象上称为EOF方法,见吴洪宝(2005)。 对气象要素场的分解,目前已有多种方法,如谐波分析、球函数分解、Chebixief分解。与它们相比,经验正交函数分解更有其优越性。(1)没有固定的函数形式,因而不需许多数学假设,更易符合实际。(2)能在不规则分布站点使用。(3)既可以在空间不同点进行分解,也可在同一站点对不同时间点分解,也可对同一站点不同要素做分解。 为了便于叙述经验正交分解,我们举不同站点,不同时间气温的例5.12和例5.13作为例子;容易看出气温可换为任何其他指标,站点这一属性变量也可换为别的属性变量,如例5.14中换为害虫的品种。 例5.12 设有p个站点,在i时刻j个站点温度观测值为 ,温度矩阵为 ,令 , 即 是各站点观测值减去对时间的平均值(距平), 形成矩阵 。 设样本协差阵为R,则 ,若 为R的第j个彼此正交的单位特征向量,则 , 是第j个主成分得分所成向量。用分块矩阵写成 由特征向量正交性,通过分块矩阵乘法易证 , 于是,由分块矩阵乘法 。称 为第j个空间函数, 彼此正交。每一个 是一个空间正交 经验函数。和主成分分析一样,通常只取少数前k个 和 , ,即F可用少数空间正交经验 函数描述。 我们也可以考虑时间正交经验函数,令 , 设 形成矩阵 。 设 ,若 为H的第j个彼此正交的单位特征向量,则 , 是第j个主成分得分所成向量。用分块矩阵写成 由特征向量正交性,通过分块矩阵乘法易证 , 于是,由分块矩阵乘法 。称 为第j个时间函数, 彼此正交。每一个 是 一个正交经验函数。和主成分分析一样,通常只取较小的数k,只考虑前k个 和 , , 即G可用少数时间正交经验函数描述。 上述分解称为正交经验函数分解,也称为正交经验分解。 容易看出,正交经验函数分解与主成分分析的计算相同:若有q行p列数据矩阵F,将矩阵q个行变量作为p维随机变量的q次观测值,用协方差阵做主成分分析。各个主成分的系数构成p个正交经验函数,p个主成分得分就是正交经验函数的系数。 正交经验(函数)分解可以用SAS-PRINCOMP过程完成,例5.13说明其过程。 例5.13 设某三气象站(a,b,c)五次气温观测如表4-11,试做经验正交函数分解。 表5-11三气象站五次气温观测值 a b c 10 12 14 9 11 12 9 12 13 10 12 14 8 11 13       用空间经验函数分解,可采用下列程序 data temperat; input  a b c; cards; 10 12 14 9 11 12 9 12 13 10 12 14 8 11 13 ; proc princomp cov out=w1; var a b c; proc print data=w1; run; 执行该程序后,得到的主要输出为 Simple Statistics A                B                C Mean      9.200000000      11.60000000      13.20000000 StD        0.836660027        0.54772256        0.83666003 上表指出三地气温平均值分别是9.2,11.6,13.2;因而距平F应是观测值减去此三数,即{ }为 0.8 0.4 0.8 -0.2 -0.6 -1.2 -0.2 0.4 -0.2 0.8 0.4 0.8 -1.2 -0.6 -0.2       Eigenvectors PRIN1        PRIN2        PRIN3 A      0.642542      0.707107      -.295194 B      0.417468      0.000000      0.908692 C      0.642542      -.707107      -.295194 上表给出三个特征向量,它们是彼此正交的经验函数(空间函数)。第一特征向量 中各分量相差不多,反映三地气温偏高的特征;第二特征向量 中第1,3个分量绝对值相同,符号相反,反映a地气温偏高,c地气温偏低的趋势。第三特征值很小,第三特征向量不考虑 OBS    A    B    C      PRIN1      PRIN2      PRIN3 1    10    12    14    1.19505    0.00000    -0.10883 2      9    11    12    -1.15004    0.70711    -0.13194 3      9    12    13    -0.09003    -0.00000    0.48155 4    10    12    14    1.19505    0.00000    -0.10883 5      8    11    13    -1.15004    -0.70711    -0.13194 上表给出 , 说明第一特征在第1,4年较强(1、4年气温偏高),第2,5年反方向较强(2、5年气温偏低),第三年很弱(气温接近平均值);第二特征第二年较强(a地气温距平比c地高),第五年反方向较强(c地气温比a地高)。 若想得到时间正交经验分解,则须把5年的观测值作为5个随机变量,a、b、c,3地代表不同观测次数,就可得另一分解。这时 采用程序 data temperat; input  year1-year5; cards; 10      9      9      10      8 12      11      12      12      11 14      12      13      14      13 ; proc princomp cov out=w2; var year1-year5; proc print data=w2; run; 执行程序后得到的主要结果是 Eigenvectors PRIN1        PRIN2        PRIN3        PRIN4        PRIN5 YEAR1      0.436094      -.465405      -.037197      0.303046      0.707107 YEAR2      0.334245      0.240358      0.911322      0.000000      0.000000 YEAR3      0.450442      0.713419      -.353370      0.404061      0.000000 YEAR4      0.436094      -.465405      -.037197      0.303046      -.707107 YEAR5      0.552292      0.007656      -.204583      -.808122      0.000000 这5个特征向量就是彼此正交的时间经验函数。由上表可见第1特征向量是 反映五年气温偏高特征;第2特征向量是 ,反映第三年偏高,第1,4年偏低特征。 OBS YEAR1 YEAR2 YEAR3 YEAR4 YEAR5  PRIN1    PRIN2  PRIN3  PRIN4  PRIN5 1    10      9      9    10    8  -4.82526  -0.22404  0      0      0 2    12    11    12    12    11    0.59581    0.55828    0      0      0 3    14    12    13    14    13    4.22945    -0.33425    0      0      0 上表表明 ,中 -4.82546和4.22945绝对值相对很大符号一正一负,0.59581绝对值相对偏小,说明第一特征在a,c地突出,a地5年温度偏低,c地5年温度偏高; 。0.55828绝对值相对偏大,这说明第二特征在b地突出,b地第三年偏高,第1,4年偏低。 例5.14 已知山楂园昆虫群落调查表如表5-12,其中x1-x16表示不同时刻昆虫的群落x1:桃蚜,x2:山楂木虱,x3:草履蚧,x4:山楂叶螨, x5:梨网蝽,x6:黑绒金龟子,x7:苹毛金龟子, x8:顶梢叶蛾,x9:苹小卷叶蛾,x10:金纹细蛾,x11:舟形毛虫,x12:山楂粉蝶,x13:桃小食心虫,x14:梨小食心虫,x15:白小食心虫,x16:桑天蛾。T表示时段。做经验正交函数分解。 表5-12  山楂园昆虫群落调查表 t x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15 x16 1 0 10 4 0 0 9 0 0 0 0 0 0 0 0 9 0 2 24 18 7 0 0 18 7 0 0 0 0 13 0 0 0 0 3 329 53 13 0 8 274 182 7 1 0 0 22 0 0 5 0 4 675 86 2 11 43 419 619 12 1 0 0 34 0 0 7 0 5 266 123 28 7 47 64 253 31 14 4 0 46 0 0 23 0 6 38 205 35 16 94 13 47 64 17 9 0 31 0 16 32 0 7 2 180 17 34 125 4 0 23 44 35 0 7 0 72 13 0 8 0 71 6 53 207 0 0 11 17 60 0 0 0 115 11 1 9 0 23 0 89 391 0 0 7 8 125 0 0 0 9 143 4 10 0 10 0 74 647 0 0 13 11 153 10 0 37 26 19 6 11 0 0 0 93 561 0 0 1 4 65 126 0 72 289 8 15 12 0 0 0 64 174 0 0 0 6 70 284 0 346 21 3 5 13 0 0 0 23 13 0 0 0 3 213 133 0 295 93 23 0 14 0 0 0 8 0 0 0 0 1 145 13 0 82 41 15 0 15 0 0 0 3 0 0 0 0 0 43 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0                                     解 设变量x1-x16表示各种昆虫群落,程序为 data insect; input t x1-x16; cards; 1  0    10  4  0  0  9  0  0  0  0  0  0  0  0  9  0 2  24  18  7  0  0  18  7  0  0  0  0  13  0  0  0  0 3  329  53  13 0  8 274 182  7  1  0  0  22  0  0  5  0 4  675  86  2 11  43 419 619 12 1  0  0  34  0  0  7  0 5  266 123 28  7  47 64 253  31 14 4  0  46  0  0  23 0 6  38  205 35 16  94 13  47  64 17 9  0  31  0  16 32 0 7  2  180 17 34 125  4  0  23 44 35  0  7  0  72  13 0 8  0  71  6  53 207  0  0  11 17 60  0  0  0 115  11 1 9  0  23  0  89 391  0  0  7  8 125 0  0  0  9  143 4 10 0  10  0  74 647  0  0  13 11 153 10 0  37 26  19  6 11 0  0  0  93 561  0  0  1  4 65 126 0  72 289  8  15 12 0  0  0  64 174  0  0  0  6 70 284 0 346 21  3  5 13 0  0  0  23  13  0  0  0  3 213 133 0 295 93  23  0 14 0  0  0  8  0  0  0  0  1 145 13  0  82 41  15  0 15  0  0  0  3  0  0  0  0  0  43  0  0  0  0  0  0 16 0  0  0    0  0  0  0  0  0  0  0  0  0  0  0  0 ; proc princomp  cov n=4 out=eo; var x1-x16; run; proc print data=eo; var prin1-prin4; run; 执行后的主要输出为 Eigenvalues Eigenvalue      Difference      Proportion      Cumulative PRIN1        84013.7        43593.6        0.538676        0.538676 PRIN2        40420.1        22524.4        0.259164        0.797841 PRIN3        17895.7        13220.9        0.114743        0.912584 PRIN4          4674.9              .          0.029974        0.942558 以上是协方差阵的前4个特阵值,累积比例0.9426表明只要取4个特阵向量-经验正交函数就够了。 Eigenvectors PRIN1        PRIN2        PRIN3        PRIN4 X1      0.615750      0.268084      0.105590      -.024590 X2      0.075776      0.000319      -.192503      0.662614 X3      0.009459      -.008403      -.030454      0.098534 X4      -.065180      0.123261      0.042156      0.037380 X5      -.369040      0.888579      -.092851      -.056854 X6      0.379858      0.163405      0.080058      -.139139 X7      0.531713      0.249775      0.098918      0.059858 X8      0.009834      0.006608      -.046147      0.139279 X9      -.006596      0.005590      -.024813      0.099052 X10      -.120040      0.065880      0.218413      -.357796 X11      -.086355      0.034270      0.524309      0.237510 X12      0.039251      0.005635      -.018196      0.074936 X13      -.107747      -.044523      0.765976      0.047768 X14      -.108612      0.155797      0.098543      0.531365 X15      -.023971      0.046099      -.046134      -.138075 X16      -.006550      0.014258      0.005916      0.010357 以上是前4个特征向量,即4个主要正交经验函数。第1特征向量中x1、x7系数大,x5负系数大,表明桃蚜和苹毛金龟子高发而梨网蝽低发;第2特征向量中x5系数大,表明梨网蝽高发, 第3征向量中x11,x13系数大,表明舟形毛虫和桃小食心虫高发; 第4特征向量中x2,x14系数大,表明山楂木虱,梨小食心虫高发。 OBS      PRIN1      PRIN2      PRIN3      PRIN4 1    -31.461    -188.305    -73.085    -29.684 2      -8.182    -179.016    -70.590    -23.294 3    369.967      -4.305      -8.985    -31.552 4    859.690    254.049      73.040    -13.554 5    279.934      -0.902    -44.508      51.884 6      -3.851    -75.585    -112.096    114.183 7    -79.377    -59.232    -104.294    112.322 8    -129.836      22.840    -79.173      44.987 9    -203.233    184.630    -87.230    -95.750 10    -304.774    407.810    -62.373    -98.047 11    -306.690    370.828      43.951    100.632 12    -176.478    -25.204    346.231      28.616 13    -121.268    -154.751    278.666    -18.080 14    -68.164    -175.742      33.614    -58.972 15    -40.817    -186.957    -61.825    -49.482 16    -35.460    -190.160    -71.343    -34.209 上表为主成分得分。Prin1得分中3,4,5时段得分数大,表明该三个时段桃蚜和苹毛金龟子高发高发;Prin2得分中4,9,10,11时段得分数大,表明上述时段梨网蝽高发(与实际情况略有差异,因有第1主成分影响);Prin3得分中第12,13时段得分大,表明这2时段舟形毛虫和桃小食心虫高发Prin4得分中6,7,10时短得分大,表明这三时段山楂木虱,梨小食心虫高发。 应用实例 例1  利用武汉市2005年五月份的每天的各监测站平均的SO2监测值与每天早上八点钟的风力、气温、三小时降水作主分量分析。 解:采用以下程序 data temperat; input date emo_so2    dd_08    t_08    r_08; cards; 20050501    22.43     1    23.00    18.00 20050502    45.57     2    20.40    0.00
本文档为【第五章 主成分分析(2)(主成分回归、经验正交分解EOF)】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_882336
暂无简介~
格式:doc
大小:322KB
软件:Word
页数:50
分类:
上传时间:2019-06-11
浏览量:39