E 研究内容与方法 / E3 统计方法与指标

E3 统计方法与指标

信息泄露、交叉验证用法、显著性检验、指标选择与解释（R²/RPD/RMSE 等）。

必须修改 5建议修改 2提醒 2

必须修改建议修改提醒

必须修改 E3-001

定向播种与乱序播种的关键对比没做显著性检验就下「明显高于」结论

📍 位置5.2.3 节 | 印刷页 150 | 表5-2、表5-3

问题

只有 3 个重复就直接说定向播种出苗率「明显高于」乱序，没有做任何统计检验支撑这个「明显」。

为什么是问题

n＝3 且乱序组方差大（含一个 76.67% 低值），不做显著性检验就断言「明显高于」，差异可能来自随机波动；这是盲审最易追问的统计硬项（关键对比须报显著性）。

修改建议

对出苗率、株高变异系数的定向与乱序对比补做假设检验（如 t 检验或方差分析），报告检验方法、显著性水平 α 与 p 值。
若样本量不足以支撑「明显」，把结论措辞改为与数据强度相称（如「定向播种出苗率略高，但 3 次重复尚不足以判定差异显著」），并说明预试验定位。

证据 / 原文锚点

印刷页 150 原文：「定向播种处理的出苗率为96.67%，明显高于乱序播种处理的87.78%」，未给 t 检验、方差分析或 p 值。
每个处理仅 3 次重复（表5-2：试验1／2／3、对照1／2／3）。
定向三次重复出苗率为 96.67%、100.00%、93.33%；乱序为 93.33%、93.33%、76.67%——乱序的差距主要由对照3（76.67%，明显偏低）拉低，组间是否真有差异需检验。
株高整齐度结论同样未检验：定向变异系数 18.34% 对乱序 22.32%，仅凭两个数说「整齐性较好」。
对照：同章 5.1.2／5.1.3 节的图5-5～5-10 柱上已标 a／b／c／d／e 显著性字母（做了多重比较检验），唯独 5.2 节预试验这一关键对比未给任何检验。

必须修改 E3-002

图5-5～5-10 标了显著性字母，却没说检验方法、显著性水平和样本基础

📍 位置5.1.2 节 | 印刷页 142、145 | 图5-5～图5-10

问题

图里柱子标了 a／b／c／d／e 来区分显著性，但全章没交代用什么检验、α 取多少、字母基于多少样本算出来的。

为什么是问题

显著性字母是统计推断结论，但读者无法核验它从何而来——不知检验方法、α 和误差项，就无法判断分组是否成立；这是方法学完整性硬项（须显式注明 α 与检验方法、同篇一致）。

修改建议

在 5.1.2 节方法或图注中补注多重比较的检验方法与显著性水平 α，并保证全篇 α 一致。
明确显著性字母所依据的重复结构（每速度水平 n 是多少、是否独立运行），消除把同一次运行的多粒种子当独立重复的疑虑。

证据 / 原文锚点

图5-5～图5-10（印刷页 145）各速度水平柱上标注 a／b／c／d／e 字母，表示组间多重比较结果。
正文印刷页 145-146 用「差异显著」「差异不显著」描述这些字母，但通篇未注明检验方法（如 Duncan／LSD／Tukey）、显著性水平 α（0.05 还是 0.01）。
样本基础说明含糊：印刷页 142 称「每组处理随机选取20 粒玉米种子」，但未说明这 20 粒是否来自多次独立运行、显著性字母以 20 粒为重复还是另有重复结构。

必须修改 E3-003

田间评价指标列了重播率、漏播率、合格率，结果只报了变异系数，其余三项没数据

📍 位置5.3.2 节、5.3.3 节 | 印刷页 152、153-155 | 图5-15、表5-5

问题

方法部分明确说要用四个指标评价，结果部分只给了其中一个的数，另外三个指标的结果通篇没有。

为什么是问题

说好用四个指标评价，最后只拿出一个指标的数，另外三个只字未提。读者会怀疑是没测，还是测了但数据不好被略去（选择性汇报）。单粒播种机性能恰恰主要看重播率、漏播率、合格率，这三项缺失会让「田间播种性能验证」的结论站不住。

修改建议

补出各速度下的重播率、漏播率、合格率结果（建议入表，与变异系数并列）。
若本次田间确未测这三项，删去 5.3.2 节中对应指标，只保留实际报告的指标（变异系数、平均绝对误差、定向率），并说明仅评价株距一致性的理由。

证据 / 原文锚点

5.3.2 节（印刷页 152）写「选用重播率、漏播率、变异系数、合格率为评价指标」。
5.3.3 节株距分析（印刷页 153-154）只报了均值、变异系数、株距范围、平均绝对误差，没有重播率、漏播率、合格率的任何数值。
表5-5（印刷页 155）只给定向率，图5-15 只给变异系数曲线，全区未出现重播率／漏播率／合格率结果。
经核，第五章田间结果页（印刷页 151-156）「重播率」「漏播率」均无第二次出现；「合格率」第二次出现是 5.4 节小结里的「台架统计定向合格率为52%」（台架数据，非田间）。

必须修改 E3-004

方差分析表4-5 的 F 值、P 值与正文所述完全不同

📍 位置4.3.3 节 | 印刷页 120-121 | 表4-5

问题

正文报的模型 F 值、显著性和各因素 F 值，跟方差分析表里写的是两套数，对不上。

为什么是问题

方差分析是响应面建模的核心证据，整体 F 与单因素 F 是判断模型与各因素是否显著的依据。正文一套数（模型 F＝9.87、B 因素 F＝29.56）、表里另一套数（模型 F＝12.11、B 因素 F＝49.52），两者无法同时为真。盲审对照即见，会直接质疑回归分析的可靠性。

修改建议

以实际软件输出为准，把正文的模型 F、P 和 B 因素 F、P 改成与表4-5 一致的值（模型 F＝12.11、P＝0.0017；B 因素 F＝49.52、P＝0.0002）。
若正文那套数（9.87／0.0010、29.56／0.0003）才是正确输出，则改表4-5；二者只能留一套。
核对正文「P＝0.0010 达极显著（P＜0.01）」的结论在改数后仍成立。
另见 G3-002（同一处 F／P 不一致的数据诚信观察，以本条为统计方法学主条）。

证据 / 原文锚点

印刷页 120 正文：「二阶多项式回归模型整体 F 值为 9.87，显著性水平 P＝0.0010」。
表4-5（印刷页 121）「模型」行：F＝12.11、P＝0.0017。
印刷页 120 正文：半径倍数 B「F＝29.56，P＝0.0003」。
表4-5「B」行：F＝49.52、P＝0.0002。
表4-5 各因素显著性：A（P＝0.0073）、B（P＝0.0002）、C（P＝0.0007）、AB（0.2655）、AC（0.421）、BC（0.4331）、A²（0.2143）、B²（0.9912）、C²（0.0238）。

必须修改 E3-005

决定系数写 R²＝0.86，却说「可解释 85.56%」，两个数不是同一个值

📍 位置4.3.4 节 | 印刷页 122

问题

同一句里决定系数写 0.86、解释比例写 85.56%，两个数不是同一个值的两种写法。

为什么是问题

「模型可解释的响应变异比例」就是决定系数 R²。一句话里 R² 报 0.86、解释比例报 85.56%，二者应当相等却差了 0.44 个百分点，说明 0.86 是四舍五入后的口径、85.56% 是原始口径，混在一起读者无法确定真实 R²。

修改建议

统一到一个精度：要么写「R²＝0.8556，可解释 85.56% 的响应变异」，要么写「R²＝0.86，可解释约 86%」。
同步核对调整决定系数 0.77 与预测决定系数 0.44 的精度口径一致。

证据 / 原文锚点

印刷页 122：「决定系数 R² 为 0.86，调整决定系数 R²_Adj 为 0.77，表明模型可解释 85.56%的响应变异」。
0.86 对应 86%；85.56% 对应 R²＝0.8556。

建议修改 E3-006

表4-5 给了失拟检验结果，正文却没把它讲出来

📍 位置4.3.3 节 | 印刷页 120-122 | 表4-5

问题

表4-5 给了失拟检验（失拟 F＝1.78、P＝0.2993）这个关键结果，但正文没把它讲出来。

为什么是问题

失拟检验（lack-of-fit，检验模型是否偏离数据）不显著是响应面回归模型可用的重要判据，与决定系数、残差诊断并列。表里有数、正文不点，等于把一个支持模型可靠性的有利证据藏在表里没用上，盲审可能反问「失拟是否检验过」。

修改建议

在 4.3.3 节或 4.3.4 节补一句：失拟项 P＝0.2993（＞0.05），失拟不显著，表明模型与数据吻合、可用于预测。
与残差正态性（图4-8）、随机性（图4-9）结论并列陈述。

证据 / 原文锚点

表4-5「失拟」行：平方和 0.3262、F＝1.78、P＝0.2993。
正文印刷页 120-122 论及模型显著性、单因素显著性、残差正态性（图4-8／4-9），但未在文字中说明失拟检验 P＝0.2993＞0.05（即失拟不显著、模型适用）这一结论。

建议修改 E3-007

四因素优化结果有三个落在试验范围的端点上，未做边界外延伸或说明

📍 位置4.4.4 节、4.6 节 | 印刷页 129、136 | 表4-6

问题

气管引导线四个参数的优化值里，有三个正好取在所设试验范围的端点上，最优点压在边界，说明真正的最优可能在试验范围之外，但文中没有讨论或外延。

为什么是问题

响应面优化得到的最优解落在自变量边界，通常意味着在所考察范围内响应仍在单调上升或下降、极值点可能在范围以外；不加说明直接当最优参数，盲审会质疑试验范围是否取窄了。

修改建议

对取在边界的三个因素补一句说明（如受结构干涉、空间约束限制只能取到此范围），或在边界外补充少量验证点说明继续外延收益有限。
明确优化模型预测的最优出口水平速度数值，并与边界附近实测点对照。

证据 / 原文锚点

优化结果（印刷页 129、136）：入口相对位置 0.30、相对曲率半径 6.7、入口倾角 20°、径向比 0.48。
表4-6 各因素范围：入口相对位置 0.30～0.70，入口倾角 20～40（°），径向比 0.32～0.48。
入口相对位置 0.30＝下边界、入口倾角 20°＝下边界、径向比 0.48＝上边界，三者均取在端点；仅相对曲率半径 6.7 落在范围内部（5.6～8.8）。

提醒 E3-008

田间对比多次说「显著低于」，但没给做了什么检验、用什么显著性水平

📍 位置5.3.3 节 | 印刷页 153 | 图5-15

问题

正文多次说试验组「显著低于」对照组，但没有给出做了什么显著性检验、用什么显著性水平。

为什么是问题

「显著」在统计里是有特定含义的词（需检验＋给定显著性水平）。正文用「显著低于」却无任何检验结果支撑，读者无法判断差异是否真的统计显著，还是仅描述性的「数值上低很多」。

修改建议

若做了检验，补报检验方法、显著性水平 α 与 p 值（或置信区间）。
若未做检验，把「显著低于」改为描述性表述（如「明显低于」「数值上远低于」），并说明图5-15 误差棒的含义。

证据 / 原文锚点

印刷页 153：「CV 为16.29%，显著低于对照组36.17%」。
5.3.2 节（印刷页 152）声明评价指标与随机区组设计，但全区（印刷页 151-156）未出现 p 值、显著性水平 α、方差分析或任何检验方法的说明。
图5-15 对照组数据点、试验组均带误差棒，但正文未说明误差棒含义（标准差／标准误／置信区间），也未据此做检验。

提醒 E3-009

方差分析标了显著性星号，却没写原假设是什么、星号各代表多大的显著性水平

📍 位置4.4.3 节 | 印刷页 126-128 | 表4-9

问题

做了方差分析、标了显著性星号，但没写清检验的原假设是什么、星号各代表多大的显著性水平。

为什么是问题

显著性结论建立在某个显著性水平 α 上，不写明 α 与星号含义，读者无法判断「显著」是按 0.05 还是 0.01；这是统计报告完整性的常规要求。

修改建议

在首次出现方差分析处注明显著性水平 α（如 α＝0.05）及 *／**／*** 对应的阈值。
一句话交代检验的原假设（回归系数为零、因素无显著影响）。

证据 / 原文锚点

表4-9 用「***」「**」标注（如模型 P＜0.0001 标 ***、C 项 P＝0.0059 标 **），但全章未说明 *／**／*** 各对应的显著性水平阈值。
正文用「显著／不显著」「达到显著水平」等表述，未陈述原假设、备择假设，也未注明所取显著性水平 α。