🔒 保密 · 本报告是未公开学位论文送盲审前的作者自审参考,含论文具体内容与数据,仅供作者本人修改使用;不代表答辩委员会或盲审意见、不下「是否同意答辩」结论。请勿外传、转载或提交至任何检索/在线服务。
学位论文自审报告
高速玉米精量播种机气流辅助定向输种方法与装置研究
E 研究内容与方法 / E3 统计方法与指标

E3 统计方法与指标

信息泄露、交叉验证用法、显著性检验、指标选择与解释(R²/RPD/RMSE 等)。

必须修改 5建议修改 2提醒 2
必须修改 E3-001

定向播种与乱序播种的关键对比没做显著性检验就下「明显高于」结论

📍 位置5.2.3 节 | 印刷页 150 | 表5-2、表5-3
问题
只有 3 个重复就直接说定向播种出苗率「明显高于」乱序,没有做任何统计检验支撑这个「明显」。
为什么是问题
n=3 且乱序组方差大(含一个 76.67% 低值),不做显著性检验就断言「明显高于」,差异可能来自随机波动;这是盲审最易追问的统计硬项(关键对比须报显著性)。
修改建议
  • 对出苗率、株高变异系数的定向与乱序对比补做假设检验(如 t 检验或方差分析),报告检验方法、显著性水平 α 与 p 值。
  • 若样本量不足以支撑「明显」,把结论措辞改为与数据强度相称(如「定向播种出苗率略高,但 3 次重复尚不足以判定差异显著」),并说明预试验定位。
证据 / 原文锚点
  • 印刷页 150 原文:「定向播种处理的出苗率为96.67%,明显高于乱序播种处理的87.78%」,未给 t 检验、方差分析或 p 值。
  • 每个处理仅 3 次重复(表5-2:试验1/2/3、对照1/2/3)。
  • 定向三次重复出苗率为 96.67%、100.00%、93.33%;乱序为 93.33%、93.33%、76.67%——乱序的差距主要由对照3(76.67%,明显偏低)拉低,组间是否真有差异需检验。
  • 株高整齐度结论同样未检验:定向变异系数 18.34% 对乱序 22.32%,仅凭两个数说「整齐性较好」。
  • 对照:同章 5.1.2/5.1.3 节的图5-5~5-10 柱上已标 a/b/c/d/e 显著性字母(做了多重比较检验),唯独 5.2 节预试验这一关键对比未给任何检验。
必须修改 E3-002

图5-5~5-10 标了显著性字母,却没说检验方法、显著性水平和样本基础

📍 位置5.1.2 节 | 印刷页 142、145 | 图5-5~图5-10
问题
图里柱子标了 a/b/c/d/e 来区分显著性,但全章没交代用什么检验、α 取多少、字母基于多少样本算出来的。
为什么是问题
显著性字母是统计推断结论,但读者无法核验它从何而来——不知检验方法、α 和误差项,就无法判断分组是否成立;这是方法学完整性硬项(须显式注明 α 与检验方法、同篇一致)。
修改建议
  • 在 5.1.2 节方法或图注中补注多重比较的检验方法与显著性水平 α,并保证全篇 α 一致。
  • 明确显著性字母所依据的重复结构(每速度水平 n 是多少、是否独立运行),消除把同一次运行的多粒种子当独立重复的疑虑。
证据 / 原文锚点
  • 图5-5~图5-10(印刷页 145)各速度水平柱上标注 a/b/c/d/e 字母,表示组间多重比较结果。
  • 正文印刷页 145-146 用「差异显著」「差异不显著」描述这些字母,但通篇未注明检验方法(如 Duncan/LSD/Tukey)、显著性水平 α(0.05 还是 0.01)。
  • 样本基础说明含糊:印刷页 142 称「每组处理随机选取20 粒玉米种子」,但未说明这 20 粒是否来自多次独立运行、显著性字母以 20 粒为重复还是另有重复结构。
必须修改 E3-003

田间评价指标列了重播率、漏播率、合格率,结果只报了变异系数,其余三项没数据

📍 位置5.3.2 节、5.3.3 节 | 印刷页 152、153-155 | 图5-15、表5-5
问题
方法部分明确说要用四个指标评价,结果部分只给了其中一个的数,另外三个指标的结果通篇没有。
为什么是问题
说好用四个指标评价,最后只拿出一个指标的数,另外三个只字未提。读者会怀疑是没测,还是测了但数据不好被略去(选择性汇报)。单粒播种机性能恰恰主要看重播率、漏播率、合格率,这三项缺失会让「田间播种性能验证」的结论站不住。
修改建议
  • 补出各速度下的重播率、漏播率、合格率结果(建议入表,与变异系数并列)。
  • 若本次田间确未测这三项,删去 5.3.2 节中对应指标,只保留实际报告的指标(变异系数、平均绝对误差、定向率),并说明仅评价株距一致性的理由。
证据 / 原文锚点
  • 5.3.2 节(印刷页 152)写「选用重播率、漏播率、变异系数、合格率为评价指标」。
  • 5.3.3 节株距分析(印刷页 153-154)只报了均值、变异系数、株距范围、平均绝对误差,没有重播率、漏播率、合格率的任何数值。
  • 表5-5(印刷页 155)只给定向率,图5-15 只给变异系数曲线,全区未出现重播率/漏播率/合格率结果。
  • 经核,第五章田间结果页(印刷页 151-156)「重播率」「漏播率」均无第二次出现;「合格率」第二次出现是 5.4 节小结里的「台架统计定向合格率为52%」(台架数据,非田间)。
必须修改 E3-004

方差分析表4-5 的 F 值、P 值与正文所述完全不同

📍 位置4.3.3 节 | 印刷页 120-121 | 表4-5
问题
正文报的模型 F 值、显著性和各因素 F 值,跟方差分析表里写的是两套数,对不上。
为什么是问题
方差分析是响应面建模的核心证据,整体 F 与单因素 F 是判断模型与各因素是否显著的依据。正文一套数(模型 F=9.87、B 因素 F=29.56)、表里另一套数(模型 F=12.11、B 因素 F=49.52),两者无法同时为真。盲审对照即见,会直接质疑回归分析的可靠性。
修改建议
  • 以实际软件输出为准,把正文的模型 F、P 和 B 因素 F、P 改成与表4-5 一致的值(模型 F=12.11、P=0.0017;B 因素 F=49.52、P=0.0002)。
  • 若正文那套数(9.87/0.0010、29.56/0.0003)才是正确输出,则改表4-5;二者只能留一套。
  • 核对正文「P=0.0010 达极显著(P<0.01)」的结论在改数后仍成立。
  • 另见 G3-002(同一处 F/P 不一致的数据诚信观察,以本条为统计方法学主条)。
证据 / 原文锚点
  • 印刷页 120 正文:「二阶多项式回归模型整体 F 值为 9.87,显著性水平 P=0.0010」。
  • 表4-5(印刷页 121)「模型」行:F=12.11、P=0.0017。
  • 印刷页 120 正文:半径倍数 B「F=29.56,P=0.0003」。
  • 表4-5「B」行:F=49.52、P=0.0002。
  • 表4-5 各因素显著性:A(P=0.0073)、B(P=0.0002)、C(P=0.0007)、AB(0.2655)、AC(0.421)、BC(0.4331)、A²(0.2143)、B²(0.9912)、C²(0.0238)。
必须修改 E3-005

决定系数写 R²=0.86,却说「可解释 85.56%」,两个数不是同一个值

📍 位置4.3.4 节 | 印刷页 122
问题
同一句里决定系数写 0.86、解释比例写 85.56%,两个数不是同一个值的两种写法。
为什么是问题
「模型可解释的响应变异比例」就是决定系数 R²。一句话里 R² 报 0.86、解释比例报 85.56%,二者应当相等却差了 0.44 个百分点,说明 0.86 是四舍五入后的口径、85.56% 是原始口径,混在一起读者无法确定真实 R²。
修改建议
  • 统一到一个精度:要么写「R²=0.8556,可解释 85.56% 的响应变异」,要么写「R²=0.86,可解释约 86%」。
  • 同步核对调整决定系数 0.77 与预测决定系数 0.44 的精度口径一致。
证据 / 原文锚点
  • 印刷页 122:「决定系数 R² 为 0.86,调整决定系数 R²_Adj 为 0.77,表明模型可解释 85.56%的响应变异」。
  • 0.86 对应 86%;85.56% 对应 R²=0.8556。
建议修改 E3-006

表4-5 给了失拟检验结果,正文却没把它讲出来

📍 位置4.3.3 节 | 印刷页 120-122 | 表4-5
问题
表4-5 给了失拟检验(失拟 F=1.78、P=0.2993)这个关键结果,但正文没把它讲出来。
为什么是问题
失拟检验(lack-of-fit,检验模型是否偏离数据)不显著是响应面回归模型可用的重要判据,与决定系数、残差诊断并列。表里有数、正文不点,等于把一个支持模型可靠性的有利证据藏在表里没用上,盲审可能反问「失拟是否检验过」。
修改建议
  • 在 4.3.3 节或 4.3.4 节补一句:失拟项 P=0.2993(>0.05),失拟不显著,表明模型与数据吻合、可用于预测。
  • 与残差正态性(图4-8)、随机性(图4-9)结论并列陈述。
证据 / 原文锚点
  • 表4-5「失拟」行:平方和 0.3262、F=1.78、P=0.2993。
  • 正文印刷页 120-122 论及模型显著性、单因素显著性、残差正态性(图4-8/4-9),但未在文字中说明失拟检验 P=0.2993>0.05(即失拟不显著、模型适用)这一结论。
建议修改 E3-007

四因素优化结果有三个落在试验范围的端点上,未做边界外延伸或说明

📍 位置4.4.4 节、4.6 节 | 印刷页 129、136 | 表4-6
问题
气管引导线四个参数的优化值里,有三个正好取在所设试验范围的端点上,最优点压在边界,说明真正的最优可能在试验范围之外,但文中没有讨论或外延。
为什么是问题
响应面优化得到的最优解落在自变量边界,通常意味着在所考察范围内响应仍在单调上升或下降、极值点可能在范围以外;不加说明直接当最优参数,盲审会质疑试验范围是否取窄了。
修改建议
  • 对取在边界的三个因素补一句说明(如受结构干涉、空间约束限制只能取到此范围),或在边界外补充少量验证点说明继续外延收益有限。
  • 明确优化模型预测的最优出口水平速度数值,并与边界附近实测点对照。
证据 / 原文锚点
  • 优化结果(印刷页 129、136):入口相对位置 0.30、相对曲率半径 6.7、入口倾角 20°、径向比 0.48。
  • 表4-6 各因素范围:入口相对位置 0.30~0.70,入口倾角 20~40(°),径向比 0.32~0.48。
  • 入口相对位置 0.30=下边界、入口倾角 20°=下边界、径向比 0.48=上边界,三者均取在端点;仅相对曲率半径 6.7 落在范围内部(5.6~8.8)。
提醒 E3-008

田间对比多次说「显著低于」,但没给做了什么检验、用什么显著性水平

📍 位置5.3.3 节 | 印刷页 153 | 图5-15
问题
正文多次说试验组「显著低于」对照组,但没有给出做了什么显著性检验、用什么显著性水平。
为什么是问题
「显著」在统计里是有特定含义的词(需检验+给定显著性水平)。正文用「显著低于」却无任何检验结果支撑,读者无法判断差异是否真的统计显著,还是仅描述性的「数值上低很多」。
修改建议
  • 若做了检验,补报检验方法、显著性水平 α 与 p 值(或置信区间)。
  • 若未做检验,把「显著低于」改为描述性表述(如「明显低于」「数值上远低于」),并说明图5-15 误差棒的含义。
证据 / 原文锚点
  • 印刷页 153:「CV 为16.29%,显著低于对照组36.17%」。
  • 5.3.2 节(印刷页 152)声明评价指标与随机区组设计,但全区(印刷页 151-156)未出现 p 值、显著性水平 α、方差分析或任何检验方法的说明。
  • 图5-15 对照组数据点、试验组均带误差棒,但正文未说明误差棒含义(标准差/标准误/置信区间),也未据此做检验。
提醒 E3-009

方差分析标了显著性星号,却没写原假设是什么、星号各代表多大的显著性水平

📍 位置4.4.3 节 | 印刷页 126-128 | 表4-9
问题
做了方差分析、标了显著性星号,但没写清检验的原假设是什么、星号各代表多大的显著性水平。
为什么是问题
显著性结论建立在某个显著性水平 α 上,不写明 α 与星号含义,读者无法判断「显著」是按 0.05 还是 0.01;这是统计报告完整性的常规要求。
修改建议
  • 在首次出现方差分析处注明显著性水平 α(如 α=0.05)及 */**/*** 对应的阈值。
  • 一句话交代检验的原假设(回归系数为零、因素无显著影响)。
证据 / 原文锚点
  • 表4-9 用「***」「**」标注(如模型 P<0.0001 标 ***、C 项 P=0.0059 标 **),但全章未说明 */**/*** 各对应的显著性水平阈值。
  • 正文用「显著/不显著」「达到显著水平」等表述,未陈述原假设、备择假设,也未注明所取显著性水平 α。