毕业季临近,高校普遍面临如何应对毕业论文中过度使用人工智能(AI)生成内容的挑战。除了传统的查重、盲审和答辩环节,AIGC(人工智能生成内容)检测已成为新的审核流程。
有毕业生反映,一篇论文最初的AI生成内容比例为62%,远超学校15%的限制。在尝试使用AI模型进行修改后,再次检测发现AI生成内容的比例反而飙升至94%。这种现象并非孤例,近期不少毕业生都遇到了类似情况。
中央电视台报道了检测论文“AI率”的原理。首都师范大学教育学院副院长蔡海龙解释说,传统的查重是通过比对论文语句与语料库中的语句来确定重复度,是一种确定性判断。而AI检测则是利用AI系统分析人类文本,判断其在语义和表达风格上是否与AI写作存在重叠,其本质是基于概率的分类,而非基于证据的确定性判断。
当前AI检测技术面临的核心瓶颈在于“以AI查AI”,这使得区分文本究竟是人类作者还是AI所写变得困难,并且难以提供明确的解释和说明。
中文语言表达的丰富性和多样性也给AI检测带来了挑战。AI系统在识别人类作者的语句时,容易产生歧义,从而增加检测难度并降低准确率,这是导致误判的重要原因之一。
鉴于AI检测目前尚未达到完全精准,有教师建议,在论文审核中应建立透明且可追溯的AI使用标注制度,而非简单设定AI生成内容的“红线”。在判定机制上,应推行以人工评审为主、AI检测为辅的“人机共判”模式。
目前,高校普遍采用指定的检测平台和算法模型来分析论文的“AI率”。主流高校通常会使用知网、维普、万方等平台的AIGC检测模块。据央视记者了解,这些平台通过分析文本的“困惑度”和“突发性”等特征来判断AI生成内容的比例。AI生成的文本通常更为“平滑”,而人类文本则波动性更大。
大模型解释,“困惑度”衡量文本的可预测性,人类特有的、出人意料的表达会增加文本的“人类感”。“突发性”则描述文本节奏的起伏,人类写作如同心电图般变化,而AI输出则相对平稳。
专家指出,除了困惑度、突发性等指标外,AI文本生成是基于预测下一个最可能出现的词汇的概率,本质上是一种概率统计。因此,目前AI生成内容的检测准确性无法达到100%,误判情况时有发生。
| 主队 | 比分 | 客队 | 联赛 | 时间(北京) |
|---|---|---|---|---|
| 近期暂无比赛,请稍后再来查看。 | ||||