文章详情

专注互联网科技,赋能企业数字化发展

论文反AIGC检测开源项目

作者:论文反AIGC检测开源项目

上次我做了个论文AIGC检测与自动反AIGC的开源项目,帮助大家毕业论文顺利完成 今天讲解一下项目的原理与运用逻辑 第一阶段,文本分段:分段功能不是由大模型切分的,而是由规则函数进行负责 根据文本的长度与句数进行分割,最后会分成seg-1、seg-2 这种片段。 阈值的作用也在这一阶段确定,balanced = 0.58、conservative = 0.66、sensitive = 0.50,分数高于这条线,就认为这个片段需要重点提示然后进行句子级红色标注。 第二阶段,风险检测:先提特征,再算分,最后再生成解释。 先说特征提取,系统会对每个片段提提取可解释特征:句长波动、连接词密度、重复短语密度、泛化表达密度。比如“首先、其次、综上所述”这种会拉高连接词密度,本质上是在判断这段文字是不是太整齐、太模板化、太像流水线表达。 然后系统会算两个分。 第一个是统计风险分,看结构规整度、重复率、连接词密度、泛化表达和句长波动。 第二个是风格风险分,看模板短语命中,比如“首先、综上所述、可以看出”。 最后在 detection.py 里把这两个分按 0.45 * statistical + 0.55 * style 合成片段风险分,再把多个片段合成整体风险分。 第二阶段的“解析”本质是规则解释,不是 LLM 默认分析。 第三阶段,流程控制:把是否修改文字的权限还给用户 第四阶段,修订方向与候选稿:分成两层 第一层先从策略库里选修订方向,系统从固定策略库里挑出 1 到 3 个策略,比如“调整句式节奏与连接方式”“补充具体情境与细节”“加入研究者视角与限定条件”。 第二层真正调用你配置的模型。 系统会把原文、选中的策略、用户备注拼成一个约束很强的提示词,要求模型必须输出 JSON,然后后端再用正则把 JSON 提出来,再 json.loads() 解析。 总结一下:本项目的工作流是:先用规则切段,再提可解释特征,再用两个评分器合成风险分,再按阈值决定流程分支,再从策略库选修订方向,最后才调用大模型生成候选稿,并由后端自己解析结构化结果。 #大模型 #论文写作 #论文降重 #AI工具 #反AIGC检测

返回新闻列表