论文反AIGC检测开源项目

作者：论文反AIGC检测开源项目

上次我做了个论文AIGC检测与自动反AIGC的开源项目，帮助大家毕业论文顺利完成今天讲解一下项目的原理与运用逻辑第一阶段,文本分段:分段功能不是由大模型切分的，而是由规则函数进行负责根据文本的长度与句数进行分割,最后会分成seg-1、seg-2 这种片段。阈值的作用也在这一阶段确定，balanced = 0.58、conservative = 0.66、sensitive = 0.50，分数高于这条线，就认为这个片段需要重点提示然后进行句子级红色标注。第二阶段,风险检测:先提特征，再算分，最后再生成解释。先说特征提取,系统会对每个片段提提取可解释特征：句长波动、连接词密度、重复短语密度、泛化表达密度。比如“首先、其次、综上所述”这种会拉高连接词密度,本质上是在判断这段文字是不是太整齐、太模板化、太像流水线表达。然后系统会算两个分。第一个是统计风险分，看结构规整度、重复率、连接词密度、泛化表达和句长波动。第二个是风格风险分，看模板短语命中，比如“首先、综上所述、可以看出”。最后在 detection.py 里把这两个分按 0.45 * statistical + 0.55 * style 合成片段风险分，再把多个片段合成整体风险分。第二阶段的“解析”本质是规则解释，不是 LLM 默认分析。第三阶段,流程控制:把是否修改文字的权限还给用户第四阶段,修订方向与候选稿:分成两层第一层先从策略库里选修订方向,系统从固定策略库里挑出 1 到 3 个策略，比如“调整句式节奏与连接方式”“补充具体情境与细节”“加入研究者视角与限定条件”。第二层真正调用你配置的模型。系统会把原文、选中的策略、用户备注拼成一个约束很强的提示词，要求模型必须输出 JSON，然后后端再用正则把 JSON 提出来，再 json.loads() 解析。总结一下:本项目的工作流是：先用规则切段，再提可解释特征，再用两个评分器合成风险分，再按阈值决定流程分支，再从策略库选修订方向，最后才调用大模型生成候选稿，并由后端自己解析结构化结果。 #大模型 #论文写作 #论文降重 #AI工具 #反AIGC检测

文章详情

论文反AIGC检测开源项目

推荐阅读