- 长臂猿-企业应用及系统软件平台
 
            机器之心专栏 机器之心编辑部
Fast-DetectGPT 同时做到了高准确率、高速度、低成本、通用,扫清了实际应用的障碍! 


,我们使用的条件概率可以形式化的表达为:
的不同位置上的 tokens
之间是互相独立的。这种条件独立性质将给我们的采样带来极大的便利。
和采样模型
,我们将条件概率曲率形式化的表达为:


表示由采样模型
生成的样本
在打分模型
上的期望得分,
表示得分的期望方差。我们用随机样本的平均对数概率来近似期望得分
,用对数概率的样本方差来近似期望方差
。
的独立采样是 Fast-DetectGPT 能快速计算的关键。具体来说,我们在固定文本 x 的条件下,从
中采样每个token
,而不依赖于其他采样的token。
的对数概率分布,j 从 0 到 x 的长度。
值的分布。将原始文本token的
值放在这个分布中,可以清楚地看到它的相对位置,使我们能够确定它是一个异常值还是一个更典型的选择。这个基本的洞察形成了 Fast-DetectGPT 方法的核心理念。
,2)打分 -- 通过将 x 作为输入的评分模型的单次前向传递,可以轻易获得条件概率。所有样本都可以在同一预测分布中进行评估,因此我们不需要多次调用模型,以及 3)比较 -- 段落和样本的条件概率被比较以计算条件概率曲率。更多的细节在论文的算法部分进行了详细描述。





© THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com