所以你要么没用过,要么你把自己曾经改了的设置当成了默认的设置了。
通用文件比较默认是byte-to-byte,是比较的文件大小的字节数。
抽样的前序步骤就是先获取文件大小,决定抽样位置。
这时候已经获取文件的byte了,你的方案还额外多了抽样,算抽样的hash
如果byte-to-byte不一样的文件,肯定是不同的文件,只对体积一样的两个文件,对比hash,整体计算量会比你的方案更小。
会,比如去BT下载带入的广告,保留同一个电影的最优版本,去除同一首音乐的不同版本。
所以你要么没用过,要么你把自己曾经改了的设置当成了默认的设置了。
通用文件比较默认是byte-to-byte,是比较的文件大小的字节数。
抽样的前序步骤就是先获取文件大小,决定抽样位置。
这时候已经获取文件的byte了,你的方案还额外多了抽样,算抽样的hash
如果byte-to-byte不一样的文件,肯定是不同的文件,只对体积一样的两个文件,对比hash,整体计算量会比你的方案更小。
会,比如去BT下载带入的广告,保留同一个电影的最优版本,去除同一首音乐的不同版本。