機能拡張ベースの開発だと、元のソースコードを流用して変更していることが多々あると思います。本来あるべき姿ではありませんが、様々な制約でそうせざるを得えません。
カバレッジの評価において、類似度の高いソースコードはカバレッジが低くてもよいことを定量的に説明したいと考えています。単純にdiffを取るだけではダメな気がします。コードクローン検出ツールを使ってみたかったのですが、CCFinderがクローズドになって困ってます。
もしや、JavaMLのdiffを取ってセマンティクスの違いを見ればいいのかな。