GeekFactory

int128.hatenablog.com

ソースコードの類似度を算出したい

機能拡張ベースの開発だと、元のソースコードを流用して変更していることが多々あると思います。本来あるべき姿ではありませんが、様々な制約でそうせざるを得えません。

カバレッジの評価において、類似度の高いソースコードカバレッジが低くてもよいことを定量的に説明したいと考えています。単純にdiffを取るだけではダメな気がします。コードクローン検出ツールを使ってみたかったのですが、CCFinderがクローズドになって困ってます。

もしや、JavaMLのdiffを取ってセマンティクスの違いを見ればいいのかな。