mirror of
https://we.phorge.it/source/arcanist.git
synced 2024-11-25 16:22:42 +01:00
Add ArcanistDiffUtils.
Summary: Test Plan: Reviewers: CC:
This commit is contained in:
parent
adef7d4975
commit
7f4e6692cd
3 changed files with 328 additions and 0 deletions
|
@ -23,6 +23,7 @@ phutil_register_library_map(array(
|
||||||
'ArcanistDiffHunk' => 'parser/diff/hunk',
|
'ArcanistDiffHunk' => 'parser/diff/hunk',
|
||||||
'ArcanistDiffParser' => 'parser/diff',
|
'ArcanistDiffParser' => 'parser/diff',
|
||||||
'ArcanistDiffParserTestCase' => 'parser/diff/__tests__',
|
'ArcanistDiffParserTestCase' => 'parser/diff/__tests__',
|
||||||
|
'ArcanistDiffUtils' => 'difference',
|
||||||
'ArcanistDiffWorkflow' => 'workflow/diff',
|
'ArcanistDiffWorkflow' => 'workflow/diff',
|
||||||
'ArcanistDifferentialCommitMessage' => 'differential/commitmessage',
|
'ArcanistDifferentialCommitMessage' => 'differential/commitmessage',
|
||||||
'ArcanistDifferentialCommitMessageParserException' => 'differential/commitmessage',
|
'ArcanistDifferentialCommitMessageParserException' => 'differential/commitmessage',
|
||||||
|
|
313
src/difference/ArcanistDiffUtils.php
Normal file
313
src/difference/ArcanistDiffUtils.php
Normal file
|
@ -0,0 +1,313 @@
|
||||||
|
<?php
|
||||||
|
|
||||||
|
/*
|
||||||
|
* Copyright 2011 Facebook, Inc.
|
||||||
|
*
|
||||||
|
* Licensed under the Apache License, Version 2.0 (the "License");
|
||||||
|
* you may not use this file except in compliance with the License.
|
||||||
|
* You may obtain a copy of the License at
|
||||||
|
*
|
||||||
|
* http://www.apache.org/licenses/LICENSE-2.0
|
||||||
|
*
|
||||||
|
* Unless required by applicable law or agreed to in writing, software
|
||||||
|
* distributed under the License is distributed on an "AS IS" BASIS,
|
||||||
|
* WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
|
||||||
|
* See the License for the specific language governing permissions and
|
||||||
|
* limitations under the License.
|
||||||
|
*/
|
||||||
|
|
||||||
|
final class ArcanistDiffUtils {
|
||||||
|
|
||||||
|
public static function renderDifferences(
|
||||||
|
$old,
|
||||||
|
$new,
|
||||||
|
$context_lines = 3,
|
||||||
|
$diff_options = "-L 'Old Value' -L 'New Value'") {
|
||||||
|
|
||||||
|
if ((string)$old === (string)$new) {
|
||||||
|
$new .= "\n(Old and new values are identical.)";
|
||||||
|
}
|
||||||
|
|
||||||
|
$file_old = new TempFile();
|
||||||
|
$file_new = new TempFile();
|
||||||
|
|
||||||
|
Filesystem::writeFile($file_old, (string)$old."\n");
|
||||||
|
Filesystem::writeFile($file_new, (string)$new."\n");
|
||||||
|
|
||||||
|
list($err, $stdout) = exec_manual(
|
||||||
|
"/usr/bin/diff {$diff_options} -U {$context_lines} %s %s",
|
||||||
|
$file_old,
|
||||||
|
$file_new);
|
||||||
|
|
||||||
|
return $stdout;
|
||||||
|
}
|
||||||
|
|
||||||
|
public static function generateIntralineDiff($o, $n) {
|
||||||
|
if (!strlen($o) || !strlen($n)) {
|
||||||
|
return array(
|
||||||
|
array(array(0, strlen($o))),
|
||||||
|
array(array(0, strlen($n)))
|
||||||
|
);
|
||||||
|
}
|
||||||
|
|
||||||
|
$result = self::buildLevenshteinDifferenceString($o, $n);
|
||||||
|
|
||||||
|
do {
|
||||||
|
$orig = $result;
|
||||||
|
$result = preg_replace(
|
||||||
|
'/([xdi])(s{3})([xdi])/',
|
||||||
|
'$1xxx$3',
|
||||||
|
$result);
|
||||||
|
$result = preg_replace(
|
||||||
|
'/([xdi])(s{2})([xdi])/',
|
||||||
|
'$1xx$3',
|
||||||
|
$result);
|
||||||
|
$result = preg_replace(
|
||||||
|
'/([xdi])(s{1})([xdi])/',
|
||||||
|
'$1x$3',
|
||||||
|
$result);
|
||||||
|
} while ($result != $orig);
|
||||||
|
|
||||||
|
$o_bright = array();
|
||||||
|
$n_bright = array();
|
||||||
|
$rlen = strlen($result);
|
||||||
|
$len = -1;
|
||||||
|
$cur = $result[0];
|
||||||
|
$result .= '-';
|
||||||
|
for ($ii = 0; $ii < strlen($result); $ii++) {
|
||||||
|
$len++;
|
||||||
|
$now = $result[$ii];
|
||||||
|
if ($result[$ii] == $cur) {
|
||||||
|
continue;
|
||||||
|
}
|
||||||
|
if ($cur == 's') {
|
||||||
|
$o_bright[] = array(0, $len);
|
||||||
|
$n_bright[] = array(0, $len);
|
||||||
|
} else if ($cur == 'd') {
|
||||||
|
$o_bright[] = array(1, $len);
|
||||||
|
} else if ($cur == 'i') {
|
||||||
|
$n_bright[] = array(1, $len);
|
||||||
|
} else if ($cur == 'x') {
|
||||||
|
$o_bright[] = array(1, $len);
|
||||||
|
$n_bright[] = array(1, $len);
|
||||||
|
}
|
||||||
|
$cur = $now;
|
||||||
|
$len = 0;
|
||||||
|
}
|
||||||
|
|
||||||
|
$o_bright = self::collapseIntralineRuns($o_bright);
|
||||||
|
$n_bright = self::collapseIntralineRuns($n_bright);
|
||||||
|
|
||||||
|
return array($o_bright, $n_bright);
|
||||||
|
}
|
||||||
|
|
||||||
|
public static function applyIntralineDiff($str, $intra_stack) {
|
||||||
|
$buf = '';
|
||||||
|
$p = $s = $e = 0; // position, start, end
|
||||||
|
$highlight = $tag = $ent = false;
|
||||||
|
$highlight_o = '<span class="bright">';
|
||||||
|
$highlight_c = '</span>';
|
||||||
|
|
||||||
|
$n = strlen($str);
|
||||||
|
for ($i = 0; $i < $n; $i++) {
|
||||||
|
|
||||||
|
if ($p == $e) {
|
||||||
|
do {
|
||||||
|
if (empty($intra_stack)) {
|
||||||
|
$buf .= substr($str, $i);
|
||||||
|
break 2;
|
||||||
|
}
|
||||||
|
$stack = array_shift($intra_stack);
|
||||||
|
$s = $e;
|
||||||
|
$e += $stack[1];
|
||||||
|
} while ($stack[0] == 0);
|
||||||
|
}
|
||||||
|
|
||||||
|
if (!$highlight && !$tag && !$ent && $p == $s) {
|
||||||
|
$buf .= $highlight_o;
|
||||||
|
$highlight = true;
|
||||||
|
}
|
||||||
|
|
||||||
|
if ($str[$i] == '<') {
|
||||||
|
$tag = true;
|
||||||
|
if ($highlight) {
|
||||||
|
$buf .= $highlight_c;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
if (!$tag) {
|
||||||
|
if ($str[$i] == '&') {
|
||||||
|
$ent = true;
|
||||||
|
}
|
||||||
|
if ($ent && $str[$i] == ';') {
|
||||||
|
$ent = false;
|
||||||
|
}
|
||||||
|
if (!$ent) {
|
||||||
|
$p++;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
$buf .= $str[$i];
|
||||||
|
|
||||||
|
if ($tag && $str[$i] == '>') {
|
||||||
|
$tag = false;
|
||||||
|
if ($highlight) {
|
||||||
|
$buf .= $highlight_o;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
if ($highlight && ($p == $e || $i == $n - 1)) {
|
||||||
|
$buf .= $highlight_c;
|
||||||
|
$highlight = false;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
return $buf;
|
||||||
|
}
|
||||||
|
|
||||||
|
private static function collapseIntralineRuns($runs) {
|
||||||
|
$count = count($runs);
|
||||||
|
for ($ii = 0; $ii < $count - 1; $ii++) {
|
||||||
|
if ($runs[$ii][0] == $runs[$ii + 1][0]) {
|
||||||
|
$runs[$ii + 1][1] += $runs[$ii][1];
|
||||||
|
unset($runs[$ii]);
|
||||||
|
}
|
||||||
|
}
|
||||||
|
return array_values($runs);
|
||||||
|
}
|
||||||
|
|
||||||
|
private static function buildLevenshteinDifferenceString($o, $n) {
|
||||||
|
$olt = strlen($o);
|
||||||
|
$nlt = strlen($n);
|
||||||
|
|
||||||
|
if (!$olt) {
|
||||||
|
return str_repeat('i', $nlt);
|
||||||
|
}
|
||||||
|
|
||||||
|
if (!$nlt) {
|
||||||
|
return str_repeat('d', $olt);
|
||||||
|
}
|
||||||
|
|
||||||
|
$min = min($olt, $nlt);
|
||||||
|
$t_start = microtime(true);
|
||||||
|
|
||||||
|
$pre = 0;
|
||||||
|
while ($pre < $min && $o[$pre] == $n[$pre]) {
|
||||||
|
$pre++;
|
||||||
|
}
|
||||||
|
|
||||||
|
$end = 0;
|
||||||
|
while ($end < $min && $o[($olt - 1) - $end] == $n[($nlt - 1) - $end]) {
|
||||||
|
$end++;
|
||||||
|
}
|
||||||
|
|
||||||
|
if ($end + $pre >= $min) {
|
||||||
|
$end = min($end, $min - $pre);
|
||||||
|
$prefix = str_repeat('s', $pre);
|
||||||
|
$suffix = str_repeat('s', $end);
|
||||||
|
$infix = null;
|
||||||
|
if ($olt > $nlt) {
|
||||||
|
$infix = str_repeat('d', $olt - ($end + $pre));
|
||||||
|
} else if ($nlt > $olt) {
|
||||||
|
$infix = str_repeat('i', $nlt - ($end + $pre));
|
||||||
|
}
|
||||||
|
return $prefix.$infix.$suffix;
|
||||||
|
}
|
||||||
|
|
||||||
|
if ($min - ($end + $pre) > 80) {
|
||||||
|
$max = max($olt, $nlt);
|
||||||
|
return str_repeat('x', $min) .
|
||||||
|
str_repeat($olt < $nlt ? 'i' : 'd', $max - $min);
|
||||||
|
}
|
||||||
|
|
||||||
|
$prefix = str_repeat('s', $pre);
|
||||||
|
$suffix = str_repeat('s', $end);
|
||||||
|
$o = substr($o, $pre, $olt - $end - $pre);
|
||||||
|
$n = substr($n, $pre, $nlt - $end - $pre);
|
||||||
|
|
||||||
|
$ol = strlen($o);
|
||||||
|
$nl = strlen($n);
|
||||||
|
|
||||||
|
$m = array_fill(0, strlen($o) + 1, array_fill(0, strlen($n) + 1, array()));
|
||||||
|
|
||||||
|
$T_D = 'd';
|
||||||
|
$T_I = 'i';
|
||||||
|
$T_S = 's';
|
||||||
|
$T_X = 'x';
|
||||||
|
|
||||||
|
$path = 0;
|
||||||
|
for ($ii = 0; $ii <= $ol; $ii++) {
|
||||||
|
$m[$ii][0][0] = $ii;
|
||||||
|
$m[$ii][0][1] = ($path += $ii);
|
||||||
|
$m[$ii][0][2] = $T_D;
|
||||||
|
}
|
||||||
|
|
||||||
|
$path = 0;
|
||||||
|
for ($jj = 0; $jj <= $nl; $jj++) {
|
||||||
|
$m[0][$jj][0] = $jj;
|
||||||
|
$m[0][$jj][1] = ($path += $jj);
|
||||||
|
$m[0][$jj][2] = $T_I;
|
||||||
|
}
|
||||||
|
|
||||||
|
$ii = 1;
|
||||||
|
do {
|
||||||
|
$jj = 1;
|
||||||
|
do {
|
||||||
|
if ($o[$ii - 1] == $n[$jj - 1]) {
|
||||||
|
$sub_t_cost = $m[$ii - 1][$jj - 1][0] + 0;
|
||||||
|
$sub_t = $T_S;
|
||||||
|
} else {
|
||||||
|
$sub_t_cost = $m[$ii - 1][$jj - 1][0] + 2;
|
||||||
|
$sub_t = $T_X;
|
||||||
|
}
|
||||||
|
$sub_p_cost = $m[$ii - 1][$jj - 1][1] + $sub_t_cost;
|
||||||
|
|
||||||
|
$del_t_cost = $m[$ii - 1][$jj][0] + 1;
|
||||||
|
$del_p_cost = $m[$ii - 1][$jj][1] + $del_t_cost;
|
||||||
|
|
||||||
|
$ins_t_cost = $m[$ii][$jj - 1][0] + 1;
|
||||||
|
$ins_p_cost = $m[$ii][$jj - 1][1] + $ins_t_cost;
|
||||||
|
|
||||||
|
if ($sub_p_cost <= $del_p_cost && $sub_p_cost <= $ins_p_cost) {
|
||||||
|
$m[$ii][$jj] = array(
|
||||||
|
$sub_t_cost,
|
||||||
|
$sub_p_cost,
|
||||||
|
$sub_t);
|
||||||
|
} else if ($ins_p_cost <= $del_p_cost) {
|
||||||
|
$m[$ii][$jj] = array(
|
||||||
|
$ins_t_cost,
|
||||||
|
$ins_p_cost,
|
||||||
|
$T_I);
|
||||||
|
} else {
|
||||||
|
$m[$ii][$jj] = array(
|
||||||
|
$del_t_cost,
|
||||||
|
$del_p_cost,
|
||||||
|
$T_D);
|
||||||
|
}
|
||||||
|
} while ($jj++ < $nl);
|
||||||
|
} while ($ii++ < $ol);
|
||||||
|
|
||||||
|
$result = '';
|
||||||
|
$ii = $ol;
|
||||||
|
$jj = $nl;
|
||||||
|
do {
|
||||||
|
$r = $m[$ii][$jj][2];
|
||||||
|
$result .= $r;
|
||||||
|
switch ($r) {
|
||||||
|
case 's':
|
||||||
|
case 'x':
|
||||||
|
$ii--;
|
||||||
|
$jj--;
|
||||||
|
break;
|
||||||
|
case 'i':
|
||||||
|
$jj--;
|
||||||
|
break;
|
||||||
|
case 'd':
|
||||||
|
$ii--;
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
} while ($ii || $jj);
|
||||||
|
|
||||||
|
return $prefix.strrev($result).$suffix;
|
||||||
|
}
|
||||||
|
|
||||||
|
}
|
14
src/difference/__init__.php
Normal file
14
src/difference/__init__.php
Normal file
|
@ -0,0 +1,14 @@
|
||||||
|
<?php
|
||||||
|
/**
|
||||||
|
* This file is automatically generated. Lint this module to rebuild it.
|
||||||
|
* @generated
|
||||||
|
*/
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
|
phutil_require_module('phutil', 'filesystem');
|
||||||
|
phutil_require_module('phutil', 'filesystem/tempfile');
|
||||||
|
phutil_require_module('phutil', 'future/exec');
|
||||||
|
|
||||||
|
|
||||||
|
phutil_require_source('ArcanistDiffUtils.php');
|
Loading…
Reference in a new issue