Questão Como comparar as diferenças entre dois arquivos PDF no Windows?


Você conhece uma boa maneira de comparar arquivos PDF lado-a-lado e mostrar as modificações entre os dois?

Estou procurando o software do Windows para fazer isso. Seria ótimo se você pudesse postar produtos gratuitos e não gratuitos.


186


origem


Relacionado: stackoverflow.com/questions/145657/… - Epaga
Existe uma biblioteca GRATUITA para comparar pixel, pixel por pixel. Confira este blog: testautomationguru.com/… - Vinoth S


Respostas:


Experimentar WinMerge com o xdocdiff plugar. Ambos são totalmente gratuitos. Sem condições.


Alguns dos comentários abaixo sugerem que eles não vêem nenhuma diferença. Isso significa que o plug-in não está instalado corretamente. Veja como:

  1. Coloque os arquivos onde o xdocdiff O arquivo leia-me do plugin diz para colocá-los (há dois lugares; não vou listá-los aqui como nomes de arquivos podem mudar, etc. - leia o readme)

  2. No WinMerge, vá para Plugins> List e marque a caixa de seleção "Enable Plugins" (esta etapa está faltando na xdocdiff readme)

  3. No WinMerge, escolha Plugins> Automatic Unpacking (isso foi desativado antes da etapa 2)

Então, ao comparar, você verá o que parece com arquivos de texto nas janelas de comparação.


98



Tentei isso, mas não pude ver nenhuma diferença quando não estou usando o plugin xdocdiff. Existe uma opção para selecionar na interface do WinMerge? - Umber Ferrule
Qual é o objetivo de visualizar o texto binário em um PDF? Eu esperava ver as diferenças visuais como feitas por i-net PDFC. - JJD
Houve alguma maneira de fazer isso manipular quebras de coluna? Sem isso, uma mudança se transforma em várias. - Stuart
Plugins > List and tick the "Enable Plugins" checkbox era o que faltava para mim! - Seph
Muitos caracteres estão faltando nas versões de texto dos PDFs mostrados nas janelas de diferenças do WinMerge - cja


No Linux e no Windows, você pode usar diffpdf (que difere de diff-pdf mencionado neste tópico).

enter image description here

No Ubuntu, instale usando:

sudo apt-get install diffpdf

Veja mais esta página UbuntuGeek na comparação de pds textualmente ou visualmente.

Para Windows, esta versão do Diffpdf para Windows funciona muito bem. Você pode baixar de http://soft.rubypdf.com/software/diffpdf (desloque-se para baixo Versão estática do Win32).


163



Nome próprio é DiffPDF (como visto na imagem) e é baseado na biblioteca Qt 4 e Poppler, assim é portátil. Veja a página inicial do DiffPDF: qtrac.eu/diffpdf.html. Informações sobre a compilação do Windows estão aqui: soft.rubypdf.com/software/diffpdf. E suas instruções de instalação também funcionam no Debian. - przemoc
A página inicial do DiffPDF agora tem links para instalações do Linux, do Windows Installer e do Mac DMG também (qtrac.eu/diffpdf.html). - studgeek
O DiffPDF é a ferramenta mais avançada apresentada aqui, na minha opinião. Não só oferece uma boa comparação gráfica, mas também acompanha as mudanças de forma mais inteligente do que outras, por ex. o xdocdiff para o WinMerge. No entanto, tem um problema sério: limita a comparação às páginas. Isso significa que, se você tiver algum texto na página 2 do documento A, mas esse texto for movido para a página 3 no documento B, a ferramenta pensa que ele foi para A e foi adicionado em B. - caw
As versões gratuitas mais antigas podem ser encontradas Aqui - Shafik Yaghmour
Eu tentei usar isso para um romance que eu exportar para PDF. Infelizmente, a ferramenta perdeu o rastro após cerca de 10 páginas e considerou tudo como "diferente", embora as passagens grandes fossem exatamente as mesmas. - Eric J.


Eu encontrei recentemente isso e eu adoro isso.

https://github.com/vslavik/diff-pdf

Plataforma cruzada, gratuita e funciona bem.

Aqui está uma captura de tela de diff-pdf em ação - observe que o texto não é diferente no PDF, mas apenas fontes (e correspondentemente, configurações de layout):

diff-pdf.png

A chamada para obter essa imagem foi:

diff-pdf --view testA.pdf testB.pdf

... onde testA.pdf / testB.pdf são obtidos compilando este arquivo de Latex simples com pdflatex (de acordo com cada pdf, veja o comentário):

\documentclass[12pt]{article}


                        % without mathpazo: testA.pdf
\usepackage{mathpazo} % with mathpazo: testB.pdf
\usepackage{lipsum}


\title{A brand new test}
\author{Testulio}

\begin{document}

\maketitle

\lipsum[1-3]

\end{document}

36



Apenas mais uma nota sobre diff-pdf: DiffPDF é ótimo para rápida comparação lado a lado visual de texto alterado, mas é praticamente impossível depurar coisas como, digamos, pequenas alterações no espaçamento de linha - diff-pdfpor outro lado, basicamente coloca o conteúdo da página de ambos os arquivos comparados na mesma página (mas com cores diferentes) - assim problemas de espaçamento entre linhas podem ser facilmente identificados ... Cheers! - sdaau
Isso é ótimo! Existe alguma maneira de acompanhar o progresso em arquivos grandes ao enviar para um arquivo PDF (não usando a opção --view)? A opção detalhada / v não parece fazer nada. Além disso, quando você executa o comando para gerar um PDF de comparação, ele é executado em um processo separado para que ele não pause o prompt de comando como normalmente acontece quando você executa algo a partir do prompt. - LukeS
Este é o que eu precisava. Estou comparando relatórios em PDF sobre execuções numéricas, então estou procurando diferenças em um dígito em uma página inteira. O problema é que não consigo identificar os caracteres ciano, mas saber onde está a diferença é o suficiente para encontrá-lo nos relatórios originais. - manuelvigarcia


Também precisávamos comparar os PDFs em nossa empresa e não estávamos satisfeitos com nenhuma das soluções encontradas, por isso criamos as nossas próprias: i-net PDFC. Não é grátis, mas oferecemos um teste de 30 dias.

Está escrito em Java, então é multi-plataforma.

screenshot

O que o torna especial é que ele compara o conteúdo em oposição a apenas o texto (ou apenas convertendo o PDF em uma imagem e comparando a imagem). Ele também tem uma ferramenta de comparação visual agradável.


21



Bom pedaço de software. - Umber Ferrule
Eu não consegui fazer isso funcionar. Carregou os dois arquivos e clicou no botão comparar e nada acontece. - Craig Fisher
Corrige corretamente as diferenças entre páginas. Tem uma funcionalidade de exportação / impressão. Diferentes perfis de comparação (incluindo personalizados). O mouse sobre você fornece mais detalhes sobre o que mudou. Parece ótimo. Desvantagens são o julgamento / custo e não lida com movimentos. Definitivamente superior às ferramentas mais votadas IMO. - Jonathan Gawrych
@ JonathanGawrych obrigado pelas palavras amáveis! O que você quer dizer com "movimentos", exatamente? Talvez pudéssemos adicionar essa funcionalidade ... - Epaga
@Epaga Se uma seção de texto é movida de uma página para outra, ela é exibida como uma exclusão e uma adição. Por exemplo, compare propostas c ++ N4663 e N4680. Veja ao redor da página 19, um exemplo é movido do parágrafo 11 para o 8, porém é tratado como uma adição / exclusão. Para ver as diferenças reais, seria necessário detectar manualmente algo movido, depois copiar o exemplo para outra ferramenta de comparação para ver se as coisas foram adicionadas ao exemplo (unhandled_exception, return_void, etc.) - Jonathan Gawrych


Você também pode usar o Adobe Acrobat X. Ele possui uma funcionalidade de comparação de PDFs em "Exibir -> Comparar documentos".


12



Acrobat ou Acrobat Reader? o software Reader não tem isso - Jason S
O AcrobatX Pro é a única versão que possui esse recurso. O "apenas AcrobatX simples" não. - Carl Witthoft
No Acrobat 9 Pro, ele está no menu Documento. - svinto
adobe.com/products/acrobat/file-compare-two-pdf-files.html - Iman Abidi


Eu queria fazer isso (diff PDFs) recentemente com estes requisitos:

  • ignorar espaços em branco, quebras de linha, quebras de página, etc.
  • facilmente ver quando apenas algumas palavras mudaram, não apenas linhas / parágrafos inteiros.
  • saída de diferenças de cor

Eu instalei pdftotext, wdiff e colordiff, disponíveis em vários gerenciadores de pacotes. (Com macports: sudo port install poppler wdiff colordiff)

Então:

wdiff <(pdftotext old.pdf -) <(pdftotext new.pdf -) | colordiff

Agora eu posso ver quais palavras, bem coloridas, mudaram.

Mais detalhes: http://philfreo.com/blog/how-to-view-a-color-diff-of-text-from-two-pdfs/

Variação:

Usando dwdiff pode produzir resultados ligeiramente melhores.

Eu também queria a saída em HTML, então este pequeno script cria uma página web básica com um pouco de CSS.

bash pc-script.bash old.pdf new.pdf > q.htlm

Então abra q.html com o seu navegador da web.

pc-script.bash Arquivo:

#!/bin/bash

OLD="$1"
NEW="$2"

cat <<EOF
<html><head><meta charset="UTF-8"/><title>Changes from $OLD to $NEW</title></head><style>
.plus  { color: green; background: #E7E7E7;                                }
.minus { color: red;   background: #D7D7D7; text-decoration: line-through; }
</style><body><h1>Changes from [ <span class="minus">$OLD</span> ] to [ <span class="plus">$NEW</span> ]</h1><pre>
EOF

dwdiff -i -A best -P      \
  --start-delete='<span class="minus">' --stop-delete='</span>' \
  --start-insert='<span class="plus" >' --stop-insert='</span>' \
  <( pdftotext -enc UTF-8 -layout "$OLD" - )   \
  <( pdftotext -enc UTF-8 -layout "$NEW" - )   \

cat <<EOF
</pre></body></html>
EOF

Um exemplo de saída pode ser visto Aqui


8





Se você está comparando texto dentro de um pdf, então Sem comparação faz isso.

Não é livre, mas há um teste de trinta dias.


7



Sim, New > Text Compare me ajudou a ver diferenças básicas no texto entre dois arquivos PDF. - Ryan


Ótima ferramenta e fácil de usar: Compare-It v4 (de http://www.grigsoft.com/)

Compara muitos tipos diferentes de arquivos. Tem alguns conversores embutidos, incluindo um para arquivos PDF.

Eu usei isso algumas vezes com resultados satisfatórios.

Realmente deveria tentar isso. Versão de teste permite comparação por tempo ilimitado.


6



Este foi o melhor e o mais fácil de todos para mim. Obrigado! - Ankur Jain
Ferramenta mais fácil e simples que eu encontrei para usar. Eu desejo que eu poderia upvote isso mais de uma vez! - Chad
Para PDF, a comparação parece ser textual. Último lançamento em 2010. Você pode pagar por isso, mas com certeza qual é a diferença - eu não vi nenhuma limitação? - Zitrax


Não sei, mas há também comparePDF (não é grátis, mas uma tentativa de 30 dias é possível): http://www.compare-pdf.com/download.htm


2