Questão Como posso determinar o tipo de arquivo sem uma extensão no Windows?


Às vezes, recebo arquivos de meus clientes que possuem a extensão de arquivo incorreta. Por exemplo, o nome é image.jpg mas o arquivo é na verdade uma imagem TIFF. Em muitos casos, posso esclarecê-lo abrindo o arquivo em um editor de texto, observando os primeiros bytes e depois deduzindo qual tipo de arquivo ele é.

Isso funciona para mim com arquivos JPEG, TIFF, GIF e PDF. No entanto, existem muitos outros tipos de arquivos por aí.

É possível automatizar a identificação do tipo de arquivo correto, analisando os dados contidos?


145


origem


Para os interessados ​​a file comando faz isso em máquinas * nix. - boehj
Pergunta muito legal! Algo que eu secretamente queria todo esse tempo, mas sempre me esqueci de perguntar :) - pepoluan
Eu não entendo porque esta questão é off-topic (após 3 anos). Eu não peço por um software específico (eu reformulei minha pergunta para sublinhar isso). Eu só peço uma solução. - Martin
Eu não entendo porque 26 pessoas pensam que o comentário relacionado a boehj * nix acima "adiciona algo útil ao post". Esta questão está marcada windows, mas o comentário implica: "Você não pode fazer isso no Windows, você deve usar * nix em vez disso". Assim? O comentário é dirigido "para os interessados". Em quê? Alterar o computador? :( - Aacini
@Aacini útil para pessoas * nix que vêm aqui do google. - jingyu9575


Respostas:


Você pode usar o Trid ferramenta que tem uma biblioteca crescente de definições de tipo de arquivo para identificar arquivos com.

Screenshot

Os curingas são suportados, por isso, no seu exemplo, pode colocar todas as imagens para serem examinadas numa pasta, por ex. C: \ verifyimages - então você pode usar o comando:

trid C:\verifyimages\*

Isso examinará todos os arquivos no verifyimages pasta.


Há também uma versão GUI disponível, TrIDNet:

Screenshot

Há documentação disponível sobre como você pode integrar facilmente o TrID ou o TrIDNet no Windows Explorer e no Total Commander:

explorador de janelas

Comando total


137



Observe que ele indica que não está licenciado para uso comercial, somente para uso pessoal - Chris Magnuson
Eu tive alguns problemas para descobrir quais arquivos de download eram necessários para usar este programa. Então este comentário é para ajudar nisso. Você precisará baixar dois arquivos. Primeiro, o utilitário de linha de comando ou o utilitário GUI. Segundo, uma pasta de definições XML chamada "TrID XML defs". Coloque os arquivos XML de definição no mesmo diretório que o TrID. Em seguida, digitalize as definições. Finalmente você pode começar a usá-lo. - mrtsherman


Arquivo

Arquivo testa cada argumento em uma tentativa de classificá-lo. Existem três conjuntos de testes, executados nesta ordem: testes de sistema de arquivos, testes de números mágicos e testes de idioma. o primeiro teste que obtém êxito faz com que o tipo de arquivo seja impresso.

O tipo impresso geralmente contém uma das palavras texto (o arquivo contém apenas caracteres de impressão e alguns caracteres de controle comuns e provavelmente é seguro ler em um terminal ASCII), executável (o arquivo contém o resultado da compilação de um programa em um formato compreensível para algum kernel UNIX ou outro), ou dados significa qualquer outra coisa (os dados geralmente são “binários” ou não imprimíveis). As exceções são formatos de arquivos conhecidos (arquivos principais, arquivos tar) que são conhecidos por conter dados binários.


48



file é padrão, mas em sistemas mais antigos (especialmente não-Linux) não muito bem informados. Para o Ubuntu etc, ele deve ser bastante respeitável e até mesmo instalado como padrão. - Thorbjørn Ravn Andersen
@Anm_LA, não é padrão no Windows, mas o link na resposta é para uma porta da versão GNU do file para o Windows. Se outros comandos * nix forem interessantes para você como usuário do Windows, esse site para encontrar todos os tipos de pedras preciosas. - RBerteig
Eu duvido muito disso file é um especialista em arquivos feitos por aplicativos do Windows. - Robin Green
@ Robin: Você é bem-vindo para testá-lo. - Ignacio Vazquez-Abrams
@ Robin: duvido muito que você tenha usado file em tudo, e ainda assim você quase se decidiu sobre sua eficácia. - tzot


Eu costumava trabalhar para a Biblioteca Nacional Francesa, para construir um sistema de arquivo digital que contém não apenas livros digitalizados, mas também milhões de artefatos digitais com todos os tipos de arquivos estranhos. Nós costumavamos JHOVE para reconhecer formatos de arquivo.

JHOVE é open source, é mantido pela JSTOR e pela Harvard University Library. É bastante simples usar.


12



legal! mas reconhece formatos proprietários como o TrID? de qualquer maneira, eu Faz tem alguns usos para identificar subformações / variantes de formatos não-proprietários (ou, para ser preciso, 'extensões' proprietárias para formatos padronizados), então isso seria útil. obrigado pelo heads-up! - pepoluan


eu uso Bibliotecas OutsideIn da Oracle nos meus programas. Não é grátis, mas funcionam bem, especialmente para imagens. O mercado fala que suporta mais de 500 tipos de arquivos.


1





Você pode verificar o tipo de arquivo de qualquer computador, incluindo o Windows

http://www.checkfiletype.com


0



Bem-vindo ao superusuário! Por favor leia como recomendar software em respostas, particularmente os bits em negrito; em seguida, edite sua resposta para seguir as diretrizes lá. Isso se aplica mesmo que você esteja recomendando um site! Felicidades - bertieb