Vamos descobrir o que é a codificação do arquivo. Em termos simples, a codificação é um conjunto de caracteres de bytes que corresponde ao alfabeto em um idioma específico. Para cada idioma, existe uma sequência específica de tais sinais de codificação. Às vezes, é necessário determinar a codificação. Considere isso para um exemplo de um documento de texto.
Um conjunto de determinadas ferramentas de software. Para começar, aplicações suficientes do tipo Palavra, KWrite, navegador Firefox e ferramentas de reconhecimento - enca.
Você pode determinar a codificação do arquivo usando o editor universal do Microsoft Word. Antes, ele precisa ser instalado a partir da embalagem Escritório. Quando o aplicativo está instalado e pode ser aberto usando o ícone na forma de um caractere W na área de trabalho, vá para a próxima etapa.
Através da barra de navegação do aplicativo, abra os itens "Arquivo" - "Abrir" um de cada vez. O mesmo pode ser feito usando uma combinação de teclado Ctrl + O.
Em seguida, na caixa de diálogo, selecione o diretório desejado e, de fato, o arquivo para leitura. Selecione com o mouse, clique no botão "abrir".
Quando um arquivo não possui um conjunto de correspondências CP1251, a aplicação tenta determinarcodificação. Uma lista de possíveis correspondências será exibida. Nos conjuntos de caracteres propostos no lado direito da lista, selecione uma das codificações. Se a escolha for feita corretamente, o texto reconhecido será exibido no elemento "amostra".
Além do préprocessador para processamento de texto, o Word, existem outros utilitários funcionais. Um deles - KWrite (um análogo para sistemas unix). Para que você não esteja confuso, anotarei os pontos "para determinar a codificação do documento em KWrite".
Navegador Mozilla Firefox, o objetivo é o mesmo - determinar a codificação
O princípio é aproximadamente igual ao dos utilitários para trabalhar com texto. Execute o navegador instalado para execução e, se não estiver instalado - faça o download do instalador do mozilla.org.
Então, na janela do programa aberto, você precisa abrirdocumento de texto através do menu "Arquivo", o submenu "Abrir arquivo". Se o arquivo selecionado for exibido sem distorção e o texto for legível, não é difícil determinar a codificação.
Para fazer isso, vá para "Exibir" - "codificação", são exibidos vários conjuntos de caracteres e um deles, oposto ao que existe um "tic", e há uma codificação definida pelo navegador.
Se o texto não for reconhecido corretamente, selecione a subseção "adicionalmente", experimente-o com codificações ou selecione o valor "auto".
Software especializado - trabalhando com enca
Há também uma série de ferramentas eletrônicas auxiliares que permitem determinar a codificação de texto não formatado.
Para aqueles que costumam trabalhar sob o Unix,utilitário enca. Ele pode ser instalado usando o serviço "Gerenciador de Pacotes". Tendo encontrado a categoria disponível de pacotes, você pode começar a instalar o software.
Para listar os idiomas de reconhecimento, execute o comando enca -list languages usando o terminal.
Se quiser definir a codificação de um arquivo de texto após a chave (g), digite seu nome e, após a opção (L), da mesma forma, digite o idioma de reconhecimento:
enca -L russo -g /home/vic/temp/myfile.txt.
Eu acredito que os utilitários acima fornecerão ao usuário um conjunto suficiente de ferramentas para decodificar documentos de texto.
Enquanto, na verdade, trata-se de como reconhecercodificação. Para fins padrão, penso, o software especificado bastante se aproximará. Existem mais métodos especializados de definição, mas sua consideração está além do escopo deste artigo.
Para o Microsoft Word, a fonte de reconhecimento pode ser texto simples ou um documento com formatação complexa.
</ p>