Cistos ovarianos | Perguntas e Respostas com o Dr. Wang

Um artigo no Wall Street Journal (wsj.com) exibe o código de caractere especial HTML em vez do caractere real, o sinal de maior que. Assim, em vez de exibir >, o artigo exibe >. Isso ocorre (para mim, pelo menos) no Chrome, Firefox e Safari (todas as versões mais recentes com cache limpo).

Meu (limitado) entendimento é que os sites devem ter o seguinte código no cabeçalho:

<meta http-equiv='content-type' content='text/html;charset=utf-8' /> [α] 

o wsj.com o site tem este código no cabeçalho: <meta charset='UTF-8'>. É esta a causa do problema? Em outras palavras, se o site do WSJ tivesse <meta http-equiv='content-type' content='text/html;charset=utf-8' /> no cabeçalho, veríamos > ao invés de >?

O artigo do Wall Street Journal é:

  • Stern, Joanna. "Análise do iOS 14: seu iPhone terá uma aparência completamente diferente agora, se você quiser." Wall Street Journal (16 de setembro de 2020).

O artigo provavelmente está protegido por um firewall, então aqui está uma imagem da frase como aparece no artigo:

TIA,

Marca

Nota de rodapé α. Kyrnin, Jennifer."Como usar caracteres especiais em HTML." Lifewire (20 de fevereiro de 2020).

  • O Wall Street Journal corrigiu o artigo cerca de uma hora depois de eu postar minha pergunta. Digo "mais ou menos" porque agora lê "Configurações, depois Geral e depois Atualização de software", em vez de corrigir o problema de HTML.

Assim, em vez de exibir>, o artigo exibe>. Isso ocorre (para mim, pelo menos) no Chrome, Firefox e Safari (todas as versões mais recentes com cache limpo).

Provavelmente é um erro de software onde > foi transformado em > então isso foi transformado em > por algum tipo de codificação duplicada. Você pode usar "Control-U" para visualizar o código-fonte HTML da página e verificá-lo.

O site wsj.com possui este código no cabeçalho:. É esta a causa do problema?

Não, isso é padrão agora.

https://www.w3schools.com/tags/att_meta_charset.asp

Existem cinco caracteres que devem ser escapados como entidades em documentos HTML, não importa qual conjunto de caracteres seu site usa:

  • < Como <
  • > Como >
  • & Como &
  • ' Como '
  • ' Como '

Outros personagens especiais sempre pode ser escapado com entidades, mas só precisa ser se você estiver usando um conjunto de caracteres que não os contenha. Se você estiver usando UTF-8 como seu conjunto de caracteres, você precisa escapar os cinco caracteres acima e não os caracteres internacionais. Alguns conjuntos de caracteres têm um conjunto limitado de caracteres disponíveis e exigem que caracteres fora do conjunto sejam escapados com entidades. Por exemplo, se você usar ISO-8859-1 você teria que escapar da letra grega Phi como φ Considerando que se você estivesse usando UTF-8 você pode apenas incluir o caractere para ele: Φ.

Se você ver um > no texto de uma página da web, isso é uma indicação de que houve dois escapes. Se você só escapar > sai como > no código-fonte que é exibido como >. Se você escapar duas vezes, sairá como > no código-fonte que é exibido como >. Para corrigir o problema, o Wall Street Journal precisaria corrigir o número de vezes que eles estão escapando do texto, em vez de ajustar o conjunto de caracteres que estão usando.

funcionou para você: Charles Robertson | Quer entrar em contato conosco?