Skip to main content

Breve introducción a la codificación de URL

Logaritmo (Abril 2025)

Logaritmo (Abril 2025)
Anonim

La URL de un sitio web, también conocida comúnmente como la "dirección del sitio web", es lo que alguien ingresaría en un navegador web para acceder a un sitio web específico. Cuando pasa información a través de una URL, debe asegurarse de que solo use caracteres permitidos específicos. Estos caracteres permitidos incluyen caracteres alfabéticos, números y algunos caracteres especiales que tienen un significado en la cadena de URL. Cualquier otro carácter que deba agregarse a una URL debe codificarse para que no cause problemas durante el viaje del navegador para localizar las páginas y los recursos que está buscando.

Codificando una URL

El carácter codificado más comúnmente en la cadena de URL es el personaje. Verá este carácter cada vez que vea un signo más (+) en una URL. Esto representa el carácter de espacio. El signo más actúa como un carácter especial que representa ese espacio en una URL. La forma más común de ver esto es en un enlace de correo electrónico que incluye un asunto. Si desea que el sujeto tenga espacios en él, puede codificarlos como ventajas:

mailto: email? asunto = este + es + mi + asunto

Este bit de codificación de texto transmitiría un tema de "este es mi tema". El carácter "+" en la codificación se reemplazaría con un real cuando se renderiza en el navegador.

Para codificar una URL, simplemente reemplace los caracteres especiales con su cadena de codificación. Esto casi siempre comenzará con un% de carácter.

Codificando una URL

En sentido estricto, siempre debe codificar cualquier carácter especial que se encuentre en una URL. Una nota importante, en caso de que se sienta un poco intimidado por toda esta conversación o codificación, es que generalmente no encontrará caracteres especiales en una URL fuera de su contexto normal, excepto con datos de formularios.

La mayoría de las URL utilizan los caracteres simples que siempre están permitidos, por lo que no se necesita ninguna codificación.

Si envía datos a scripts CGI utilizando el método GET, debe codificar los datos, ya que se enviarán a través de la URL. Por ejemplo, si está escribiendo un enlace para promocionar una fuente RSS, su URL deberá estar codificada para agregarla a la URL del script en la que lo está promocionando.

¿Qué debe ser codificado?

Cualquier carácter que no sea un carácter alfabético, un número o un carácter especial que se utilice fuera de su contexto normal deberá codificarse en su página. A continuación se muestra una tabla de caracteres comunes que se pueden encontrar en una URL y su codificación.

Codificación de URL de caracteres reservados

PersonajePropósito en la URLCodificación
:Protocolo separado (http) de la dirección% 3B
/Dominio y directorios separados% 2F
#Anclajes separados%23
?Cadena de consulta separada% 3F
&Elementos de consulta separados%24
@Nombre de usuario y contraseña separados del dominio%40
%Indica un carácter codificado%25
+Indica un espacio% 2B
No recomendado en URLs.% 20 o +

Tenga en cuenta que estos ejemplos codificados son diferentes de los que se encuentran con los caracteres especiales HTML. Por ejemplo, si necesita codificar una URL con un carácter "y" comercial, debería usar% 24, que es lo que se muestra en la tabla anterior. Si estaba escribiendo HTML y deseaba agregar un ampersand al texto, no podría usar% 24. En su lugar, utilizarías & o &, ambos de los cuales escribirían el & en la página HTML cuando se procesa. Esto puede parecer confuso al principio, pero es básicamente la diferencia entre el texto que aparece en la página, que es parte del código HTML, y la cadena de URL, que es una entidad separada y, por lo tanto, está sujeta a diferentes reglas.

El hecho de que el carácter "&", así como muchos otros caracteres, pueda aparecer en cada uno no debe confundirlo con las diferencias entre los dos.

Artículo original de Jennifer Krynin. Editado por Jeremy Girard.