encodeURIComponent()

Baseline Widely available

This feature is well established and works across many devices and browser versions. It’s been available across browsers since July 2015.

La función encodeURIComponent() codifica un URI reemplazando cada instancia de ciertos caracteres por una, dos, tres o cuatro secuencias de escape que representan la codificación UTF-8 del carácter (serán cuatro secuencias de escape solo para caracteres compuestos por dos caracteres sustitutos). En comparación con encodeURI(), esta función codifica más caracteres, incluidos aquellos que son parte de la sintaxis de un URI.

Pruébalo

Sintaxis

encodeURIComponent(uriComponent)

Parámetros

uriComponent: Una cadena que se codificará como un componente de URI (una ruta, cadena de consulta, fragmento, etc.). Otros valores son convertidos a cadenas.

Valor de retorno

Una nueva cadena de caracteres que representa el uriComponent proporcionado codificado como un componente URI.

Excepciones

URIError: Se lanza si uriComponent contiene un sustituto solitario.

Descripción

encodeURIComponent() es una propiedad de tipo función del objeto global.

encodeURIComponent() usa el mismo algoritmo de codificación que se describe en encodeURI(). Escapa todos los caracteres excepto:

A–Z a–z 0–9 - _ . ! ~ * ' ( )

En comparación con encodeURI(), encodeURIComponent() escapa un conjunto más amplio de caracteres. Usa encodeURIComponent() en campos ingresados por el usuario en formularios enviados con POST al servidor, ya que esto codificará los símbolos & que podrían generarse inadvertidamente durante la entrada de datos para caracteres de referencia u otros caracteres que requieran codificación/decodificación. Por ejemplo, si un usuario escribe Jack & Jill, sin encodeURIComponent(), el símbolo & podría interpretarse en el servidor como el inicio de un nuevo campo y poner en riesgo la integridad de los datos.

Para application/x-www-form-urlencoded, los espacios deben reemplazarse por +, por lo que puede que se desee continuar una llamada a encodeURIComponent() con un reemplazo adicional de la cadena %20 por +.

Ejemplos

Codificación para encabezados Content-Disposition y Link

El siguiente ejemplo proporciona la codificación especial requerida dentro de los parámetros de los encabezados de respuesta del servidor Content-Disposition y Link con codificación UTF-8 (por ejemplo, nombres de archivos UTF-8):

const fileName = "my file(2).txt";
const header = `Content-Disposition: attachment; filename*=UTF-8''${encodeRFC5987ValueChars(
  fileName,
)}`;

console.log(header);
// "Content-Disposition: attachment; filename*=UTF-8''my%20file%282%29.txt"

function encodeRFC5987ValueChars(str) {
  return (
    encodeURIComponent(str)
      // A continuación crea las secuencias %27 %28 %29 %2A (nótese que
      // la codificación válida de "*" es %2A, lo que requiere llamar a
      // toUpperCase() para codificar correctamente). Aunque RFC3986 reserva "!",
      // RFC5987 no lo hace, por lo que no es necesario escaparlo.
      .replace(
        /['()*]/g,
        (c) => `%${c.charCodeAt(0).toString(16).toUpperCase()}`,
      )
      // Los siguientes códigos no son necesarios para el percent-encoding según el
      // RFC5987,
      // por lo que podemos permitir una mejor legibilidad en la transmisión: |`^
      .replace(/%(7C|60|5E)/g, (str, hex) =>
        String.fromCharCode(parseInt(hex, 16)),
      )
  );
}

Codificación para RFC3986

El RFC3986 más reciente reserva !, ', (, ), y *, aunque estos caracteres no tienen usos formalizados para la delimitación de un URI. La siguiente función codifica una cadena para un formato de componente de URL compatible con RFC3986. También codifica [ y ], que son parte de la sintaxis de URI IPv6. Una implementación de encodeURI compatible con RFC3986 no debería escapar estos caracteres, como se demuestra en el ejemplo de encodeURI().

function encodeRFC3986URIComponent(str) {
  return encodeURIComponent(str).replace(
    /[!'()*]/g,
    (c) => `%${c.charCodeAt(0).toString(16).toUpperCase()}`,
  );
}

Codificación de un sustituto solitario lanza

Un URIError será lanzado si se intenta codificar un sustituto que no es parte de un par alto-bajo. Por ejemplo:

// El par alto-bajo está bien
encodeURIComponent("\uD800\uDFFF"); // "%F0%90%8F%BF"

// Un código solitario de sustituto alto lanza "URIError: secuencia de URI mal formada"
encodeURIComponent("\uD800");

// Un código solitario de sustituto bajo lanza "URIError: secuencia de URI mal formada"
encodeURIComponent("\uDFFF");

Puedes usar String.prototype.toWellFormed(), que reemplaza los sustitutos solitarios con el carácter de reemplazo de Unicode (U+FFFD), para evitar este error. También puedes usar String.prototype.isWellFormed() para verificar si una cadena contiene sustitutos solitarios antes de pasarla a encodeURIComponent().

Especificaciones

Specification
ECMAScript Language Specification # sec-encodeuricomponent-uricomponent

Compatibilidad con navegadores

BCD tables only load in the browser