Gramática léxica
Esta página descreve a gramática léxica da linguagem JavaScript. O código fonte de um script ECMAScript é lido da esquerda para direita e traduzido em uma sequência de elementos de entrada, como símbolos, caracteres de controle, finalizadores de linha, comentários ou espaços em branco. ECMAScript também define certas palavras-chave e literais e possui regras para inserção automática de ponto e vírgula ao final de declarações.
Caracteres de controle
Caracteres de controle não possuem representação visual, mas são usados para controlar a interpretação do código.
Código | Nome | Abreviação | Descrição |
---|---|---|---|
U+200C |
Zero width non-joiner | <ZWNJ> | Colocado entre caracteres para evitar que sejam visualmente ligados (fundidos) em algumas linguagens (Wikipedia). |
U+200D |
Zero width joiner | <ZWJ> | Colocado entre caracteres que podem não estar normalmente conectados, para que estes caracteres sejam renderizados com suas devidas ligações em certas linguagens (Wikipedia). |
U+FEFF |
Byte order mark | <BOM> | Usado no início do script para marcá-lo como Unicode e especificar a ordem de bytes do código (Wikipedia). |
Espaço em branco
Espaços em branco ajudam na legibilidade do código e separam os símbolos um do outro. Estes caracteres normalmente não são funcionais no código. Ferramentas de minificação podem ser usadas para remover espaços em branco do código reduzindo, assim, a quantidade de dados que precisam ser transferidos.
Código | Nome | Abreviação | Descrição | Sequência de escape |
---|---|---|---|---|
U+0009 | Character tabulation | <HT> | Tabulação horizontal | \t |
U+000B | Line tabulation | <VT> | Tabulação vertical | \v |
U+000C | Form feed | <FF> | Pular para próxima página (Wikipedia). | \f |
U+0020 | Space | <SP> | Espaço normal | |
U+00A0 | No-break space | <NBSP> | Espaço normal, sem marcar quebra de linha | |
Others | Other Unicode space characters | <USP> | Outros tipos de espaço. Veja na Wikipedia |
Finalizadores de linha
Além dos caracteres de espaço em branco, caracteres finalizadores de linha são usados para melhorar a legibilidade do código. Contudo, em alguns casos, finalizadores de linha podem influenciar a execução do código JavaScript, por isso você não poderá usá-los em alguns casos. Eles também afetam o processo automático de inserção de ponto e vírgula. Em expressões regulares os finalizadores de linha podem ser indicados com a classe \s.
Apenas os seguintes códigos Unicode são tratados como finalizadores de linha no ECMAScript, outros caracteres de quebra de linha são tratados apenas como espaço em branco (por exemplo, Next Line, NEL, U+0085 são considerados espaço em branco).
Comentários
Comentários são usados para inserir dicas, notas, sugestões ou alertas no código JavaScript. Isto pode tornar mais fácil ler ou entender o que o código faz. Também pode ser usado para desabilitar código, evitando sua execução; isto pode ser uma valiosa ferramenta na hora de debugar seu código.
JavaScript possui duas formas de inserir comentário no código.
O primeiro é com o uso de duas barras //
; isso faz com que qualquer coisa escrita a seguir, e na mesma linha, se torne comentário. Por exemplo:
function comment() {
// Isto é um comentário de uma linha em JavaScript
console.log("Hello world!");
}
comment();
A segunda forma é com o uso de /* */
, que é muito mais flexível.
Por exemplo, você pode usá-lo em uma única linha:
function comment() {
/* Isto é um comentário de uma linha em JavaScript */
console.log("Hello world!");
}
comment();
Ou pode fazer um comentário de várias linhas, desta forma:
function comment() {
/* Este é um comentário de várias linhas. Observe que
não precisamos encerrar o comentário até terminar. */
console.log("Hello world!");
}
comment();
Você também pode usá-lo no meio de uma linha, se quiser, porém isto pode tornar seu código mais difícil de ler, portanto use com cautela:
function comment(x) {
console.log("Hello " + x /* insira o valor de x */ + " !");
}
comment("world");
Além disso, você pode usá-lo para desativar algum código para evitar que seja executado, envolvendo o código em um comentário, assim:
function comment() {
/* console.log('Hello world!'); */
}
comment();
Neste caso, a função console.log()
nunca será invocada, pois está comentada. Qualquer quantidade de linhas de código podem ser desabilitadas desta forma.
Palavras-chave
Palavras-chave reservadas do ECMAScript 2015
Palavras-chave reservadas para uso futuro
As seguintes palavras-chave estão reservadas para uso futuro na especificação ECMAScript. Atualmente elas não tem funcionalidade, mas poderão ter no futuro, portanto elas também não podem ser usadas como identificadores.
Estes sempre são reservados:
enum
Os seguintes são reservados apenas quando o código está em modo estrito (strict mode):
implements
interface
let
package
private
protected
public
static
Os seguintes são reservados apenas quando são encontrados no código do módulo:
await
Palavras-chave reservadas para uso futuro em versões antigas
As seguintes palavras-chave foram reservadas para uso futuro em especificações antigas do ECMAScript (ECMAScript 1 até 3).
abstract
boolean
byte
char
double
final
float
goto
int
long
native
short
synchronized
throws
transient
volatile
Além disso, os literais null
, true
, e false
não podem ser usados como identificadores em ECMAScript.
Uso de palavras-chave reservadas
Palavras reservadas atualmente só não podem ser usadas como identificadores . Como descrito em es5.github.com/#A.1, não há problema em usar palavras reservadas desta forma.
a.import
a['import']
a = { import: 'test' }.
Por outro lado, o seguinte é ilegal por quê a palavra reservada "import" está sendo usada como identificador. Identificadores podem ser usados em declaração de expressões e funções.
function import() {} // Proibido.
Literais
Null
Veja também null
para mais informações.
null;
Booleanos
Veja também Boolean
para mais informações.
true;
false;
Números
Decimal
1234567890;
42;
// Cuidado com o uso precedido de zero:
0888; // 888 convertido como decimal
0777; // Convertido como octal, 511 em decimal
Veja que números decimais podem começar com zero (0
) seguido de outro dígito decimal, porém se todos dígitos após o zero inicial forem menores que 8, o número é interpretado como um número octal. Isso não vai disparar um erro em JavaScript, veja Erro do Firefox 957513. Veja também esta página sobre conversão de tipo parseInt()
.
Binário
Números binários em JavaScript são iniciados em zero seguido da letra "B" em maiúsculo ou minúsculo (0b
ou 0B
). Esta sintaxe é nova no ECMAScript 2015, por isso verifique a compatibilidade do navegador. Se o dígito seguinte ao 0b
não for 0 ou 1, o seguinte erro de sintaxe é disparado: "Missing binary digits after 0b".
var FLT_SIGNBIT = 0b10000000000000000000000000000000; // 2147483648
var FLT_EXPONENT = 0b01111111100000000000000000000000; // 2139095040
var FLT_MANTISSA = 0b00000000011111111111111111111111; // 8388607
Octal
Números octais em JavaScript são escritos com zero inicial seguido da letra "O" em maiúsculo ou minúsculo (0o
ou 0O)
. Esta sintaxe é nova no ECMAScript 2015, por isso verifique a compatibilidade do navegador. Se os dígitos após o 0o não forem octais válidos
(01234567), o seguinte erro de sintaxe será disparado: "Missing octal digits after 0o".
var n = 0o755; // 493
var m = 0o644; // 420
// Também é possível com apenas um zero no início (veja sobre decimais acima)
0755;
0644;
Hexadecimal
Números hexadecimais em JavaScript são iniciados com zero seguido da letra "X" em maiúsculo ou minúsculo (0x
ou 0X)
. Se os dígitos após o 0x não forem hexadecimais válidos (0123456789ABCDEF), o seguinte erro de sintaxe será disparado: "Identifier starts immediately after numeric literal".
0xfffffffffffffffff; // 295147905179352830000
0x123456789abcdef; // 81985529216486900
0xa; // 10
Objetos
Veja também Object
e Object initializer para mais informações.
var o = { a: "foo", b: "bar", c: 42 };
// Notação curta. Novidade no ES2015
var a = "foo",
b = "bar",
c = 42;
var o = { a, b, c };
// instead of
var o = { a: a, b: b, c: c };
Arrays
Veja também Array
para mais informações.
[1954, 1974, 1990, 2014];
Strings
'foo';
"bar";
Caracteres de escape em hexadecimal
"\xA9"; // "©"
Caracteres de escape em Unicode
A representação de caracteres de escape em Unicode requer ao menos quatro caracteres após o \u
.
"\u00A9"; // "©"
Codificação de caracteres Unicode
Novidade no ECMAScript 2015. Com a codificação de caracteres Unicode qualquer caractere pode ser representado usando sequência hexadecimal, desta forma podemos representar caracteres Unicode com sequência hexadecimal até 0x10FFFF
. Usando apenas Unicode, muitas vezes pode ser necessário utilizar mais de uma sequência para conseguir o mesmo resultado.
Veja também String.fromCodePoint()
ou String.prototype.codePointAt()
.
"\u{2F804}";
// O mesmo usando apenas Unicode
"\uD87E\uDC04";
Expressões regulares
Veja também RegExp
para mais informações.
/ab+c/g
// Um "espaço vazio" em expressão regular
// Para evitar confusão com comentário de linha única
// faça o seguinte:
/(?:)/
Templates
Veja também template strings para mais informações .
`texto`;
`linha de texto 1
linha de texto 2`;
`texto ${expressão} texto`;
tag`texto ${expressão} texto`;
Inserção automática de ponto e vírgula
Algumas declarações JavaScript precisam ser finalizadas com ponto e vírgula e, por isso, são afetadas pelo mecanismo automático de inserção de ponto evírgula (na silga ASI, em inglês):
- Declaração vazia
let
,const
, declaração de variávelimport
,export
, declaração module- Expressões
debugger
continue
,break
,throw
return
A especificação ECMAScript menciona três regras para inserção de ponto e vírgula.
1. Um ponto e vírgula é inserido antes, quando um finalizador de linha ou um "}" é encontrado em local não permitido pela sintaxe.
{ 1 2 } 3
// É transformado pelo ASI em
{ 1 2 ;} 3;
2. Um ponto e vírgula é inserido ao final, quando o sinal de final de linha é detectado e o conversor não é capaz de unir a linha seguinte em um único comando.
Aqui o ++ não é interpretado como operador de incremento aplicado à variável b por que há um finalizador de linha entre o b e ++
.
a = b
++c
// É transformado pelo ASI em
a = b;
++c;
3. Um ponto e vírgula é inserido ao final quando uma declaração com regra léxica restrita é encontrada seguida de um finalizador de linha. As declaraçõs sem regra específica de finalizador de linha são:
- Operadores de incremento ou decremento (
++
and--
) continue
break
return
yield
,yield*
module
return
a + b
// É transformado pelo ASI em
return;
a + b;
Especificações
Specification |
---|
ECMAScript Language Specification |
Compatibilidade com navegadores
BCD tables only load in the browser
Firefox-notas específicas
- Em versões anteriores ao Firefox 5 (JavaScript 1.8.6) palavras reservadas para uso futuro não pdem ser usadas em strict mode. Essa falha de ECMAScript foi corrigida no Firefox 5.