Texto é o meio dominante para a apresentação de informação baseada em computador.
Padrões de Codificação de Caracteres consistem em tabelas com grupos de bits que representam determinados caracteres.
Formas de representação:
A tabela ASCII utiliza conjuntos de 7 bits para representar 128 caracteres, muito deles adequados apenas à língua inglesa, por ter sido desenvolvida nos Estados Unidos.
A ISO (Internacional Standard Organization) adotou o código ASCII como norma internacional, com a designação ISO 646, e ampliou-o, passando a incluir um conjunto de carateres de outros idiomas. Para conseguir esta ampliação, tiveram de ser utilizados conjuntos de 8 bits (1 byte), permitindo representar 256 carateres (28 carateres), ou seja, aos 128 carateres iniciais foram acrescentados mais 128.
Unicode
Os códigos disponibilizados pela Unicode permitem representar conjuntos até 4 bytes (32 bits) para codificar caracteres utilizados pelos idiomas modernos e as formas clássicas de alguns idiomas.
Codificam, entre outros, caracteres acentuados, símbolos de pontuação, símbolos técnicos e matemáticos e outros símbolos gráficos também conhecidos por dingbats (por exemplo, estrelas e outras formas).
Bibliografia: Apontamentos da Aula
Sem comentários:
Enviar um comentário