Resumo comparativo de códigos de caracteres estendidos e latinos nos principais sistemas ou conjuntos de mapeamento e codificação de caracteres.
Márcio d'Ávila, 14 de agosto de 2004. Revisão 2, 16 de junho de 2007.Tabela comparativa do mapeamento de caracteres para os códigos de 0 a 255 (8 bits), nos conjuntos de caracteres mais comuns.
Faixa | Padrão ISO/IEC 8859-1 |
Windows-1252 (ANSI) |
IANA (MIME) ISO-8859-1 |
Unicode | ISO 646 (ASCII) |
ECS (DOS) | |
---|---|---|---|---|---|---|---|
Decimal | Hexa | ||||||
0 - 31 | 0x00 - 0x1F | não definido | caracteres de controle C0 | ||||
32 - 127 | 0x20 - 0x7F | caracteres imprimíveis mais comuns (letras, números, símbolos) | |||||
128 - 159 | 0x80 - 0x9F | não definido | caracteres estendidos | caracteres de controle C1 | não definido | caracteres estendidos |
|
160 - 255 | 0xA0 - 0xFF | caracteres latinos |
Tabela de correspondência de caracteres estendidos e latinos entre os seguintes sistemas de mapeamento/codificação de caracteres, com exemplo de cada caractere visível resultante (Chr) e seu significado: Windows-1252 (ANSI) - Faixa Estendida (códigos 128-255), Unicode, DOS - Conjunto de Caracteres Estendido (Extended Character Set - ECS), Entidades HTML (&nome;).
Os códigos 160 a 255 (0xA0 a 0xFF) coincidem com o padrão ISO/IEC 8859-1 e o conjunto de caracteres MIME para Internet ISO-8859-1 definido pela IANA. Já os códigos 128 a 159 (0x80 a 0x9F) não são definidos no padrão ISO/IEC 8859-1; na definição IANA ISO-8859-1, correspondem ao conjunto de caracteres de controle C1.
Windows-1252 (ANSI) | Unicode | ECS (DOS) |
HTML entity |
Chr | Significado | |||
---|---|---|---|---|---|---|---|---|
Dec | Hex | Dec | U+ Hex | Categoria | ||||
128 | 0x80 | 8364 | U+20AC | Currency | euro | € | símbolo do euro (União Européia) | |
129 | 0x81 | 129 | U+0081 | n/a | (não usado) | |||
130 | 0x82 | 8218 | U+201A | Punct. | sbquo | ‚ | fecha-aspa simples inferior | |
131 | 0x83 | 402 | U+0192 | Latin B | 159 | fnof | ƒ | f minúsculo com gancho (florin) |
132 | 0x84 | 8222 | U+201E | Punct. | bdquo | „ | fecha-aspa dupla inferior | |
133 | 0x85 | 8230 | U+2026 | Punct. | hellip | … | reticências | |
134 | 0x86 | 8224 | U+2020 | Punct. | dagger | † | dagger (simples) | |
135 | 0x87 | 8225 | U+2021 | Punct. | Dagger | ‡ | dagger (duplo) | |
136 | 0x88 | 710 | U+02C6 | Punct. | circ | ˆ | circunflexo | |
137 | 0x89 | 8240 | U+2030 | Punct. | permil | ‰ | por mil | |
138 | 0x8A | 352 | U+0160 | Latin A | Scaron | Š | S caron maiúsculo | |
139 | 0x8B | 8249 | U+2039 | Punct. | lsaquo | ‹ | abre-aspa angular (guillemet) simples (esquerda) | |
140 | 0x8C | 338 | U+0152 | Latin A | OElig | Œ | OE ligadura maiúsculo | |
141 | 0x8D | 141 | U+008D | n/a | (não usado) | |||
142 | 0x8E | 381 | U+017D | Latin A | Zcaron | Ž | Z caron maiúsculo | |
143 | 0x8F | 143 | U+008F | n/a | (não usado) | |||
144 | 0x90 | 144 | U+0090 | n/a | (não usado) | |||
145 | 0x91 | 8216 | U+2018 | Punct. | lsquo | ‘ | abre-aspa simples (esquerda) | |
146 | 0x92 | 8217 | U+2019 | Punct. | rsquo | ’ | fecha-aspa simples (direita) | |
147 | 0x93 | 8220 | U+201C | Punct. | ldquo | “ | abre-aspa dupla (esquerda) | |
148 | 0x94 | 8221 | U+201D | Punct. | rdquo | ” | fecha-aspa dupla (direita) | |
149 | 0x95 | 8226 | U+2022 | Punct. | bull | • | marcador redondo grande (bullet) | |
150 | 0x96 | 8211 | U+2013 | Punct. | ndash | – | travessão simples (largura "n") | |
151 | 0x97 | 8212 | U+2014 | Punct. | mdash | — | travessão duplo (largura "m") | |
152 | 0x98 | 732 | U+02DC | S.M.L. | tilde | ˜ | til | |
153 | 0x99 | 8482 | U+2122 | Letterlike | trade | ™ | marca comercial (trademark) | |
154 | 0x9A | 353 | U+0161 | Latin A | scaron | š | s caron minúsculo | |
155 | 0x9B | 8250 | U+203A | Punct. | rsaquo | › | fecha-aspa angular simples (direita) | |
156 | 0x9C | 339 | U+0153 | Latin A | oelig | œ | oe ligadura minúsculo | |
157 | 0x9D | 157 | U+009D | n/a | (não usado) | |||
158 | 0x9E | 382 | U+017E | Latin A | zcaron | ž | z caron minúsculo | |
159 | 0x9F | 376 | U+0178 | Latin A | Yuml | Ÿ | Y trema maiúsculo | |
ANSI | Unicode | ECS (DOS) |
HTML entity |
Chr | Significado | |||
Dec | Hex | Dec | U+ Hex | Categoria | ||||
160 | 0xA0 | 160 | U+00A0 | Latin | nbsp | espaço não-separável | ||
161 | 0xA1 | 161 | U+00A1 | Latin | 173 | ¡ | exclamação (!) invertida (espanhol) | |
162 | 0xA2 | 162 | U+00A2 | Latin | 189 | cent | ¢ | símbolo de centavos (cents Inglaterra) |
163 | 0xA3 | 163 | U+00A3 | Latin | 156 | pound | £ | símbolo da libra (pound Inglaterra) |
164 | 0xA4 | 164 | U+00A4 | Latin | 207 | curren | ¤ | símbolo monetário internacional |
165 | 0xA5 | 165 | U+00A5 | Latin | 190 | yen | ¥ | símbolo do yen (Japão) |
166 | 0xA6 | 166 | U+00A6 | Latin | 221 | brvbar | ¦ | barra vertical separada |
167 | 0xA7 | 167 | U+00A7 | Latin | 245 | sect | § | símbolo de seção |
168 | 0xA8 | 168 | U+00A8 | Latin | 249 | uml | ¨ | trema |
169 | 0xA9 | 169 | U+00A9 | Latin | 184 | copy | © | copyright (direito de reprodução) |
170 | 0xAA | 170 | U+00AA | Latin | 166 | ordf | ª | ordinal feminino |
171 | 0xAB | 171 | U+00AB | Latin | 174 | laquo | « | abre-aspa angular dupla (esquerda) |
172 | 0xAC | 172 | U+00AC | Latin | 170 | not | ¬ | negado (matemática) |
173 | 0xAD | 173 | U+00AD | Latin | shy | | hífen opcional | |
174 | 0xAE | 174 | U+00AE | Latin | 169 | reg | ® | marca registrada |
175 | 0xAF | 175 | U+00AF | Latin | 238 | macr | ¯ | macron |
176 | 0xB0 | 176 | U+00B0 | Latin | 248 | deg | ° | graus (círculo sobrescrito) |
177 | 0xB1 | 177 | U+00B1 | Latin | 241 | plusmn | ± | mais ou menos |
178 | 0xB2 | 178 | U+00B2 | Latin | 253 | sup2 | ² | 2 sobrescrito (ao quadrado, matemática) |
179 | 0xB3 | 179 | U+00B3 | Latin | 252 | sup3 | ³ | 3 sobrescrito (ao cubo, matemática) |
180 | 0xB4 | 180 | U+00B4 | Latin | 239 | acute | ´ | agudo |
181 | 0xB5 | 181 | U+00B5 | Latin | 230 | micro | µ | símbolo de micro (mu grego) |
182 | 0xB6 | 182 | U+00B6 | Latin | 244 | para | ¶ | símbolo de parágrafo (pilcrow) |
183 | 0xB7 | 183 | U+00B7 | Latin | middot | · | marcador redondo peq. (ponto central) | |
184 | 0xB8 | 184 | U+00B8 | Latin | 247 | cedil | ¸ | cedilha |
185 | 0xB9 | 185 | U+00B9 | Latin | 251 | sup1 | ¹ | 1 sobrescrito |
186 | 0xBA | 186 | U+00BA | Latin | 167 | ordm | º | ordinal masculino |
187 | 0xBB | 187 | U+00BB | Latin | 175 | raquo | » | fecha-aspa angular dupla (direita) |
188 | 0xBC | 188 | U+00BC | Latin | 172 | frac14 | ¼ | um-quarto (1/4) |
189 | 0xBD | 189 | U+00BD | Latin | 171 | frac12 | ½ | um-meio (1/2) |
190 | 0xBE | 190 | U+00BE | Latin | 243 | frac34 | ¾ | três-quartos (3/4) |
191 | 0xBF | 191 | U+00BF | Latin | 168 | iquest | ¿ | interrogação (?) invertida (espanhol) |
192 | 0xC0 | 192 | U+00C0 | Latin | 183 | Agrave | À | A craseado maiúsculo |
193 | 0xC1 | 193 | U+00C1 | Latin | 181 | Aacute | Á | A agudo maiúsculo |
194 | 0xC2 | 194 | U+00C2 | Latin | 182 | Acirc | Â | A circunflexo maiúsculo |
195 | 0xC3 | 195 | U+00C3 | Latin | 199 | Atilde | Ã | A til maiúsculo |
196 | 0xC4 | 196 | U+00C4 | Latin | 142 | Auml | Ä | A trema maiúsculo |
197 | 0xC5 | 197 | U+00C5 | Latin | 143 | Aring | Å | A círculo maiúsculo |
198 | 0xC6 | 198 | U+00C6 | Latin | 146 | AElig | Æ | AE ligadura maiúsculo |
199 | 0xC7 | 199 | U+00C7 | Latin | 128 | Ccedil | Ç | C cedilha maiúsculo |
200 | 0xC8 | 200 | U+00C8 | Latin | 212 | Egrave | È | E craseado maiúsculo |
201 | 0xC9 | 201 | U+00C9 | Latin | 144 | Eacute | É | E agudo maiúsculo |
202 | 0xCA | 202 | U+00CA | Latin | 210 | Ecirc | Ê | E circunflexo maiúsculo |
203 | 0xCB | 203 | U+00CB | Latin | 211 | Euml | Ë | E trema maiúsculo |
204 | 0xCC | 204 | U+00CC | Latin | 222 | Igrave | Ì | I craseado maiúsculo |
205 | 0xCD | 205 | U+00CD | Latin | 214 | Iacute | Í | I agudo maiúsculo |
206 | 0xCE | 206 | U+00CE | Latin | 215 | Icirc | Î | I circunflexo maiúsculo |
207 | 0xCF | 207 | U+00CF | Latin | 216 | Iuml | Ï | I trema maiúsculo |
208 | 0xD0 | 208 | U+00D0 | Latin | 209 | Ð | Eth maiúsculo (Islândia) | |
209 | 0xD1 | 209 | U+00D1 | Latin | 164 | Ntilde | Ñ | N til maiúsculo |
210 | 0xD2 | 210 | U+00D2 | Latin | 227 | Ograve | Ò | O craseado maiúsculo |
211 | 0xD3 | 211 | U+00D3 | Latin | 224 | Oacute | Ó | O agudo maiúsculo |
212 | 0xD4 | 212 | U+00D4 | Latin | 226 | Ocirc | Ô | O circunflexo maiúsculo |
213 | 0xD5 | 213 | U+00D5 | Latin | 229 | Otilde | Õ | O til maiúsculo |
214 | 0xD6 | 214 | U+00D6 | Latin | 153 | Ouml | Ö | O trema maiúsculo |
215 | 0xD7 | 215 | U+00D7 | Latin | 158 | times | × | símbolo de multiplicação/vezes (matemática) |
216 | 0xD8 | 216 | U+00D8 | Latin | 157 | Oslash | Ø | O cortado maiúsculo |
217 | 0xD9 | 217 | U+00D9 | Latin | 235 | Ugrave | Ù | U craseado maiúsculo |
218 | 0xDA | 218 | U+00DA | Latin | 233 | Uacute | Ú | U agudo maiúsculo |
219 | 0xDB | 219 | U+00DB | Latin | 234 | Ucirc | Û | U circunflexo maiúsculo |
220 | 0xDC | 220 | U+00DC | Latin | 154 | Uuml | Ü | U trema maiúsculo |
221 | 0xDD | 221 | U+00DD | Latin | 237 | Uacute | Ý | Y agudo maiúsculo |
222 | 0xDE | 222 | U+00DE | Latin | 232 | Þ | Thorn maiúsculo (Islândia) | |
223 | 0xDF | 223 | U+00DF | Latin | 225 | szlig | ß | s sharp (Alemanha, similar ao beta grego) |
224 | 0xE0 | 224 | U+00E0 | Latin | 133 | agrave | à | a craseado minúsculo |
225 | 0xE1 | 225 | U+00E1 | Latin | 160 | aacute | á | a agudo minúsculo |
226 | 0xE2 | 226 | U+00E2 | Latin | 131 | acirc | â | a circunflexo minúsculo |
227 | 0xE3 | 227 | U+00E3 | Latin | 198 | atilde | ã | a til minúsculo |
228 | 0xE4 | 228 | U+00E4 | Latin | 132 | auml | ä | a trema minúsculo |
229 | 0xE5 | 229 | U+00E5 | Latin | 134 | aring | å | a círculo minúsculo |
230 | 0xE6 | 230 | U+00E6 | Latin | 145 | aelig | æ | ae ligadura minúsculo |
231 | 0xE7 | 231 | U+00E7 | Latin | 135 | ccedil | ç | c cedilha minúsculo |
232 | 0xE8 | 232 | U+00E8 | Latin | 138 | egrave | è | e craseado minúsculo |
233 | 0xE9 | 233 | U+00E9 | Latin | 130 | eacute | é | e agudo minúsculo |
234 | 0xEA | 234 | U+00EA | Latin | 136 | ecirc | ê | e circunflexo minúsculo |
235 | 0xEB | 235 | U+00EB | Latin | 137 | euml | ë | e trema minúsculo |
236 | 0xEC | 236 | U+00EC | Latin | 141 | igrave | ì | i craseado minúsculo |
237 | 0xED | 237 | U+00ED | Latin | 161 | iacute | í | i agudo minúsculo |
238 | 0xEE | 238 | U+00EE | Latin | 140 | icirc | î | i circunflexo minúsculo |
239 | 0xEF | 239 | U+00EF | Latin | 139 | iuml | ï | i trema minúsculo |
240 | 0xF0 | 240 | U+00F0 | Latin | 208 | eth | ð | eth minúsculo (Islândia) |
241 | 0xF1 | 241 | U+00F1 | Latin | 163 | ntilde | ñ | n til minúsculo |
242 | 0xF2 | 242 | U+00F2 | Latin | 149 | ograve | ò | o craseado minúsculo |
243 | 0xF3 | 243 | U+00F3 | Latin | 162 | oacute | ó | o agudo minúsculo |
244 | 0xF4 | 244 | U+00F4 | Latin | 147 | ocirc | ô | o circunflexo minúsculo |
245 | 0xF5 | 245 | U+00F5 | Latin | 228 | otilde | õ | o til minúsculo |
246 | 0xF6 | 246 | U+00F6 | Latin | 148 | ouml | ö | o trema minúsculo |
247 | 0xF7 | 247 | U+00F7 | Latin | 246 | divide | ÷ | símbolo de divisão/dividido (matemática) |
248 | 0xF8 | 248 | U+00F8 | Latin | 155 | oslash | ø | o cortado minúsculo |
249 | 0xF9 | 249 | U+00F9 | Latin | 151 | ugrave | ù | u craseado minúsculo |
250 | 0xFA | 250 | U+00FA | Latin | 162 | uacute | ú | u agudo minúsculo |
251 | 0xFB | 251 | U+00FB | Latin | 150 | ucirc | û | u circunflexo minúsculo |
252 | 0xFC | 252 | U+00FC | Latin | 129 | uuml | ü | u trema minúsculo |
253 | 0xFD | 253 | U+00FD | Latin | 236 | yacute | ý | y agudo minúsculo |
254 | 0xFE | 254 | U+00FE | Latin | 231 | thorn | þ | thorn minúsculo (Islândia) |
255 | 0xFF | 255 | U+00FF | Latin | 152 | yuml | ÿ | y trema minúsculo |
Currency = Currency Symbols
Latin = Latin Basic (ISO/IEC 8859-1 "Latin 1")
Latin A = Latin Extended-A
Latin B = Latin Extended-B
Letterlike = Letterlike Symbols
Punct. = General Punctuation
S.M.L. = Spacing Modifier Letters
© 2003-2022, Márcio d'Ávila, mhavila.com.br, direitos reservados. O texto e código-fonte apresentados podem ser referenciados, distribuídos e utilizados, desde que expressamente citada esta fonte e o crédito do(s) autor(es). A informação aqui apresentada, apesar de todo o esforço para garantir sua precisão e correção, é oferecida "como está", sem quaisquer garantias explícitas ou implícitas decorrentes de sua utilização ou suas conseqüências diretas e indiretas.