Студопедия
rus | ua | other

Home Random lecture






Unicode (2-х байтовая кодировка) – для одновременного существования нескольких языков


Date: 2015-10-07; view: 433.


Таблица кодировки Windows-1251 (синоним CP1251)

Нижняя часть таблицы кодировки (латиница) полностью соответствует кодировке ASCII. Числа под буквами обозначают 16-ричный код подходящего символа в Юникоде.

  .0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8. Ђ 402 Ѓ 403 ‚ 201A ѓ 453 „ 201E … 2026 † 2020 ‡ 2021 ? 20AC ‰ 2030 Љ 409 ‹ 2039 Њ 40A Ќ 40C Ћ 40B Џ 40F
9. ђ 452 ‘ 2018 ' 2019 “ 201C ” 201D • 2022 – 2013 — 2014   ™ 2122 љ 459 › 203A њ 45A ќ 45C ћ 45B џ 45F
A. A0 Ў 40E ў 45E Ј 408 ¤ A4 Ґ 490 ¦ A6 § A7 Ё 401 © A9 Є 404 « AB AC ­ AD ® AE Ї 407
B. ° B0 ± B1 І 406 і 456 ґ 491 µ B5 ¶ B6 · B7 ё 451 № 2116 є 454 » BB ј 458 Ѕ 405 ѕ 455 ї 457
C. А 410 Б 411 В 412 Г 413 Д 414 Е 415 Ж 416 З 417 И 418 Й 419 К 41A Л 41B М 41C Н 41D О 41E П 41F
D. Р 420 С 421 Т 422 У 423 Ф 424 Х 425 Ц 426 Ч 427 Ш 428 Щ 429 Ъ 42A Ы 42B Ь 42C Э 42D Ю 42E Я 42F
E. а 430 б 431 в 432 г 433 д 434 е 435 ж 436 з 437 и 438 й 439 к 43A л 43B м 43C н 43D о 43E п 43F
F. р 440 с 441 т 442 у 443 ф 444 х 445 ц 446 ч 447 ш 448 щ 449 ъ 44A ы 44B ь 44C э 44D ю 44E я 44F

 

Юнико́д[1] или Унико́д[2] (англ. Unicode) — стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков.

Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода». Применение этого стандарта позволяет закодировать очень большое число символов из разных письменностей: в документах Unicode могут соседствовать китайские иероглифы, математические символы, буквы греческого алфавита, латиницы и кириллицы, при этом становится ненужным переключение кодовых страниц.

Стандарт состоит из двух основных разделов: универсальный набор символов (англ. UCS, universal character set) и семейство кодировок (англ. UTF, Unicode transformation format). Универсальный набор символов задаёт однозначное соответствие символов кодам — элементам кодового пространства, представляющим неотрицательные целые числа. Семейство кодировок определяет машинное представление последовательности кодов UCS.

Коды в стандарте Юникод разделены на несколько областей. Область с кодами от U+0000 до U+007F содержит символы набора ASCII с соответствующими кодами. Далее расположены области знаков различных письменностей, знаки пунктуации и технические символы. Часть кодов зарезервирована для использования в будущем.

Под символы кириллицы выделены области знаков с кодами от U+0400 до U+052F, от U+2DE0 до U+2DFF, от U+A640 до U+A69F .


<== previous lecture | next lecture ==>
Windows-1251 | Предпосылки создания и развитие Юникода
lektsiopedia.org - 2013 год. | Page generation: 0.003 s.