Blok Unicode - Unicode block
Blok Unicode jest jednym z kilku sąsiadujących zakresów numerycznych kodów znaków ( punktów kodowych ) z Unicode zbioru znaków, które są zdefiniowane przez Unicode Consortium dla celów administracyjnych i dokumentacji. Zazwyczaj propozycje, takie jak dodanie nowych glifów, są omawiane i oceniane z uwzględnieniem odpowiedniego bloku lub bloków jako całości.
Każdy blok jest ogólnie, ale nie zawsze, przeznaczony do dostarczania glifów używanych przez jeden lub więcej określonych języków lub w jakimś ogólnym obszarze zastosowań, takim jak matematyka , geodezja , skład dekoracyjny , fora społecznościowe itp.
Projektowanie i wdrażanie
Bloki Unicode są identyfikowane przez unikalne nazwy, które używają tylko znaków ASCII i zazwyczaj opisują naturę symboli, w języku angielskim ; takie jak „tybetański” lub „strzałki uzupełniające-A”. (Podczas porównywania nazw bloków należy utożsamiać wielkie litery z małymi literami i ignorować wszelkie spacje, łączniki i znaki podkreślenia; więc nazwisko jest równoważne „strzałkom_dodatkowym__a” i „DODATKOWEJ STRZAŁCE”.
Bloki są parami rozłączne , to znaczy nie nakładają się na siebie. Początkowy punkt kodowy i rozmiar (liczba punktów kodowych) każdego bloku są zawsze wielokrotnościami 16; dlatego w zapisie szesnastkowym punkt początkowy (najmniejszy) to U+ xxx 0, a punkt końcowy (największy) to U+ yyy F, gdzie xxx i yyy to trzy lub więcej cyfr szesnastkowych. (Te ograniczenia mają na celu uproszczenie wyświetlania glifów w dokumentach Unicode Consortium, jako tabel z 16 kolumnami oznaczonymi ostatnią cyfrą szesnastkową punktu kodowego.) Rozmiar bloku może wynosić od minimum 16 do maksimum 65 536 punkty kodowe.
Każdy przypisany punkt kodowy ma właściwość glifu o nazwie „Block”, której wartością jest ciąg znaków określający unikalny blok, który jest właścicielem tego punktu. Jednak blok może również zawierać nieprzypisane punkty kodowe, zwykle zarezerwowane na przyszłe dodawanie znaków, które „logicznie” powinny należeć do tego bloku. Punkty kodowe nie należące do żadnego z wymienionych bloków, np. w nieprzypisanych płaszczyznach 4–13, mają wartość block="Brak_bloku".
Inne klasyfikacje
Każdy punkt Unicode ma również właściwość o nazwie „ Ogólna kategoria ”, która próbuje opisać rolę odpowiedniego symbolu w językach lub aplikacjach, dla których został włączony do systemu. Przykładami kategorii ogólnych są „Lu” (oznaczające dużą literę), „Nd” (cyfra dziesiętna), „Pi” (interpunkcja w otwartym cudzysłowie) i „Mn” (znak bez spacji, tj. znak diakrytyczny poprzedzający glif). Podział ten jest całkowicie niezależny od bloków kodu: punkty kodowe z daną kategorią ogólną zazwyczaj obejmują wiele bloków i nie muszą być następujące po sobie, nawet w obrębie każdego bloku.
Każdy punkt kodowy ma również właściwość skryptu , określającą, dla którego systemu pisania jest przeznaczony lub czy jest przeznaczony dla wielu systemów pisania. To również jest niezależne od bloku.
W opisach systemu Unicode blok może być podzielony na bardziej szczegółowe podgrupy, takie jak „ Symbole szachowe ” w bloku „ Różne symbole ”. Te podgrupy nie są „blokami” w sensie technicznym używanym przez konsorcjum Unicode i są nazwane tylko dla wygody użytkowników.
Lista bloków
Unicode 14.0 definiuje 320 bloków:
- 164 w płaszczyźnie 0, podstawowa płaszczyzna wielojęzyczna (w tabeli poniżej: § BMP )
- 145 w płaszczyźnie 1, dodatkowa płaszczyzna wielojęzyczna ( § SMP )
- 6 w płaszczyźnie 2, Uzupełniająca Płaszczyzna Ideograficzna ( § SIP )
- 1 w płaszczyźnie 3, trzeciorzędna płaszczyzna ideograficzna ( § WSKAZÓWKA )
- 2 w płaszczyźnie 14 (E w systemie szesnastkowym ), dodatkowa płaszczyzna specjalnego przeznaczenia ( § SSP )
- Po jednym w płaszczyznach 15 ( heks F ) i 16 ( 10h ), zwanym dodatkowym obszarem prywatnego użytku-A i -B ( § PUA-A )
Samolot | Zakres bloków | Nazwa bloku | Punkty kodowe | Przypisane postacie | Skrypty |
---|---|---|---|---|---|
0 BMP | U+0000..U+007F | Łacina podstawowa | 128 | 128 | Łaciński (52 znaki), Wspólny (76 znaków) |
0 BMP | U+0080..U+00FF | Dodatek Latin-1 | 128 | 128 | Łaciński (64 znaki), Wspólny (64 znaki) |
0 BMP | U+0100..U+017F | Rozszerzony łaciński-A | 128 | 128 | łacina |
0 BMP | U+0180..U+024F | Rozszerzony łaciński-B | 208 | 208 | łacina |
0 BMP | U+0250..U+02AF | Rozszerzenia IPA | 96 | 96 | łacina |
0 BMP | U+02B0..U+02FF | Odstępy modyfikujące litery | 80 | 80 | Bopomofo (2 znaki), Latin (14 znaków), Common (64 znaki) |
0 BMP | U+0300..U+036F | Łączenie znaków diakrytycznych | 112 | 112 | Dziedziczny |
0 BMP | U+0370..U+03FF | grecki i koptyjski | 144 | 135 | Koptyjski (14 znaków), Grecki (117 znaków), Wspólny (4 znaki) |
0 BMP | U+0400..U+04FF | cyrylica | 256 | 256 | Cyrylica (254 znaki), Dziedziczona (2 znaki) |
0 BMP | U+0500..U+052F | Dodatek cyrylicy | 48 | 48 | cyrylica |
0 BMP | U+0530..U+058F | ormiański | 96 | 91 | ormiański |
0 BMP | U+0590..U+05FF | hebrajski | 112 | 88 | hebrajski |
0 BMP | U+0600..U+06FF | arabski | 256 | 256 | Arabski (238 znaków), Powszechny (6 znaków), Dziedziczony (12 znaków) |
0 BMP | U+0700..U+074F | syryjski | 80 | 77 | syryjski |
0 BMP | U+0750..U+077F | Dodatek arabski | 48 | 48 | arabski |
0 BMP | U+0780..U+07BF | Thana | 64 | 50 | Thana |
0 BMP | U+07C0..U+07FF | NKo | 64 | 62 | Nko |
0 BMP | U+0800..U+083F | Samarytanin | 64 | 61 | Samarytanin |
0 BMP | U+0840..U+085F | Mandaic | 32 | 29 | Mandaic |
0 BMP | U+0860..U+086F | Suplement syryjski | 16 | 11 | syryjski |
0 BMP | U+0870..U+089F | arabski rozszerzony-B | 48 | 41 | arabski |
0 BMP | U+08A0..U+08FF | Arabski Rozszerzony-A | 96 | 96 | Arabski (95 znaków), Wspólny (1 znak) |
0 BMP | U+0900..U+097F | dewanagari | 128 | 128 | Dewanagari (122 znaki), Wspólne (2 znaki), Dziedziczone (4 znaki) |
0 BMP | U+0980..U+09FF | bengalski | 128 | 96 | bengalski |
0 BMP | U+0A00..U+0A7F | Gurmukhi | 128 | 80 | Gurmukhi |
0 BMP | U+0A80..U+0AFF | gudżarati | 128 | 91 | gudżarati |
0 BMP | U+0B00..U+0B7F | orija | 128 | 91 | orija |
0 BMP | U+0B80..U+0BFF | Tamil | 128 | 72 | Tamil |
0 BMP | U+0C00..U+0C7F | telugu | 128 | 100 | telugu |
0 BMP | U+0C80..U+0CFF | Kannada | 128 | 90 | Kannada |
0 BMP | U+0D00..U+0D7F | malajalam | 128 | 118 | malajalam |
0 BMP | U+0D80..U+0DFF | syngaleski | 128 | 91 | syngaleski |
0 BMP | U+0E00..U+0E7F | tajski | 128 | 87 | Tajski (86 znaków), Wspólny (1 znak) |
0 BMP | U+0E80..U+0EFF | laotański | 128 | 82 | laotański |
0 BMP | U+0F00..U+0FFF | tybetański | 256 | 211 | Tybetański (207 znaków), wspólny (4 znaki) |
0 BMP | U+1000..U+109F | Myanmar | 160 | 160 | Myanmar |
0 BMP | U+10A0..U+10FF | gruziński | 96 | 88 | Gruziński (87 znaków), Zwykły (1 znak) |
0 BMP | U+1100..U+11FF | Hangul Jamo | 256 | 256 | Hangul |
0 BMP | U+1200..U+137F | Etiopski | 384 | 358 | Etiopski |
0 BMP | U+1380..U+139F | Dodatek etiopski | 32 | 26 | Etiopski |
0 BMP | U+13A0..U+13FF | Czirokez | 96 | 92 | Czirokez |
0 BMP | U+1400..U+167F | Ujednolicone sylaby kanadyjskich aborygenów | 640 | 640 | Kanadyjski Aborygen |
0 BMP | U+1680..U+169F | Ogham | 32 | 29 | Ogham |
0 BMP | U+16A0..U+16FF | Runiczny | 96 | 89 | Runiczny (86 znaków), Zwykły (3 znaki) |
0 BMP | U+1700..U+171F | tagalski | 32 | 23 | tagalski |
0 BMP | U+1720..U+173F | Hanuno | 32 | 23 | Hanunoo (21 znaków), Wspólne (2 znaki) |
0 BMP | U+1740..U+175F | Buhid | 32 | 20 | Buhid |
0 BMP | U+1760..U+177F | Tagbanowa | 32 | 18 | Tagbanowa |
0 BMP | U+1780..U+17FF | khmerski | 128 | 114 | khmerski |
0 BMP | U+1800..U+18AF | mongolski | 176 | 158 | Mongolski (155 znaków), Wspólny (3 znaki) |
0 BMP | U+18B0..U+18FF | Rozszerzone ujednolicone kanadyjskie sylaby aborygeńskie | 80 | 70 | Kanadyjski Aborygen |
0 BMP | U+1900..U+194F | Limbu | 80 | 68 | Limbu |
0 BMP | U+1950..U+197F | Tai Le | 48 | 35 | Tai Le |
0 BMP | U+1980..U+19DF | Nowy Tai Lue | 96 | 83 | Nowy Tai Lue |
0 BMP | U+19E0..U+19FF | Symbole khmerskie | 32 | 32 | khmerski |
0 BMP | U+1A00..U+1A1F | bugijski | 32 | 30 | bugijski |
0 BMP | U+1A20..U+1AAF | Tai Tham | 144 | 127 | Tai Tham |
0 BMP | U+1AB0..U+1AFF | Łączenie znaków diakrytycznych Rozszerzone | 80 | 31 | Dziedziczny |
0 BMP | U+1B00..U+1B7F | balijski | 128 | 124 | balijski |
0 BMP | U+1B80..U+1BBF | sundajski | 64 | 64 | sundajski |
0 BMP | U+1BC0..U+1BFF | Batak | 64 | 56 | Batak |
0 BMP | U+1C00..U+1C4F | Lepcha | 80 | 74 | Lepcha |
0 BMP | U+1C50..U+1C7F | Ol Chiki | 48 | 48 | Ol Chiki |
0 BMP | U+1C80..U+1C8F | Cyrylica Rozszerzona-C | 16 | 9 | cyrylica |
0 BMP | U+1C90..U+1CBF | gruziński rozszerzony | 48 | 46 | gruziński |
0 BMP | U+1CC0..U+1CCF | Dodatek sundajski | 16 | 8 | sundajski |
0 BMP | U+1CD0..U+1CFF | Rozszerzenia wedyjskie | 48 | 43 | Wspólne (16 znaków), Dziedziczone (27 znaków) |
0 BMP | U+1D00..U+1D7F | Rozszerzenia fonetyczne | 128 | 128 | Cyrylica (2 znaki), Grecka (15 znaków), Łacina (111 znaków) |
0 BMP | U+1D80..U+1DBF | Dodatek do rozszerzeń fonetycznych | 64 | 64 | Grecki (1 znak), łaciński (63 znaki) |
0 BMP | U+1DC0..U+1DFF | Łączenie dodatku do znaków diakrytycznych | 64 | 64 | Dziedziczny |
0 BMP | U+1E00..U+1EFF | Rozszerzona łacina Dodatkowe | 256 | 256 | łacina |
0 BMP | U+1F00..U+1FFF | grecki rozszerzony | 256 | 233 | grecki |
0 BMP | U+2000..U+206F | Ogólna interpunkcja | 112 | 111 | Wspólne (109 znaków), Dziedziczone (2 znaki) |
0 BMP | U+2070..U+209F | Indeksy górne i dolne | 48 | 42 | Łacina (15 znaków), Wspólna (27 znaków) |
0 BMP | U+20A0..U+20CF | Symbole walut | 48 | 33 | Pospolity |
0 BMP | U+20D0..U+20FF | Łączenie znaków diakrytycznych dla symboli | 48 | 33 | Dziedziczny |
0 BMP | U+2100..U+214F | Symbole literopodobne | 80 | 80 | Grecki (1 znak), łaciński (4 znaki), wspólny (75 znaków) |
0 BMP | U+2150..U+218F | Formularze liczbowe | 64 | 60 | Łacina (41 znaków), Wspólna (19 znaków) |
0 BMP | U+2190..U+21FF | Strzałki | 112 | 112 | Pospolity |
0 BMP | U+2200..U+22FF | Operatory matematyczne | 256 | 256 | Pospolity |
0 BMP | U+2300..U+23FF | Różne techniczne | 256 | 256 | Pospolity |
0 BMP | U+2400..U+243F | Kontroluj zdjęcia | 64 | 39 | Pospolity |
0 BMP | U+2440..U+245F | Optyczne rozpoznawanie znaków | 32 | 11 | Pospolity |
0 BMP | U+2460..U+24FF | Zamknięte alfanumeryczne | 160 | 160 | Pospolity |
0 BMP | U+2500..U+257F | Rysunek w pudełku | 128 | 128 | Pospolity |
0 BMP | U+2580..U+259F | Blokuj elementy | 32 | 32 | Pospolity |
0 BMP | U+25A0..U+25FF | Figury geometryczne | 96 | 96 | Pospolity |
0 BMP | U+2600..U+26FF | Różne symbole | 256 | 256 | Pospolity |
0 BMP | U+2700..U+27BF | Dingbaty | 192 | 192 | Pospolity |
0 BMP | U+27C0..U+27EF | Różne symbole matematyczne-A | 48 | 48 | Pospolity |
0 BMP | U+27F0..U+27FF | Dodatkowe strzałki-A | 16 | 16 | Pospolity |
0 BMP | U+2800..U+28FF | Wzory brajlowskie | 256 | 256 | Brajl |
0 BMP | U+2900..U+297F | Dodatkowe strzałki-B | 128 | 128 | Pospolity |
0 BMP | U+2980..U+29FF | Różne symbole matematyczne-B | 128 | 128 | Pospolity |
0 BMP | U+2A00..U+2AFF | Uzupełniające operatory matematyczne | 256 | 256 | Pospolity |
0 BMP | U+2B00..U+2BFF | Różne symbole i strzałki | 256 | 253 | Pospolity |
0 BMP | U+2C00..U+2C5F | głagolicy | 96 | 96 | głagolicy |
0 BMP | U+2C60..U+2C7F | Rozszerzony łaciński-C | 32 | 32 | łacina |
0 BMP | U+2C80..U+2CFF | koptyjski | 128 | 123 | koptyjski |
0 BMP | U+2D00..U+2D2F | Dodatek gruziński | 48 | 40 | gruziński |
0 BMP | U+2D30..U+2D7F | Tifinagh | 80 | 59 | Tifinagh |
0 BMP | U+2D80..U+2DDF | Rozszerzony etiopski | 96 | 79 | Etiopski |
0 BMP | U+2DE0..U+2DFF | Rozszerzona cyrylica-A | 32 | 32 | cyrylica |
0 BMP | U+2E00..U+2E7F | Dodatkowa interpunkcja | 128 | 94 | Pospolity |
0 BMP | U+2E80..U+2EFF | Dodatek do Radykałów CJK | 128 | 115 | Han |
0 BMP | U+2F00..U+2FDF | Radykałowie z Kangxi | 224 | 214 | Han |
0 BMP | U+2FF0..U+2FFF | Ideograficzny opis znaków | 16 | 12 | Pospolity |
0 BMP | U+3000..U+303F | Symbole i znaki interpunkcyjne CJK | 64 | 64 | Han (15 znaków), Hangul (2 znaki), Common (43 znaki), Dziedziczone (4 znaki) |
0 BMP | U+3040..U+309F | Hiragana | 96 | 93 | Hiragana (89 znaków), Wspólne (2 znaki), Dziedziczone (2 znaki) |
0 BMP | U+30A0..U+30FF | Katakana | 96 | 96 | Katakana (93 znaki), Wspólna (3 znaki) |
0 BMP | U+3100..U+312F | Bopomofo | 48 | 43 | Bopomofo |
0 BMP | U+3130..U+318F | Kompatybilność Hangul Jamo | 96 | 94 | Hangul |
0 BMP | U+3190..U+319F | Kanbun | 16 | 16 | Pospolity |
0 BMP | U+31A0..U+31BF | Bopomofo Rozszerzony | 32 | 32 | Bopomofo |
0 BMP | U+31C0..U+31EF | Uderzenia CJK | 48 | 36 | Pospolity |
0 BMP | U+31F0..U+31FF | Rozszerzenia fonetyczne Katakana | 16 | 16 | Katakana |
0 BMP | U+3200..U+32FF | Załączone listy i miesiące CJK | 256 | 255 | Hangul (62 znaki), Katakana (47 znaków), Common (146 znaków) |
0 BMP | U+3300..U+33FF | Kompatybilność z CJK | 256 | 256 | Katakana (88 znaków), Wspólna (168 znaków) |
0 BMP | U+3400..U+4DBF | Rozszerzenie CJK Unified Ideographs A | 6592 | 6592 | Han |
0 BMP | U+4DC0..U+4DFF | Symbole heksagramu Yijing | 64 | 64 | Pospolity |
0 BMP | U+4E00..U+9FFF | Zunifikowane ideogramy CJK | 20 992 | 20 992 | Han |
0 BMP | U+A000..U+A48F | Sylaby Yi | 1168 | 1,165 | Yi |
0 BMP | U+A490..U+A4CF | Radykałowie Yi | 64 | 55 | Yi |
0 BMP | U+A4D0..U+A4FF | Lisu | 48 | 48 | Lisu |
0 BMP | U+A500..U+A63F | Vai | 320 | 300 | Vai |
0 BMP | U+A640..U+A69F | Rozszerzona cyrylica-B | 96 | 96 | cyrylica |
0 BMP | U+A6A0..U+A6FF | Bamum | 96 | 88 | Bamum |
0 BMP | U+A700..U+A71F | Modyfikator Ton Litery | 32 | 32 | Pospolity |
0 BMP | U+A720..U+A7FF | Rozszerzony łaciński-D | 224 | 193 | Łacina (188 znaków), Wspólna (5 znaków) |
0 BMP | U+A800..U+A82F | Syloti Nagri | 48 | 45 | Syloti Nagri |
0 BMP | U+A830..U+A83F | Typowe formy liczb indyjskich | 16 | 10 | Pospolity |
0 BMP | U+A840..U+A87F | Phags-pa | 64 | 56 | Phags Pa |
0 BMP | U+A880..U+A8DF | Saurashtra | 96 | 82 | Saurashtra |
0 BMP | U+A8E0..U+A8FF | dewanagari rozszerzone | 32 | 32 | dewanagari |
0 BMP | U+A900..U+A92F | Kayah Li | 48 | 48 | Kayah Li (47 znaków), Zwykłe (1 znak) |
0 BMP | U+A930..U+A95F | Rejang | 48 | 37 | Rejang |
0 BMP | U+A960..U+A97F | Hangul Jamo Rozszerzony-A | 32 | 29 | Hangul |
0 BMP | U+A980..U+A9DF | jawajski | 96 | 91 | Jawajski (90 znaków), Zwykły (1 znak) |
0 BMP | U+A9E0..U+A9FF | Birma Rozszerzone-B | 32 | 31 | Myanmar |
0 BMP | U+AA00..U+AA5F | Czam | 96 | 83 | Czam |
0 BMP | U+AA60..U+AA7F | Rozszerzona Birma-A | 32 | 32 | Myanmar |
0 BMP | U+AA80..U+AADF | Taj Wietnam | 96 | 72 | Taj Wietnam |
0 BMP | U+AAE0..U+AAFF | Rozszerzenia Meetei Mayek | 32 | 23 | Meetei Mayek |
0 BMP | U+AB00..U+AB2F | Etiopski rozszerzony-A | 48 | 32 | Etiopski |
0 BMP | U+AB30..U+AB6F | Rozszerzony łaciński-E | 64 | 60 | Łaciński (56 znaków), Grecki (1 znak), Powszechny (3 znaki) |
0 BMP | U+AB70..U+ABBF | Dodatek Cherokee | 80 | 80 | Czirokez |
0 BMP | U+ABC0..U+ABFF | Meetei Mayek | 64 | 56 | Meetei Mayek |
0 BMP | U+AC00..U+D7AF | Sylaby Hangul | 11184 | 11172 | Hangul |
0 BMP | U+D7B0..U+D7FF | Hangul Jamo Rozszerzony-B | 80 | 72 | Hangul |
0 BMP | U+D800..U+DB7F | Wysokie Surogaty | 896 | 0 | Nieznany |
0 BMP | U+DB80..U+DBFF | Substytuty wysokiego użytku prywatnego | 128 | 0 | Nieznany |
0 BMP | U+DC00..U+DFFF | Niskie surogaty | 1024 | 0 | Nieznany |
0 BMP | U+E000..U+F8FF | Obszar prywatnego użytku | 6400 | 6400 | Nieznany |
0 BMP | U+F900..U+FAFF | Ideogramy zgodności CJK | 512 | 472 | Han |
0 BMP | U+FB00..U+FB4F | Alfabetyczne formularze prezentacji | 80 | 58 | Ormiański (5 znaków), Hebrajski (46 znaków), Łacina (7 znaków) |
0 BMP | U+FB50..U+FDFF | Arabskie formy prezentacji-A | 688 | 631 | Arabski (629 znaków), Powszechny (2 znaki) |
0 BMP | U+FE00..U+FE0F | Selektory odmian | 16 | 16 | Dziedziczny |
0 BMP | U+FE10..U+FE1F | Formy pionowe | 16 | 10 | Pospolity |
0 BMP | U+FE20..U+FE2F | Łączenie połówkowych | 16 | 16 | Cyrylica (2 znaki), Dziedziczona (14 znaków) |
0 BMP | U+FE30..U+FE4F | Formularze zgodności CJK | 32 | 32 | Pospolity |
0 BMP | U+FE50..U+FE6F | Warianty małej formy | 32 | 26 | Pospolity |
0 BMP | U+FE70..U+FEFF | Arabskie formularze prezentacyjne-B | 144 | 141 | Arabski (140 znaków), Wspólny (1 znak) |
0 BMP | U+FF00..U+FFEF | Formularze o połowie szerokości i pełnej szerokości | 240 | 225 | Hangul (52 znaki), Katakana (55 znaków), Latin (52 znaki), Common (66 znaków) |
0 BMP | U+FFF0..U+FFFF | Promocje | 16 | 5 | Pospolity |
1 SMP | U+10000..U+1007F | Sylabariusz liniowy B | 128 | 88 | Liniowy B |
1 SMP | U+10080..U+100FF | Ideogramy liniowe B | 128 | 123 | Liniowy B |
1 SMP | U+10100..U+1013F | Liczby Egejskie | 64 | 57 | Pospolity |
1 SMP | U+10140..U+1018F | Liczby starożytne greckie | 80 | 79 | grecki |
1 SMP | U+10190..U+101CF | Starożytne symbole | 64 | 14 | Grecki (1 znak), Powszechny (13 znaków) |
1 SMP | U+101D0..U+101FF | Dysk Fajstos | 48 | 46 | Wspólne (45 znaków), Dziedziczone (1 znak) |
1 SMP | U+10280..U+1029F | Lycian | 32 | 29 | Lycian |
1 SMP | U+102A0..U+102DF | Carian | 64 | 49 | Carian |
1 SMP | U+102E0..U+102FF | Koptyjskie liczby Epact | 32 | 28 | Wspólne (27 znaków), Dziedziczone (1 znak) |
1 SMP | U+10300..U+1032F | Stara kursywa | 48 | 39 | Stara kursywa |
1 SMP | U+10330..U+1034F | gotyk | 32 | 27 | gotyk |
1 SMP | U+10350..U+1037F | Stary Permik | 48 | 43 | Stary Permik |
1 SMP | U+10380..U+1039F | ugarycki | 32 | 31 | ugarycki |
1 SMP | U+103A0..U+103DF | staroperski | 64 | 50 | staroperski |
1 SMP | U+10400..U+1044F | Deseret | 80 | 80 | Deseret |
1 SMP | U+10450..U+1047F | Shavian | 48 | 48 | Shavian |
1 SMP | U+10480..U+104AF | Osmania | 48 | 40 | Osmania |
1 SMP | U+104B0..U+104FF | Osage | 80 | 72 | Osage |
1 SMP | U+10500..U+1052F | Elbasan | 48 | 40 | Elbasan |
1 SMP | U+10530..U+1056F | kaukaski albański | 64 | 53 | kaukaski albański |
1 SMP | U+10570..U+105BF | Vithkuqi | 80 | 70 | Vithkuqi |
1 SMP | U+10600..U+1077F | Liniowy A | 384 | 341 | Liniowy A |
1 SMP | U+10780..U+107BF | Łaciński rozszerzony-F | 64 | 57 | łacina |
1 SMP | U+10800..U+1083F | cypryjski sylabariusz | 64 | 55 | cypryjski |
1 SMP | U+10840..U+1085F | cesarski aramejski | 32 | 31 | cesarski aramejski |
1 SMP | U+10860..U+1087F | Palmyrene | 32 | 32 | Palmyrene |
1 SMP | U+10880..U+108AF | nabatejski | 48 | 40 | nabatejski |
1 SMP | U+108E0..U+108FF | Hatran | 32 | 26 | Hatran |
1 SMP | U+10900..U+1091F | fenicki | 32 | 29 | fenicki |
1 SMP | U+10920..U+1093F | Lidian | 32 | 27 | Lidian |
1 SMP | U+10980..U+1099F | Hieroglify meroickie | 32 | 32 | Hieroglify meroickie |
1 SMP | U+109A0..U+109FF | Kursywa meroicka | 96 | 90 | Kursywa meroicka |
1 SMP | U+10A00..U+10A5F | Kharoshthi | 96 | 68 | Kharoshthi |
1 SMP | U+10A60..U+10A7F | Stary południowoarabski | 32 | 32 | Stary południowoarabski |
1 SMP | U+10A80..U+10A9F | Old North Arabian | 32 | 32 | Old North Arabian |
1 SMP | U+10AC0..U+10AFF | manichejski | 64 | 51 | manichejski |
1 SMP | U+10B00..U+10B3F | Awestan | 64 | 61 | Awestan |
1 SMP | U+10B40..U+10B5F | Inskrypcyjny Partów | 32 | 30 | Inskrypcyjny Partów |
1 SMP | U+10B60..U+10B7F | Inskrypcyjny Pahlavi | 32 | 27 | Inskrypcyjny Pahlavi |
1 SMP | U+10B80..U+10BAF | Psałterz Pahlawi | 48 | 29 | Psałterz Pahlawi |
1 SMP | U+10C00..U+10C4F | stary turecki | 80 | 73 | stary turecki |
1 SMP | U+10C80..U+10CFF | staro-węgierski | 128 | 108 | staro-węgierski |
1 SMP | U+10D00..U+10D3F | Hanifi Rohingja | 64 | 50 | Hanifi Rohingja |
1 SMP | U+10E60..U+10E7F | Symbole liczbowe Rumi | 32 | 31 | arabski |
1 SMP | U+10E80..U+10EBF | jazydów | 64 | 47 | jazydów |
1 SMP | U+10F00..U+10F2F | Stary Sogdian | 48 | 40 | Stary Sogdian |
1 SMP | U+10F30..U+10F6F | Sogdian | 64 | 42 | Sogdian |
1 SMP | U+10F70..U+10FAF | stary ujgurski | 64 | 26 | stary ujgurski |
1 SMP | U+10FB0..U+10FDF | Choraśmian | 48 | 28 | Choraśmian |
1 SMP | U+10FE0..U+10FFF | Elimaic | 32 | 23 | Elimaic |
1 SMP | U+11000..U+1107F | brahmi | 128 | 115 | brahmi |
1 SMP | U+11080..U+110CF | Kaiti | 80 | 68 | Kaiti |
1 SMP | U+110D0..U+110FF | Sora Sompeng | 48 | 35 | Sora Sompeng |
1 SMP | U+11100..U+1114F | Czakma | 80 | 71 | Czakma |
1 SMP | U+11150..U+1117F | Mahajani | 48 | 39 | Mahajani |
1 SMP | U+11180..U+111DF | Szarada | 96 | 96 | Szarada |
1 SMP | U+111E0..U+111FF | Syngaleskie liczby archaiczne | 32 | 20 | syngaleski |
1 SMP | U+11200..U+1124F | Chojki | 80 | 62 | Chojki |
1 SMP | U+11280..U+112AF | Multani | 48 | 38 | Multani |
1 SMP | U+112B0..U+112FF | Khudawadi | 80 | 69 | Khudawadi |
1 SMP | U+11300..U+1137F | Grantha | 128 | 86 | Grantha (85 znaków), Dziedziczone (1 znak) |
1 SMP | U+11400..U+1147F | Newa | 128 | 97 | Newa |
1 SMP | U+11480..U+114DF | Tirhuta | 96 | 82 | Tirhuta |
1 SMP | U+11580..U+115FF | Siddham | 128 | 92 | Siddham |
1 SMP | U+11600..U+1165F | Modi | 96 | 79 | Modi |
1 SMP | U+11660..U+1167F | Dodatek mongolski | 32 | 13 | mongolski |
1 SMP | U+11680..U+116CF | Takri | 80 | 68 | Takri |
1 SMP | U+11700..U+1174F | Ahom | 80 | 65 | Ahom |
1 SMP | U+11800..U+1184F | Dogra | 80 | 60 | Dogra |
1 SMP | U+118A0..U+118FF | Warang Citi | 96 | 84 | Warang Citi |
1 SMP | U+11900..U+1195F | Nurkowanie Akuru | 96 | 72 | Nurkowanie Akuru |
1 SMP | U+119A0..U+119FF | Nandinagari | 96 | 65 | Nandinagari |
1 SMP | U+11A00..U+11A4F | Plac Zanabazar | 80 | 72 | Plac Zanabazar |
1 SMP | U+11A50..U+11AAF | Sojombo | 96 | 83 | Sojombo |
1 SMP | U+11AB0..U+11ABF | Ujednolicone sylaby kanadyjskich aborygenów Rozszerzone-A | 16 | 16 | Kanadyjski Aborygen |
1 SMP | U+11AC0..U+11AFF | Pau Cin Hau | 64 | 57 | Pau Cin Hau |
1 SMP | U+11C00..U+11C6F | Bhaiksuki | 112 | 97 | Bhaiksuki |
1 SMP | U+11C70..U+11CBF | Marchen | 80 | 68 | Marchen |
1 SMP | U+11D00..U+11D5F | Masaram Gondi | 96 | 75 | Masaram Gondi |
1 SMP | U+11D60..U+11DAF | Gunjala Gondi | 80 | 63 | Gunjala Gondi |
1 SMP | U+11EE0..U+11EFF | Makasar | 32 | 25 | Makasar |
1 SMP | U+11FB0..U+11FBF | Suplement Lisu | 16 | 1 | Lisu |
1 SMP | U+11FC0..U+11FFF | Suplement tamilski | 64 | 51 | Tamil |
1 SMP | U+12000..U+123FF | Klinowy | 1024 | 922 | Klinowy |
1 SMP | U+12400..U+1247F | Cyfry klinowe i interpunkcja | 128 | 116 | Klinowy |
1 SMP | U+12480..U+1254F | Wczesnodynastyczny pismem klinowym | 208 | 196 | Klinowy |
1 SMP | U+12F90..U+12FFF | Cypro-Minoan | 112 | 99 | cypryjski minojski |
1 SMP | U+13000..U+1342F | Hieroglify egipskie | 1,072 | 1,071 | Hieroglify egipskie |
1 SMP | U+13430..U+1343F | Egipskie kontrolki formatu hieroglifów | 16 | 9 | Hieroglify egipskie |
1 SMP | U+14400..U+1467F | Hieroglify Anatolii | 640 | 583 | Hieroglify Anatolii |
1 SMP | U+16800..U+16A3F | Suplement Bamum | 576 | 569 | Bamum |
1 SMP | U+16A40..U+16A6F | Mro | 48 | 43 | Mro |
1 SMP | U+16A70..U+16ACF | Tangsa | 96 | 89 | Tangsa |
1 SMP | U+16AD0..U+16AFF | Bassa Wah | 48 | 36 | Bassa Wah |
1 SMP | U+16B00..U+16B8F | Pahawh Hmong | 144 | 127 | Pahawh Hmong |
1 SMP | U+16E40..U+16E9F | Medefaidrin | 96 | 91 | Medefaidrin |
1 SMP | U+16F00..U+16F9F | Miao | 160 | 149 | Miao |
1 SMP | U+16FE0..U+16FFF | Symbole ideograficzne i interpunkcja | 32 | 7 | Han (4 znaki), Khitan Small Script (1 znak), Nushu (1 znak), Tangut (1 znak) |
1 SMP | U+17000..U+187FF | Tangut | 6144 | 6136 | Tangut |
1 SMP | U+18800..U+18AFF | Komponenty Tangut | 768 | 768 | Tangut |
1 SMP | U+18B00..U+18CFF | Mały skrypt khitański | 512 | 470 | Mały skrypt khitański |
1 SMP | U+18D00..U+18D7F | Suplement Tangut | 128 | 9 | Tangut |
1 SMP | U+1AFF0..U+1AFFF | Kana Rozszerzone-B | 16 | 13 | Katakana |
1 SMP | U+1B000..U+1B0FF | Suplement Kana | 256 | 256 | Hiragana (255 znaków), Katakana (1 znak) |
1 SMP | U+1B100..U+1B12F | Kana Rozszerzone-A | 48 | 35 | Hiragana (32 znaki), Katakana (3 znaki) |
1 SMP | U+1B130..U+1B16F | Małe rozszerzenie Kana | 64 | 7 | Hiragana (3 znaki), Katakana (4 znaki) |
1 SMP | U+1B170..U+1B2FF | Nushu | 400 | 396 | Nüshu |
1 SMP | U+1BC00..U+1BC9F | Duployan | 160 | 143 | Duployan |
1 SMP | U+1BCA0..U+1BCAF | Kontrolki formatu skróconego | 16 | 4 | Pospolity |
1 SMP | U+1CF00..U+1CFCF | Notacja muzyczna Znamenny | 208 | 185 | Wspólne (116 znaków), Dziedziczone (69 znaków) |
1 SMP | U+1D000..U+1D0FF | Bizantyjskie symbole muzyczne | 256 | 246 | Pospolity |
1 SMP | U+1D100..U+1D1FF | Symbole muzyczne | 256 | 233 | Wspólne (211 znaków), Dziedziczone (22 znaki) |
1 SMP | U+1D200..U+1D24F | Starożytna grecka notacja muzyczna | 80 | 70 | grecki |
1 SMP | U+1D2E0..U+1D2FF | Cyfry Majów | 32 | 20 | Pospolity |
1 SMP | U+1D300..U+1D35F | Symbole Tai Xuan Jing | 96 | 87 | Pospolity |
1 SMP | U+1D360..U+1D37F | Liczby liczące pręty | 32 | 25 | Pospolity |
1 SMP | U+1D400..U+1D7FF | Matematyczne symbole alfanumeryczne | 1024 | 996 | Pospolity |
1 SMP | U+1D800..U+1DAAF | Sutton znakPisanie | 688 | 672 | ZnakPisanie |
1 SMP | U+1DF00..U+1DFFF | Łaciński rozszerzony-G | 256 | 31 | łacina |
1 SMP | U+1E000..U+1E02F | Suplement głagolicy | 48 | 38 | głagolicy |
1 SMP | U+1E100..U+1E14F | Nyiakeng Puachue Hmong | 80 | 71 | Nyiakeng Puachue Hmong |
1 SMP | U+1E290..U+1E2BF | Toto | 48 | 31 | Toto |
1 SMP | U+1E2C0..U+1E2FF | Wancho | 64 | 59 | Wancho |
1 SMP | U+1E7E0..U+1E7FF | Etiopski rozszerzony-B | 32 | 28 | Etiopski |
1 SMP | U+1E800..U+1E8DF | Mende Kikakui | 224 | 213 | Mende Kikakui |
1 SMP | U+1E900..U+1E95F | Adlam | 96 | 88 | Adlam |
1 SMP | U+1EC70..U+1ECBF | Indyjskie liczby Siyaq | 80 | 68 | Pospolity |
1 SMP | U+1ED00..U+1ED4F | Osmańskie liczby Siyaq | 80 | 61 | Pospolity |
1 SMP | U+1EE00..U+1EEFF | Arabskie symbole matematyczne alfabetyczne | 256 | 143 | arabski |
1 SMP | U+1F000..U+1F02F | Płytki Mahjong | 48 | 44 | Pospolity |
1 SMP | U+1F030..U+1F09F | Płytki domina | 112 | 100 | Pospolity |
1 SMP | U+1F0A0..U+1F0FF | Grać w karty | 96 | 82 | Pospolity |
1 SMP | U+1F100..U+1F1FF | Załączony suplement alfanumeryczny | 256 | 200 | Pospolity |
1 SMP | U+1F200..U+1F2FF | Załączony suplement ideograficzny | 256 | 64 | Hiragana (1 znak), Wspólny (63 znaki) |
1 SMP | U+1F300..U+1F5FF | Różne symbole i piktogramy | 768 | 768 | Pospolity |
1 SMP | U+1F600..U+1F64F | Emotikony | 80 | 80 | Pospolity |
1 SMP | U+1F650..U+1F67F | Ozdobne Dingbaty | 48 | 48 | Pospolity |
1 SMP | U+1F680..U+1F6FF | Symbole transportu i mapy | 128 | 117 | Pospolity |
1 SMP | U+1F700..U+1F77F | Symbole alchemiczne | 128 | 116 | Pospolity |
1 SMP | U+1F780..U+1F7FF | Rozszerzone kształty geometryczne | 128 | 102 | Pospolity |
1 SMP | U+1F800..U+1F8FF | Dodatkowe strzałki-C | 256 | 150 | Pospolity |
1 SMP | U+1F900..U+1F9FF | Dodatkowe symbole i piktogramy | 256 | 256 | Pospolity |
1 SMP | U+1FA00..U+1FA6F | Symbole szachowe | 112 | 98 | Pospolity |
1 SMP | U+1FA70..U+1FAFF | Symbole i piktogramy rozszerzone-A | 144 | 88 | Pospolity |
1 SMP | U+1FB00..U+1FBFF | Symbole dla starszych komputerów | 256 | 212 | Pospolity |
2 SIP | U+20000..U+2A6DF | Rozszerzenie CJK Unified Ideographs B | 42 720 | 42 720 | Han |
2 SIP | U+2A700..U+2B73F | CJK Unified Ideographs Rozszerzenie C | 4160 | 4153 | Han |
2 SIP | U+2B740..U+2B81F | CJK Unified Ideographs Rozszerzenie D | 224 | 222 | Han |
2 SIP | U+2B820..U+2CEAF | Rozszerzenie CJK Unified Ideographs E | 5776 | 5762 | Han |
2 SIP | U+2CEB0..U+2EBEF | Rozszerzenie CJK Unified Ideographs F | 7488 | 7473 | Han |
2 SIP | U+2F800..U+2FA1F | Dodatek Ideogramy zgodności CJK | 544 | 542 | Han |
3 WSKAZÓWKA | U+30000..U+3134F | Rozszerzenie CJK Unified Ideographs G | 4944 | 4939 | Han |
14 SSP | U+E0000..U+E007F | Tagi | 128 | 97 | Pospolity |
14 SSP | U+E0100..U+E01EF | Dodatek dotyczący selektorów odmian | 240 | 240 | Dziedziczny |
15 PUA-A | U+F0000..U+FFFFFF | Dodatkowy obszar prywatnego użytku-A | 65 536 | 65 534 | Nieznany |
16 PUA-B | U+10000..U+10FFFF | Dodatkowy obszar prywatnego użytku-B | 65 536 | 65 534 | Nieznany |
Usunięte bloki
Polityka stabilności Unicode wymaga, aby po przypisaniu znak nie mógł zostać przeniesiony ani usunięty, chociaż może być przestarzały. Dotyczy to Unicode 2.0 i wszystkich kolejnych wersji.
Wcześniej usunięto następujące dawne bloki:
Zakres bloków | Nazwa bloku | Zasięg jest teraz zajęty przez | Zastąpione przez blok | Punkty kodowe | Przypisane postacie | Skrypty |
---|---|---|---|---|---|---|
U+1000..U+105F | tybetański | Myanmar | tybetański | 96 | 71 | tybetański |
U+3400..U+3D2D | Hangul | Rozszerzenie CJK Unified Ideographs A | Sylaby Hangul | 2350 | 2350 | Hangul |
U+3D2E..U+44B7 | Hangul uzupełniający-A | Rozszerzenie CJK Unified Ideographs A | 1930 | 1930 | Hangul | |
U+44B8..U+4DFF | Hangul uzupełniający-B | Rozszerzenie CJK Unified Ideographs A | 2376 | 2376 | Hangul | |
Symbole heksagramu Yijing |
Bibliografia
Zewnętrzne linki
- Oficjalna strona internetowa Konsorcjum Unicode (w języku angielskim)