Znaki CJK - CJK characters

W internacjonalizacji znaki CJK są wspólnym terminem dla języków chińskiego, japońskiego i koreańskiego, z których wszystkie zawierają chińskie znaki i pochodne w swoich systemach pisma, czasami w połączeniu z innymi skryptami. Łącznie, znaki CJK często obejmują Hànzì po chińsku, Kanji i Kana po japońsku, Hanja i Hangul po koreańsku. Rzadko uwzględnia się wietnamski, tworząc skrót CJKV , ponieważ wietnamski historycznie używał również chińskich znaków, w związku z czym były one znane jako Chữ Hán i Chữ Nôm po wietnamsku.

Repertuar postaci

Standardowy chiński mandaryński i standardowy kantoński są pisane prawie wyłącznie chińskimi znakami. Do ogólnego czytania i pisania wymagane jest ponad 3000 znaków , z czego do 40 000 dla w miarę pełnego pokrycia. Japoński używa mniej znaków — ogólna znajomość języka japońskiego to 2136 znaków. Stosowanie chińskich znaków w Korei jest coraz rzadsze, chociaż idiosynkratyczne stosowanie chińskich znaków w nazwach własnych wymaga znajomości (a zatem dostępności) znacznie większej liczby znaków. Jednak nawet dzisiaj uczniowie w Korei Południowej uczą się 1800 znaków.

Inne skrypty używane w tych językach, takie jak bopomofo i oparty na łacinie pinyin dla chińskiego, hiragana i katakana dla japońskiego oraz hangul dla koreańskiego, nie są ściśle „znakami CJK”, chociaż zestawy znaków CJK prawie zawsze zawierają je jako niezbędne do pełnego pokrycie języków docelowych.

Do początku XX wieku klasyczny chiński był pisanym językiem rządów i nauki w Wietnamie. Literatura popularna w języku wietnamskim została napisana pismem chữ Nôm , składającym się z zapożyczonych chińskich znaków wraz z wieloma znakami tworzonymi lokalnie. Od lat 20. XX wieku pismo używane do zapisu literatury brzmiało łacińskie chữ Quốc ngữ .

Sinolog Carl Leban (1971) wytwarzany wczesne badania systemów kodowania CJK.

Kodowanie

Liczba znaków wymagana do pełnego pokrycia potrzeb wszystkich tych języków nie mieści się w 256-znakowej przestrzeni kodowej 8-bitowego kodowania znaków , wymagającego co najmniej 16-bitowego kodowania o stałej szerokości lub wielobajtowego kodowania o zmiennej długości. 16-bitowe kodowania o stałej szerokości, takie jak te od Unicode do wersji 2.0 włącznie, są obecnie przestarzałe ze względu na wymóg kodowania większej liczby znaków, niż może pomieścić kodowanie 16-bitowe — Unicode 5.0 ma około 70 000 znaków Han — a wymóg rządu chińskiego, aby oprogramowanie w Chinach obsługiwało zestaw znaków GB 18030 .

Chociaż kodowania CJK mają wspólne zestawy znaków, kodowania często używane do ich reprezentowania zostały opracowane oddzielnie przez różne rządy wschodnioazjatyckie i firmy programistyczne i są wzajemnie niezgodne. Unicode próbował, z pewnymi kontrowersjami, ujednolicić zestawy znaków w procesie znanym jako unifikacja Han .

Kodowanie znaków CJK powinno składać się co najmniej ze znaków Han oraz specyficznych dla danego języka skryptów fonetycznych, takich jak pinyin , bopomofo , hiragana, katakana i hangul.

Kodowania znaków CJK obejmują:

Zestawy znaków CJK zajmują większość przypisanej przestrzeni kodu Unicode . Wśród japońskich ekspertów od chińskich znaków istnieje wiele kontrowersji dotyczących celowości i technicznej wartości procesu zjednoczenia Han , używanego do mapowania wielu zestawów znaków chińskich i japońskich w jeden zestaw ujednoliconych znaków.

Wszystkie trzy języki można pisać zarówno od lewej do prawej, jak i od góry do dołu (od prawej do lewej i od góry do dołu w starożytnych dokumentach), ale podczas omawiania problemów z kodowaniem są zwykle uważane za pisma od lewej do prawej.

Status prawny

Biblioteki współpracowały nad standardami kodowania znaków JACKPHY na początku lat 80-tych. Według Kena Lunde , skrót „CJK” był zarejestrowanym znakiem towarowym z Badań Biblioteki Grupa (która połączyła się z OCLC w 2006 roku). Znak towarowy należący do OCLC w latach 1987-2009 wygasł.

Zobacz też

Bibliografia

  • Ten artykuł jest oparty na materiale zaczerpniętym z bezpłatnego słownika komputerowego on-line sprzed 1 listopada 2008 r. i włączonym na warunkach „ponownego licencjonowania” GFDL w wersji 1.3 lub nowszej.
  • DeFrancis, John . Język chiński: fakty i fantazje . Honolulu: University of Hawaii Press, 1990. ISBN  0-8248-1068-6 .
  • Hannas, dylemat ortograficzny Williama C. Asi . Honolulu: University of Hawaii Press, 1997. ISBN  0-8248-1892-X (miękka oprawa ); ISBN  0-8248-1842-3 (twarda oprawa).
  • Lemberg, Werner: Pakiet CJK dla LATEX2ε — wielojęzyczna obsługa wykraczająca poza babel. TUGboat, tom 18 (1997), nr 3 — materiały z dorocznego zgromadzenia 1997.
  • Liban, Carl. Zautomatyzowane systemy ortograficzne dla języków wschodnioazjatyckich (chiński, japoński, koreański) , najnowszy raport, przygotowany dla zarządu, Association for Asian Studies. 1971.
  • Lunde, Ken . Przetwarzanie informacji CJKV . Sebastopol, Kalifornia: O'Reilly & Associates, 1998. ISBN  1-56592-224-7 .

Zewnętrzne linki