Kana o połowie szerokości — Half-width kana

Kana o połowie szerokości (半角カナ, Hankaku kana ) to znaki katakana wyświetlane skompresowane do połowy ich normalnej szerokości ( współczynnik proporcji 1:2 ), zamiast zwykłego kwadratu (1:1). Na przykład, zwykła (o pełnej szerokości) forma katakany ka to カ, podczas gdy forma o połowie szerokości to カ. Połowa szerokości hiragana nie jest wliczone w Unicode, chociaż jest użyteczny w sieci lub E-książki poprzez CSS „s font-feature-settings: "hwid" 1z Adobe-Japan1-6 czcionek OpenType oparte. Kanji o połowie szerokości nie nadaje się do użytku na nowoczesnych komputerach, mimo że jest używane w niektórych drukarkach paragonów, elektrycznych tablicach ogłoszeń lub starych komputerach.

Kana o połowie szerokości była używana we wczesnych dniach japońskiego informatyki, aby umożliwić wyświetlanie japońskich znaków na tej samej siatce, co czcionki o stałej szerokości znaków łacińskich. Nie użyto kanji o połowie szerokości. Znaki kana o połowie szerokości nie są obecnie powszechnie używane, ale znajdują zastosowanie w określonych ustawieniach, takich jak wyświetlacze kasowe , na paragonach sklepowych, japońskie napisy do telewizji cyfrowej i DVD oraz etykiety adresowe. Ich użycie jest czasem także wyborem stylistycznym, szczególnie częstym w niektórych slangach internetowych .

Termin „kana o połowie szerokości”, który ściśle odnosi się tylko do sposobu wyświetlania kana , a nie sposobu ich przechowywania – jest również używany luźno w odniesieniu do bloku A0-DF (szesnastkowego), w którym katakana są przechowywane w niektórych kodowaniach znaków , takich jak jako JIS X 0201 (1969) – patrz kodowanie poniżej. Jest to jednak formalnie niepoprawne – ten standard JIS po prostu określa, że ​​katakana może być przechowywana w tych lokalizacjach, bez określania sposobu ich wyświetlania; zamieszanie jest spowodowane tym, że we wczesnych obliczeniach, znaki tutaj przechowywane były w rzeczywistości wyświetlane jako kana o połowie szerokości – patrz zamieszanie poniżej.

Historia

Ten ekran LED na stacji Haiki wyświetla シーサイドライナー ( Seaside Liner ) w katakanie o połowie szerokości. Dakuten nie wydaje się być traktowane jako odrębny charakter, choć.

Kana o połowie szerokości i kana o szerokości 2/3 były używane w erze przed komputerami. We wczesnej erze komputerów ASCII jest definiowany jako 7-bitowy zestaw znaków i ma miejsce na 128 znaków. Ponieważ jednak ten standard został zaprojektowany dla Stanów Zjednoczonych , nie zawiera znaków i symboli, takich jak symbol jena (¥) potrzebnych do reprezentowania japońskiej waluty, ani nie zawiera miejsca na znaki z innych alfabetów, takich jak kana czy kanji – dlatego nie można było zakodować japońskich znaków . Co więcej, japońskie znaki, zarówno kana, jak i kanji, są rysowane na kwadratowej siatce, podczas gdy znaki łacińskie są na ogół pisane węższym – dlatego też japońskie znaki również nie mogą być wyświetlane .

JIS X 0201 został opracowany w 1969 roku, kiedy komputery generalnie nie były w stanie, zarówno pod względem projektu oprogramowania, jak i zasobów sprzętowych, przedstawić tysięcy chińskich znaków kanji używanych w języku japońskim. Jako kompromis, ta standardowa zakodowana katakana (tylko – nie hiragana ani kanji) jako mały zestaw znaków, przypisany w górnym zakresie wartości bajtów 0x80–0xFF. Umożliwiło to 8-bitowym procesorom kodowanie i przetwarzanie fonetycznie japońskiego tekstu (jako katakana), ale bez możliwości przetwarzania hiragany lub kanji. Te znaki katakana były z kolei wyświetlane jako „kana o połowie szerokości” – nowy, niekonwencjonalny, węższy format, pasujący do tej samej szerokości, co maszyny z alfabetem łacińskim o stałej szerokości, które były w stanie drukować i wyświetlać. Pod względem kodowania JIS X 0201 jest wariantowym rozszerzeniem ASCII – zawiera dodatkowe znaki i nie zgadza się dokładnie z ASCII w części nakładającej się (sekcja znaków łacińskich).

Komunikaty transakcyjne zapisane w kanapie o połowie szerokości w księdze bankowej

Kana o połowie szerokości została opracowana jako „... pierwsze japońskie znaki zakodowane na komputerach, ponieważ są one używane w japońskich telegramach”.

Nationwide Banking Data Communication System (全国銀行データ通信システム) , największy system transferu środków w Japonii, został ustanowiony w 1973 roku. Komunikaty o transakcjach między bankami mogły używać tylko łaciny, liczb i katakany o połowie szerokości w ciągu 20 znaków. System został zastąpiony przez ZEDI (The Nationwide Banking Electronic Data Interchange System) w 2018 r., który może obsługiwać hiragana i kanji ze znakami o zmiennej długości.

Aby dopasować katakanę do dozwolonego węższego obszaru komórki, poczyniono pewne kompromisy. Na przykład znaki diakrytyczne dakuten i handakuten są traktowane jako oddzielne znaki, a nie jako część znaku poprzedzającego. Ten kompromis sprawił, że wielu uważało „kanę o połówkowej szerokości” za nieatrakcyjną wizualnie i powoduje problemy dla wielu współczesnych programów komputerowych.

Pokwitowanie przy użyciu kana o połowie szerokości, aby zaoszczędzić miejsce

Innym zastosowaniem kana o połowie szerokości jest oszczędność miejsca. Japońska wersja Windows 95 używała w interfejsie użytkownika katakany MS P Gothic o połowie szerokości . Został on zastąpiony przez pełnowymiarową kana z MS UI Gothic, nieco węższą niż MS P Gothic.

Kodowanie

W specyfikacji JIS X 0201 (1969) katakana są zakodowane w bloku A0–DF (szesnastkowym) – sposób ich wyświetlania nie jest określony i nie ma oddzielnego kodowania kana o pełnej i połówkowej szerokości. W JIS X 0208 katakana, hiragana i kanji są zakodowane (i wyświetlane jako znaki o pełnej szerokości; nie ma znaków o połowie szerokości), chociaż kolejność kana jest inna — zobacz JIS X 0208#Hiragana i katakana .

W Shift JIS , który łączy JIS X 0201 i JIS X 0208, te kodowania (oba mogą kodować znaki łacińskie i katakana) są przechowywane oddzielnie, przy czym JIS X 0201 jest wyświetlany jako połówkowa szerokość (w ten sposób katakana JIS X 0201 jest wyświetlane jako kana o połowie szerokości), podczas gdy JIS X 0208 są wyświetlane w pełnej szerokości (zatem znaki łacińskie JIS X 0208 są wyświetlane jako znaki łacińskie o pełnej szerokości). Tak więc w Shift JIS znaki łacińskie i katakana mają dwa kodowania z dwoma oddzielnymi formami wyświetlania, zarówno o połowie szerokości, jak i pełnej szerokości.

W Unicode katakana i hiragana są używane głównie jako normalne znaki o pełnej szerokości (bloki Katakana i Hiragana są wyświetlane jako znaki o pełnej szerokości); oddzielny blok, blok Formularze o połowie szerokości i pełnej szerokości służy do przechowywania znaków wariantowych, w tym znaków kana o połowie szerokości i znaków łacińskich o pełnej szerokości.

Zatem katakana w JIS X 0201 i odpowiadająca jej część wyprowadzonych kodowań (część JIS X 0201 Shift JIS) są wyświetlane jako połówkowa szerokość, podczas gdy w Unicode formularze o połówkowej szerokości są określane osobno.

Stół o połowie szerokości

„J” wskazuje pierwsze cztery bity w JIS X 0201 (choć patrz poniżej , niekoniecznie oznaczają one połowę szerokości), a w innych zestawach, takich jak Shift JIS , „U” wskazuje wiersz w Unicode w bloku formularzy o połowie szerokości i pełnej szerokości .

J U 0 1 2 3 4 5 6 7 8 9 A b C D mi F
A FF6   ? ? ja ? ?
b FF7
C FF8
D FF9

Należy pamiętać, że pusta pierwsza komórka reprezentuje nieistniejący znak w JIS, A0; ale podwójny nawias o pełnej szerokości ⦆ w Unicode, U + FF60.

Kana o połowie szerokości w Internecie

E-mail

Ponieważ protokoły SMTP i NNTP (używane odpowiednio do dostarczania poczty e-mail i Usenet ) były wcześniej zdolne do przesyłania tylko 7-bitów, wówczas przyjęło się używanie ISO-2022-JP do wysyłania wiadomości e-mail w języku japońskim.

Kana o połówkowej szerokości nie jest zawarta w ISO-2022-JP: zawiera zbiór rzymski JIS X 0201 i całość JIS X 0208, ale nie zawiera zbioru katakana JIS X 0201 (który jest używany w przypadku kana o połówkowej szerokości Na przykład przesuń JIS). Oba zestawy JIS X 0201 mają kody ISO 2022, ale profil ISO-2022-JP zawiera tylko zestaw rzymski: oznacza to, że format dołączania katakany o połowie szerokości w ISO-2022-JP jest zarówno dobrze zdefiniowany, jak i narusza formatu ISO-2022-JP. Z tego powodu, jeśli kana o połowie szerokości zostanie przypadkowo dołączony do wiadomości, może zostać zniekształcony podczas transmisji (patrz mojibake ). Standard kodowania WHATWG używany przez HTML5 umożliwia dekodowanie, ale nie kodowanie, katakana JIS X 0201 w ISO-2022-JP jako rozszerzenie formatu i konwertuje katakana o połowie szerokości na ich odpowiedniki JIS X 0208 po kodowaniu.

Nie jest to już taki problem, ponieważ większość dzisiejszych serwerów pocztowych obsługuje rozszerzenie 8BITMIME, a zatem rozumie znaki 8-bitowe. Alternatywnie można użyć systemu kodowania, takiego jak Base64, i określić go w komunikacie za pomocą MIME .

strony internetowe

Problem występujący w wiadomościach e-mail nie dotyczy stron sieci Web, ponieważ protokół HTTP akceptuje znaki 8-bitowe.

Jednak jednym z istniejących problemów jest to, że programy komputerowe mają trudności z określeniem, czy traktować znak jako Shift JIS , EUC-JP lub UTF-8 – stąd informacje o kodzie znaku powinny być określone za pomocą nagłówka odpowiedzi HTTP lub metatagu .

Dezorientacja

Ściśle mówiąc, kodowanie JIS X 0201 jako „katakana o połowie szerokości” jest niepoprawne, ponieważ standard nie definiuje szerokości znaków – definiuje tylko reprezentację kodu znaków katakana. W standardzie JIS X 0201 znaki katakana są drukowane w normalnej (pełnej) szerokości, a nie w połowie szerokości.

Znaki o połowie szerokości były używane do wyświetlania tylko w okresie, gdy znaki były wyświetlane w połowie szerokości (i były używane kodowania jednobajtowe), zanim pojawiły się wyświetlacze znaków o pełnej szerokości (i powiązane kodowania dwubajtowe, takie jak JIS X 0208). rozpowszechniony. Jednak w standardzie Shift JIS, który łączy w sobie standard JIS X 0201 (którego znaki – łacina i katakana – były wyświetlane w połowie szerokości) oraz standard JIS X 0208 (którego znaki – katakana, hiragana, kanji i łacina – były wyświetlane jako pełna szerokość), znaki katakana i łacińskie są kodowane dwukrotnie, zarówno w JIS X 0201, jak i JIS 0208, ale wyświetlane jako połówkowa lub pełna szerokość w zależności od tego, w której sekcji się znajdują (0201 lub 0208) – stąd 0201 Blok katakana może być uważany za odpowiadający "kana o połowie szerokości", a nieporozumienie, że standard 0201 definiuje znaki o "połówkowej szerokości" jest szeroko rozpowszechnione.

Ponadto, chociaż JIS X 0201 jest kodowaniem jednobajtowym (i wyświetlanym na połowie szerokości), a JIS X 0208 jest kodowaniem dwubajtowym (i wyświetlanym na pełnej szerokości), nie ma związku między liczbą bajtów a szerokością ( inne niż odpowiadające w Shift JIS, jak powyżej) – na przykład Unicode może być zakodowany z czterema bajtami ( UTF-32 ), aby wyświetlać zarówno znaki o pełnej, jak i pojedynczej szerokości.

W kulturze popularnej

Postacie kana o połowie szerokości pojawiają się publicznie w trylogii Matrix , wyreżyserowanej przez Wachowskich . „Deszcz cyfrowa” składa się z lustrzanymi pół szerokości znaków kana, łacińskimi literami i cyframi arabskimi.

Zobacz też

Bibliografia

  • ^ Lunde, Ken. Przetwarzanie informacji CJKV. O'Reilly, wyd. 2, 2009,s. 224-226(również 1 ed., 1999. s. 144-145)