polska ortografia - Polish orthography
Ortografia polska to system zapisu języka polskiego . Język pisany jest alfabetem polskim, który wywodzi się z alfabetu łacińskiego , ale zawiera dodatkowe litery ze znakami diakrytycznymi . Ortografia jest w większości fonetyczna, a raczej fonemiczna – pisane litery (lub ich kombinacje) odpowiadają w spójny sposób dźwiękom, a raczej fonemom mówionej polszczyzny. Szczegółowe informacje o systemie fonemów można znaleźć w fonologii polskiej .
alfabet polski
Znaki diakrytyczne używane w alfabecie polskim to kreska (graficznie podobna do akcentu ostrego ) w literach ć, ń, ó, ś, ź ; kreska ukośna ( udar mózgu ) w literę Ł ; kropka ( overdot ) w literę ż ; i ogonek ("ogonek") literami ą, ę . W alfabecie polskim są 32 litery (lub 35 liter, jeśli uwzględnimy litery obce q, v, x ): 9 samogłosek i 23 (lub 26) spółgłosek .
Formy Majuscule (zwane również wielkimi lub wielkimi literami ) | ||||||||||||||||||||||||||||||||||
A | A | b | C | C | D | mi | MI | F | g | h | i | J | K | L | Ł | m | n | N | O | Ó | P | (Q) | r | S | S | T | U | (V) | W | (X) | Tak | Z | Ź | Ż |
Formy miniaturowe (zwane również małymi lub małymi literami ) | ||||||||||||||||||||||||||||||||||
a | a | b | C | C | D | mi | mi | F | g | h | i | J | k | ja | ł | m | n | n | o | ó | P | (Q) | r | s | s | T | ty | (v) | w | (x) | tak | z | ź | ż |
Nazwa liter | ||||||||||||||||||||||||||||||||||
a | a | być | Ce | cie | de | mi | mi | ef | Gie | mam | i | odrobina | Kai | el | eł | em | en | eń | o | o kreskowane | pe | ku | er | tak | eś | te | ty | fau | wu | iks | igrek | zet | ziet | żet |
Litery q (o nazwie ku ), v (o nazwie fau lub rzadko my ) i x (o nazwie iks ) są używane w niektórych obcych słowach i nazwach handlowych. W zapożyczeniach często są one zastąpione kw , W , a ( alk lub GZ ), odpowiednio (jak kwarc "kwarcu" weranda "werandę", ekstra "dodatkowy" egzosfera "Exosphere").
Podając pisownię słów, niektóre litery mogą być wypowiadane w bardziej dobitny sposób, aby odróżnić je od innych identycznie wymawianych znaków. Na przykład, H może być określane jako samo h („ samo h ”), aby odróżnić je od CH (ce ha) . Literę Ż można nazwać „ Zet (lub zet ) z kropką ” („Ż z kropką”), aby odróżnić ją od RZ (er zet) . Litera U może być nazywana U Otwarte ( „open U”, a odniesienie do jego formie graficznej) lub u Zwykłe ( „normalne u”), w celu odróżnienia go spośród O, który jest czasami nazywany ó Zamknięte ( „zamknięty o”), ó kreskowane lub ó oo kreska ( „o o skoku akcent”), ewentualnie o kreskowane lub kreska uncji ( „o o skoku akcent”). Litera ó jest reliktem sprzed setek lat, kiedy w języku polskim istniała różnica długości podobna do tej w języku czeskim , przy czym á i é były wówczas powszechne. Następnie rozróżnienie długości zniknęło, a á i é zostały zniesione, ale ó zaczęto wymawiać tak samo jak u .
Zauważ, że polskie litery ze znakami diakrytycznymi są traktowane jako w pełni niezależne litery w porządku alfabetycznym (w przeciwieństwie do języków takich jak francuski , hiszpański i niemiecki ). Np. być po bycie . Litery diakrytyczne również mają swoje sekcje w słownikach (słowa zaczynające się na ć nie są zwykle wymieniane pod c ). Nie ma jednak regularnych słów zaczynających się na ą lub ń .
Digrafy
Polski dodatkowo używa dwuznaków ch , cz , dz , dź , dż , rz i sz . Kombinacje niektórych spółgłosek z literą I przed samogłoską można uznać digrafów: CI jako pozycyjnej wariantu ć , Si jako pozycyjnej wariantu ś , Zi jako pozycyjnej wariantu ź , a ni jako pozycyjnej wariantu ń (ale zobacz specjalną uwagę na temat ni poniżej ); jest też jeden trygraf dzi jako pozycyjny wariant dź . Nie są one traktowane w sposób szczególny w kolejności alfabetycznej. Na przykład ch traktuje się po prostu jako c, po którym następuje h , a nie jako pojedynczą literę, jak w języku czeskim czy słowackim (np. Chojnice mają tylko pierwszą literę wielką i są sortowane po Cankach, a przed Cieszynem ).
Zasady wymowy
Grafem | Zwykła wartość | Inne wartości |
---|---|---|
a | / w / | |
a | / Ɔ / | [ɔn] , [ɔŋ] , [ɔm] ; staje się / ɔ / przed / w / (patrz poniżej ) |
mi | / Ɛ / | |
mi | / Ɛ / | [ɛn] , [ɛŋ] , [ɛm] ; staje się / ɛ / word-finally i przed / w / (patrz poniżej ) |
i | / ja / | [ j ] przed samogłoską; oznacza palatalizację poprzedniej spółgłoski przed samogłoską (patrz niżej ) |
o | / Ɔ / | |
ó | / U / | |
ty | w niektórych przypadkach reprezentuje [ w ] po samogłoskach | |
tak | / Ɨ / |
Grafem | Zwykła wartość | Dźwięczne lub bezdźwięczne |
---|---|---|
b | / b / | [ p ] jeśli ubezdźwięczniony |
C | / t͡s / | [ d͡z ] jeśli dźwięczne |
C | / t͡ɕ / | [ d͡ʑ ] jeśli dźwięczne |
cz | / t͡ʂ / | [ d͡ʐ ] jeśli dźwięczne |
D | / d / | [ t ] jeśli ubezdźwięczniony |
dz | / d͡z / | [ t͡s ] jeśli ubezdźwięczniony |
dź | / d͡ʑ / | [ t͡ɕ ] jeśli ubezdźwięczniony |
Dż | / d͡ʐ / | [ t͡ʂ ] jeśli ubezdźwięczniony |
F | / f / | [ v ] jeśli dźwięczne |
g | / Ɡ / | [ k ] jeśli ubezdźwięczniony |
h | / x / | [ ɣ ] jeśli dźwięczne |
ch | ||
J | / j / | |
k | / k / | [ ɡ ] jeśli dźwięczne |
ja | / l / | |
ł | / w / | |
m | / m / | |
n | / n / | |
n | / Ɲ / | |
P | / p / | [ b ] jeśli dźwięczne |
r | / ɾ / | |
s | / s / | [ z ] jeśli dźwięczne |
s | / ɕ / | [ ʑ ] jeśli dźwięczne |
sz | / Ʂ / | [ ʐ ] jeśli dźwięczne |
T | / t / | [ d ] jeśli dźwięczne |
w | / v / | [ f ] jeśli ubezdźwięczniony |
z | / z / | [ s ] jeśli ubezdźwięczniony |
ź | / ʑ / | [ ɕ ] jeśli ubezdźwięczniony |
ż | / ʐ / | [ ʂ ] jeśli ubezdźwięczniony |
rz |
^ 1 Zobaczponiżejzasady dotyczące pisowni spółgłosek pęcherzykowo-podniebiennych.
^2 H może być krtaniowe[ ɦ ]w niewielkiej liczbie dialektów.
^3 Rzadko ⟨rz⟩ nie jest dwuznakiem i reprezentuje dwa oddzielne dźwięki:
- w różnych formach czasownika zamarzać - "zamrozić"
- w różnych formach czasownika mierzić - "obrzydzić"
- w miejscowości Murzasichle
- w zapożyczeniach, np. erzac (z niem. Ersatz ), Tarzan
Udźwiękowienie i ubezdźwięcznienie
Dźwięczne litery spółgłosek często reprezentują dźwięki bezdźwięczne (jak pokazano w powyższych tabelach). Wynika to z neutralizacji, która występuje na końcu wyrazów iw niektórych zbitkach spółgłosek ; na przykład ⟨b⟩ w klub ( „Club”) jest wymawiane jak ⟨p⟩ oraz ⟨rz⟩ w prze- brzmi jak ⟨sz⟩. Rzadziej bezdźwięczne litery spółgłoskowe mogą reprezentować dźwięki dźwięczne; na przykład ⟨k⟩ w także ( „również”) wymawia się jak ⟨g⟩. Warunki tej neutralizacji zostały opisane w części Udźwiękowienie i ubezdźwięcznienie w artykule dotyczącym fonologii polskiej.
Spółgłoski podniebienne i palatalizowane
Reguła pisowni dźwięków dziąsłowo-podniebiennych /ɕ/ , /ʑ/ , /t͡ɕ/ , /d͡ʑ/ i /ɲ/ jest następująca: przed samogłoską ⟨i⟩ stosuje się zwykłe litery ⟨szc dz n⟩; przed innymi samogłoskami stosuje się kombinacje ⟨si zi ci dzi ni⟩; bez samogłoski stosuje się znaki diakrytyczne ⟨ś ź ć dź ń⟩. Na przykład s⟩ w siwy („siwy”), ⟨si⟩ w siarka („siarka”) i ⟨ś⟩ w świętym („święty”) reprezentują dźwięk /ɕ/ .
Dźwięk | Słowo na końcu lub przed spółgłoską |
Przed samogłoską inną niż ⟨i⟩ |
Zanim ja⟩ |
---|---|---|---|
/t͡ɕ/ | C | ci | C |
/d͡ʑ/ | dź | dzi | dz |
/ɕ/ | s | si | s |
/ʑ/ | ź | zi | z |
/ɲ/ | n | ni | n |
Szczególną uwagę należy zwrócić na ⟨n⟩ przed ⟨i⟩ plus samogłoska. W słowach obcego pochodzenia ⟨i⟩ powoduje palatalizację poprzedzającej spółgłoski ⟨n⟩ do /ɲ/ i wymawia się ją jako /j/ . Taka sytuacja ma miejsce, gdy odpowiedni dopełniacz kończy się na -nii , wymawiane jako /ɲji/ , a nie na -ni , wymawiane jako /ɲi/ (co jest sytuacją typową dla wyrazów pochodzenia polskiego). Przykłady można znaleźć w tabeli w następnej sekcji.
Według jednego systemu podobne zasady dotyczą spółgłosek palatalizowanych /kʲ/ , /ɡʲ/ i /xʲ/ , z tą różnicą, że mogą one występować tylko przed samogłoskami. Pisownia to zatem ⟨kg (c)h⟩ przed ⟨i⟩, a ⟨ki gi (c)hi⟩ inaczej. Na przykład, ⟨k⟩ w kim („kto”, instr.) i ⟨ki⟩ w kiedy oba reprezentują /kʲ/ . W systemie bez palatalizowanych welarów analizuje się je jako /k/, /ɡ/ i /x/ przed /i/ i /kj/, /ɡj/ i /xj/ przed innymi samogłoskami.
Inne problemy z i i j
Poza przypadkami wymienionymi w poprzednim akapicie, litera „i”, po której następuje inna samogłoska w tym samym wyrazie, zwykle reprezentuje /j/ , ale ma również palatalizujący wpływ na poprzednią spółgłoskę. Na przykład ciasta ("pies") wymawia się [pʲjɛs] ( /pjɛs/ ). Niektóre słowa z ⟨n⟩ przed ⟨i⟩ plus samogłoska również mają ten wzór (patrz poniżej). W rzeczywistości i jest zwyczajową pisownią /j/ między poprzedzającą spółgłoskę a następną samogłoską. Litera ⟨j⟩ normalnie pojawia się w tej pozycji dopiero po ⟨c⟩, ⟨s⟩ i ⟨z⟩, jeśli należy unikać opisanego wyżej efektu palatalizacji (jak w presji "presja", Azja "Asia", lekcja "lekcja" , oraz wspólne przyrostki -cja "-tion", -zja "-sion": stacja "stacja", wizja "wizja". Litera ⟨j⟩ po spółgłoskach jest również używana w połączeniu dwóch słów, jeśli drugie słowo w parze zaczyna się na ⟨j⟩, np. wjazd "wejście" pochodzi od w + jazd(a) . Wymowa sekwencji WJA (na wjazd ) jest taka sama jak wymowy wia (w wiadro „bucket”).
Końcówka -ii, która pojawia się w odmiennych formach niektórych rzeczowników obcego pochodzenia, które mają -ia w mianowniku (zawsze po ⟨g⟩, ⟨k⟩, ⟨l⟩ i ⟨r⟩; czasami po ⟨m⟩ , ⟨n⟩ i inne spółgłoski), jest wymawiane jako [ji] , z palatalizacją poprzedniej spółgłoski. Na przykład, dalii (dopełniacz Dalia "Dalia"), Bułgarii (dopełniacz Bułgaria "Bułgaria"), Chemii (dopełniacz chemia "chemii"), Religii (dopełniacz religia "religia"), amfibii (dopełniacz Amfibia „Amphibia "). Powszechną wymową jest [i] . Dlatego dzieci często błędnie zapisują i piszą -i w formach odmienionych , jak armia , Danii lub hiperpoprawnie piszą ziemii zamiast ziemi (słowa polskiego pochodzenia nie mają końcówki -ii, ale proste -i , np. ziemi , dopełniacz z ziemia ).
W niektórych rzadkich przypadkach jednak, gdy zgodne w przypadku jest poprzedzone innym spółgłoskę -ii mogą być widoczne jako [I] , ale poprzedzające spółgłoskę jeszcze spalatalizowanych np Anglii (dopełniacz Anglia „England”) jest wyraźny [anɡlʲi] . (Pisownia Angli , bardzo często spotykana w Internecie, jest po prostu błędem w ortografii, spowodowanym tą wymową.)
Szczególna sytuacja dotyczy ⟨n⟩: ma pełną palatalizację do [ɲ] przed -ii, które jest wymawiane jako [ji] - i taka sytuacja występuje tylko wtedy, gdy odpowiednia forma mianownika w -nia jest wymawiana jako [ɲja] , nie jako [ɲa] .
Na przykład (zwróć uwagę na duże i małe litery):
Sprawa | Słowo | Wymowa | Oznaczający | Słowo | Wymowa | Oznaczający | |
---|---|---|---|---|---|---|---|
Mianownikowy | dania | /daɲa/ | dania (liczba mnoga) | Dania | /daɲja/ | Dania | |
Dopełniacz | (dań) | ( /daɲ/ ) | (dań) | Daniiła | /daɲji/ | Danii | |
Mianownikowy | Mania | /maɲa/ | Mary ( zdrobnienie od „Maria”) | mania | /maɲja/ | mania | |
Dopełniacz | (Mani) | ( /maɲi/ ) | (Maryi) | manii | /maɲji/ | manii |
Końcówka -ji jest zawsze wymawiana jako /ji/ . Pojawia się dopiero po c , s i z . Wymowa tego jako proste /i/ jest uważana za błąd wymowy. Na przykład, presji (dopełniacz presja "ciśnienia") jest / pɾɛsji / ; poezji (dopełniacz od poezja „poezja”) to /pɔɛzji/ ; racji (dopełniacz racja "powód") to /ɾat͡sji/ .
Samogłoski nosowe
Litery ⟨ą⟩ i ⟨ę⟩, po których następują spółgłoski zwarte i afrykaty, reprezentują samogłoskę ustną, po której następuje spółgłoska nosowa, a nie samogłoska nosowa. Np. ⟨ą⟩ w dąb ("dąb") wymawiamy /ɔm/ , a ⟨ę⟩ w tęcza ("tęcza") wymawiamy /ɛn/ (nos asymiluje się z następującą spółgłoską). Gdy następuje ⟨l⟩ lub ⟨ł⟩, aw przypadku ⟨ę⟩ zawsze na końcu wyrazów, litery te wymawia się po prostu jako /ɔ/ lub /ɛ/ .
Pisownia homofoniczna
Poza przypadkami w powyższych sekcjach istnieją trzy dźwięki w języku polskim, które można zapisać na dwa różne sposoby, w zależności od słowa. Wynikają one z historycznych zmian brzmieniowych. Prawidłową pisownię można często wywnioskować z pisowni innych form morfologicznych tego słowa lub pokrewnych w języku polskim lub w innych językach słowiańskich.
-
/x/ można napisać jako ⟨h⟩ lub ⟨ch⟩.
- ⟨h⟩ występuje tylko w zapożyczeniach; jednak wiele z nich zostało natywizowanych i nie są postrzegane jako zapożyczenia. ⟨h⟩ jest używane:
- gdy pokrewne wyrazy mają literę ⟨g⟩, ⟨ż⟩ lub ⟨z⟩, np.:
- wahadło - waga
- druh – drużyna
- blahy - blazen
- gdy użyto tej samej litery w języku, z którego zapożyczono słowo, np. greckie przedrostki hekto-, hetero-, homo-, hipo-, hiper-, hydro- , także honor, historia, herbata , itp.
- gdy pokrewne wyrazy mają literę ⟨g⟩, ⟨ż⟩ lub ⟨z⟩, np.:
- ⟨ch⟩ jest używany:
- we wszystkich rodzimych słowach, np. chyba, chrust, chrapać, chować, chcieć
- gdy ten sam dwuznak jest używany w języku, z którego zapożyczono słowo, np. chór, echo, charakter, chronologia itp.
- ⟨h⟩ występuje tylko w zapożyczeniach; jednak wiele z nich zostało natywizowanych i nie są postrzegane jako zapożyczenia. ⟨h⟩ jest używane:
-
/u/ można napisać ⟨u⟩ lub ⟨ó⟩; pisownia ⟨ó⟩ wskazuje, że dźwięk rozwinął się z historycznego długiego /oː/ .
- ⟨u⟩ jest używany:
- zwykle na początku wyrazu (oprócz ósemka, ósmy, ów, ówczesny, ówdzie )
- zawsze na końcu słowa
- w końcówkach -uch, -ucha, -uchna, -uchny, -uga, -ula, -ulec, -ulek, -uleńka, -ulka, -ulo, -un, -unek, -uni, -unia, -unio , -ur, -us, -usi, -usieńki, -usia, -uszek, -uszka, -uszko, -uś, -utki
- ⟨ó⟩ jest używany:
- gdy pokrewne wyrazy lub inne formy morfologiczne mają literę ⟨o⟩, ⟨e⟩ lub ⟨a⟩, np.:
- mróz - mrozu
- wóz - wieźć
- skrócić - skracać
- w końcówkach -ów, -ówka, -ówna (oprócz zasuwka, skuwka, wsuwka )
- gdy pokrewne wyrazy lub inne formy morfologiczne mają literę ⟨o⟩, ⟨e⟩ lub ⟨a⟩, np.:
- ⟨u⟩ jest używany:
-
/ʐ/ można zapisać jako ⟨ż⟩ lub ⟨rz⟩; pisownia ⟨rz⟩ wskazuje, że dźwięk powstał z /r̝/ (por. czeski ⟨ ř ⟩).
- ⟨ż⟩ jest używany:
- gdy pokrewne wyrazy lub inne formy morfologiczne mają literę/digraf ⟨g⟩, ⟨dz⟩, ⟨h⟩, ⟨z⟩, ⟨ź⟩, ⟨s⟩, np.:
- mogę - mogę
- mosiężny - Moskwa
- drużyna - druh
- każe - każdy
- wożę - woźnica
- bliżej - blisko
- w cząstce że , np. skądże, tenże, także
- po ⟨l⟩, ⟨ł⟩, ⟨r⟩, np.:
- lżej
- łże
- żysko
- w zapożyczeniach, zwłaszcza z francuskiego, np.:
- rewanż
- żakiet
- garażowany
- gdy pokrewne w innych językach słowiańskich zawierają dźwięk /ʐ/ lub /ʒ/ , np. żuraw - rosyjski журавль
- gdy pokrewne wyrazy lub inne formy morfologiczne mają literę/digraf ⟨g⟩, ⟨dz⟩, ⟨h⟩, ⟨z⟩, ⟨ź⟩, ⟨s⟩, np.:
- ⟨rz⟩ jest używany:
- gdy pokrewne wyrazy lub inne formy morfologiczne mają literę ⟨r⟩, np. morze – morski, karze – kara
- zwykle po ⟨p⟩, ⟨b⟩, ⟨t⟩, ⟨d⟩, ⟨k⟩, ⟨g⟩, ⟨ch⟩, ⟨j⟩, ⟨w⟩, np.:
- przygoda
- brzeg
- trzy
- drzewo
- krzywy
- grzywaj
- chrzest
- ujrzeć
- wrzeć
- gdy pokrewne w innych językach słowiańskich zawierają dźwięk /r/ lub /r̝/ , np. rzeka - rosyjski река
- ⟨ż⟩ jest używany:
Inne punkty
Litera ⟨u⟩ reprezentuje /w/ w dwuznakach ⟨au⟩ i ⟨eu⟩ w zapożyczeniach, np. autor, Europa ; ale nie w rodzimych słowach, jak nauka , wymawiane [naˈu.ka] .
Istnieją pewne zbitki, w których pisemna spółgłoska nie byłaby normalnie wymawiana. Na przykład, ⟨ł⟩ w słowach mógł ( „może”) i jabłko ( „jabłko”) został pominięty w mowie potocznej.
Kapitalizacja
Nazwy są na ogół pisane wielkimi literami w języku polskim tak jak w języku angielskim. W języku polskim miesiące i dni tygodnia nie są pisane wielką literą, ani przymiotniki i inne formy pochodzące od rzeczowników własnych (np. angielski „angielski”).
Tytuły takie jak pan („Pan”), pani („Pani”), lekarz („lekarz”) itp. oraz ich skróty nie są pisane wielkimi literami, z wyjątkiem pisemnego uprzejmego adresu. Zaimki drugiej osoby są tradycyjnie pisane wielką literą w formalnym piśmie (np. w listach lub oficjalnych e-mailach); więc mogą to być inne słowa odnoszące się do kogoś bezpośrednio w otoczeniu formalnym, jak Czytelnik ("czytelnik", w gazetach lub książkach). Zaimki trzeciej osoby są pisane wielką literą, aby pokazać szacunek, najczęściej w świętym kontekście.
Interpunkcja
Polska interpunkcja jest podobna do angielskiej. Istnieją jednak bardziej sztywne zasady dotyczące używania przecinków — zdania podrzędne są prawie zawsze oddzielone przecinkiem, podczas gdy zwykle uważa się za niepoprawne użycie przecinka przed spójnikiem koordynacyjnym o znaczeniu „i” ( i , a lub oraz ) .
Po skrótach (ale nie akronimach ani inicjałach ) występuje kropka, w której kończą się literą inną niż ta, która kończy całe słowo. Na przykład dr nie ma kropki, gdy oznacza doktor , ale przyjmuje ją, gdy oznacza formę odmienioną, taką jak doktora i prof. ma okres, ponieważ pochodzi od profesora ( profesora ).
Apostrofy są używane do oznaczenia opuszczenia końcowego brzmienia wyrazów obcych niewymawianych przed polskimi końcówkami fleksyjnymi, jak w Harry'ego ( [xaˈrɛɡɔ] , dopełniacz od Harry [ˈxarɨ] - końcowy [ɨ] jest eliminowany w dopełniaczu). Jednak często jest on błędnie używany do oddzielenia zapożyczonego rdzenia od jakiegokolwiek zakończenia fleksyjnego, na przykład *John'a , które powinno być Johna (dopełniacz od John ; żaden dźwięk nie jest usuwany).
Cudzysłów używa się na różne sposoby: albo „zwykłe polskie cudzysłowy” lub „francuskie cudzysłowy” (bez spacji) dla pierwszego poziomu oraz „pojedyncze polskie cudzysłowy” lub „francuskie cudzysłowy” dla drugiego poziomu, co daje trzy style zagnieżdżonych cudzysłowów:
- „Cytat ‚wewnątrz' cytat”
- „Cytat «wewnątrz» cytat”
- «Cytuj „wewnątrz” cytat»
Niektóre starsze druki używały „takich polskich cytatów”.
Historia
Polacy przyjęli alfabet łaciński w XII wieku. Alfabet ten nie był jednak przystosowany do reprezentowania niektórych polskich dźwięków, takich jak spółgłoski podniebienne i samogłoski nosowe . W konsekwencji polska pisownia w średniowieczu była bardzo niespójna, ponieważ różni pisarze używali różnych systemów do reprezentowania tych dźwięków. Na przykład we wczesnych dokumentach litera c mogła oznaczać obecnie pisane dźwięki c, cz, k , podczas gdy litera z była używana dla dźwięków teraz zapisanych z, ż, ś, ź . Pisarze wkrótce zaczęli eksperymentować z digrafami (kombinacjami liter), nowymi literami (φ i ſ, już nieużywane), a ostatecznie ze znakami diakrytycznymi .
Alfabet polski był jedną z dwóch głównych form ortografii łacińskiej opracowanych dla języków słowiańskich , drugą jest ortografia czeska , charakteryzująca się karonami (háčeksami), jak w literze č . Inne główne języki słowiańskie pisane obecnie alfabetami łacińskimi ( słowacki , słoweński i serbsko-chorwacki ) używają systemów podobnych do czeskiego. Jednak ortografia oparta na języku polskim jest używana dla języka kaszubskiego i zwykle dla śląskiego , podczas gdy języki łużyckie wykorzystują elementy obu systemów.
Kodowanie komputerowe
Istnieje kilka różnych systemów kodowania polskiego alfabetu dla komputerów. Wszystkie litery polskiego alfabetu są zawarte w Unicode , dzięki czemu można używać kodowań opartych na Unicode , takich jak UTF-8 i UTF-16 . Polski alfabet jest całkowicie zawarty w podstawowej wielojęzycznej płaszczyźnie Unicode. ISO 8859-2 (Latin-2), ISO 8859-13 (Latin-7), ISO 8859-16 (Latin-10) i Windows-1250 to popularne kodowania 8-bitowe obsługujące polski alfabet.
Polskie litery, które nie występują w alfabecie angielskim, używają następujących encji znaków HTML i punktów kodowych Unicode :
Duże litery | A | C | MI | Ł | N | Ó | S | Ź | Ż |
---|---|---|---|---|---|---|---|---|---|
encja HTML | Ą Ą |
Ć &Ostro; |
Ę Ę |
Ł Ł |
Ń Ń |
Ó Ó |
Ś Ś |
Ź Ź |
Ż Ż |
Unicode | U+0104 | U + 0106 | U+0118 | U+0141 | U+0143 | U+00D3 | U+015A | U+0179 | U+017B |
Wynik | A | C | MI | Ł | N | Ó | S | Ź | Ż |
Małe litery | a | C | mi | ł | n | ó | s | ź | ż |
---|---|---|---|---|---|---|---|---|---|
encja HTML | ą ą |
ć ć |
ę ę |
ł ł |
ń ń |
ó ó |
ś ś |
ź ź |
ż ż |
Unicode | U+0105 | U+0107 | U+0119 | U+0142 | U+0144 | U+00F3 | U + 015B | U+017A | U+017C |
Wynik | a | C | mi | ł | n | ó | s | ź | ż |
W przypadku innych kodowań zobacz poniższą tabelę. Liczby w tabeli są szesnastkowe .
zestaw znaków |
A | C | MI | Ł | N | Ó | S | Ź | Ż | a | C | mi | ł | n | ó | s | ź | ż |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
ISO 8859-2 | A1 | C6 | CA | A3 | D1 | D3 | A6 | AC | AF | B1 | E6 | EA | B3 | F1 | F3 | B6 | pne | BF |
Okna-1250 | A5 | C6 | CA | A3 | D1 | D3 | 8C | 8F | AF | B9 | E6 | EA | B3 | F1 | F3 | 9C | 9F | BF |
IBM 852 | A4 | 8F | A8 | 9D | E3 | E0 | 97 | 8D | BD | A5 | 86 | A9 | 88 | E 4 | A2 | 98 | AB | BYĆ |
Mazowsze | 8F | 95 | 90 | 9C | A5 | A3 | 98 | A0 | A1 | 86 | 8D | 91 | 92 | A4 | A2 | 9E | A6 | A7 |
Prochowiec | 84 | 8C | A2 | FC | C1 | EE | E5 | 8F | pełne wyżywienie | 88 | 8D | AB | B8 | C4 | 97 | E6 | 90 | FD |
ISO 8859-13 i Windows-1257 | C0 | C3 | C6 | D9 | D1 | D3 | DA | CA | DD | E0 | E3 | E6 | F9 | F1 | F3 | FA | EA | FD |
ISO 8859-16 | A1 | C5 | DD | A3 | D1 | D3 | D7 | AC | AF | A2 | E5 | FD | B3 | F1 | F6 | F7 | AE | BF |
IBM 775 | B5 | 80 | B7 | OGŁOSZENIE | E0 | E3 | 97 | 8D | A3 | D0 | 87 | D3 | 88 | E7 | A2 | 98 | A5 | A4 |
CSK | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 88 | 87 | A0 | A1 | A2 | A3 | A4 | A5 | A6 | A8 | A7 |
Cyfromat | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 88 | 87 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 98 | 97 |
DHN | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 88 | 87 | 89 | 8A | 8B | 8C | 8D | 8E | 8F | 91 | 90 |
IINTE-ISIS | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 |
IEA-Świerk | 8F | 80 | 90 | 9C | A5 | 99 | EB | 9D | 92 | A0 | 9B | 82 | 9F | A4 | A2 | 87 | A8 | 91 |
Logika | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 8A | 8B | 8C | 8D | 8E | 8F | 90 | 91 |
Microvex | 8F | 80 | 90 | 9C | A5 | 93 | 98 | 9D | 92 | A0 | 9B | 82 | 9F | A4 | A2 | 87 | A8 | 91 |
Ventura | 97 | 99 | A5 | A6 | 92 | 8F | 8E | 90 | 80 | 96 | 94 | A4 | A7 | 91 | A2 | 84 | 82 | 87 |
ELWRO-Junior | C1 | C3 | C5 | CC | CE | CF | D3 | DA | D9 | E1 | E3 | E5 | WE | EE | EF | F3 | FA | F9 |
AmigaPL | C2 | CA | CB | CE | CF | D3 | D4 | DA | DB | E2 | EA | EB | EE | EF | F3 | F4 | FA | pełne wyżywienie |
TeXPL | 81 | 82 | 86 | 8A | 8B | D3 | 91 | 99 | 9B | A1 | A2 | A6 | AA | AB | F3 | B1 | B9 | nocleg ze śniadaniem |
Klub Atari (Atari ST) | C1 | C2 | C3 | C4 | C5 | C6 | C7 | C8 | C9 | D1 | D2 | D3 | D4 | D5 | D6 | D7 | D8 | D9 |
CorelDraw! | C5 | F2 | C9 | A3 | D1 | D3 | FF | E1 | ED | E5 | WE | E6 | C6 | F1 | F3 | A5 | AA | BA |
bankomat | C4 | C7 | CB | D0 | D1 | D3 | D6 | DA | DC | E 4 | E7 | EB | F0 | F1 | F3 | F6 | FA | FC |
Powszechnym zdaniem testowym zawierającym wszystkie polskie znaki diakrytyczne jest bezsensowne „ Zażółć gęślą jaźń ”.
Zobacz też
Dalsza lektura
- Sadowska, Iwona (2012). Polski: kompleksowa gramatyka . Oksford ; Nowy Jork : Routledge . Numer ISBN 978-0-415-47541-9.