dbo:abstract
|
- KS X 1001 (auch Wansung (완성) genannt) ist eine südkoreanische Norm, die eine Zeichenkodierung für die koreanische Schrift festlegt. Sie wurde 1974 als KS C 5601 eingeführt und 1982, 1987, 1992, 1998, 2002 und zuletzt 2004 revidiert. KS X 1001 ist eine 16-Bit-Kodierung. Alle Zeichen werden im Bereich 0x21–0x7E in einer 94×94-Matrix kodiert, die die Kodierung von maximal 8.836 Zeichen erlaubt – ein System, das auch von benachbarten Kodierungen wie JIS X 0208 (Japan) oder GB2312 (China) benutzt wird. Kodiert werden 2.350 vorgefertigte Hangeul-Silben, 4.888 Hanja, die lateinische, griechische und kyrillische Schrift, sowie verschiedene Symbole, insgesamt 8.227 Zeichen. KS X 1001 ist der einzige koreanische Zeichensatz, der größere Verbreitung fand. Er ist in EUC-KR und ISO-2022-KR implementiert und auf den meisten Websites sowie Betriebssystemen genutzt. Unter Windows wird KS X 1001 als Codepage 51949 abgebildet. Koreanische Versionen von Windows nutzen allerdings eine Erweiterung dieses Zeichensatzes, die Codepage 949, auch Unified Hangul Code (UHC) genannt. Der Zeichensatz kodiert nur die 2.350 häufigsten Hangeul-Silben, was vor allem mit Fremdwörtern und Eigennamen Probleme bereitet, da die dafür verwendeten Silben meist nicht in KS X 1001 enthalten sind. In Nordkorea wird anstelle dieses Zeichensatzes KPS 9566 benutzt. (de)
- KS X 1001, "Code for Information Interchange (Hangul and Hanja)", formerly called KS C 5601, is a South Korean coded character set standard to represent hangul and hanja characters on a computer. KS X 1001 is encoded by the most common legacy (pre-Unicode) character encodings for Korean, including EUC-KR and Microsoft's Unified Hangul Code (UHC). It contains Korean Hangul syllables, CJK ideographs (Hanja), Greek, Cyrillic, Japanese (Hiragana and Katakana) and some other characters. KS X 1001 is arranged as a 94×94 table, following the structure of 2-byte code words in ISO 2022 and EUC. Therefore, its code points are pairs of integers 1–94. However, some encodings (UHC and Johab), in addition to providing codes for every code point, provide additional codes for characters otherwise representable only as code point sequences. (en)
- KS X 1001, intitulé 정보 교환용 부호계 (한글 및 한자) (en coréen code pour échange d’information (hangeul et hanja)), est une norme sud-coréenne de codage des caractères sur 2 octets. Elle initialement identifiée comme KS C 5601 en 1974, et dans les révisions de 1982, 1987 et 1992, avant de devenir KS X 1001, et dans les révisions de 1998, 2002 et finalement 2004.Ces codes sont organisés en table de 94 par 94 octes, avec des code de caractères composés de deux chiffres entre 1 et 94.Elle est implémentée de différentes manières sur différents systèmes d’exploitation, généralement en combinaison avec le KS X 1003, dont notamment les codages EUC-KR, Windows-949, ISO-2022-KR et .Elle contient 2350 codes de caractères hangeul, 4888 de hanja, et plusieurs codes de symboles et caractères spéciaux, latins, grecs, cyrilliques ou japonais (hiragana et katakana), faisant un total de 8227 caractères. (fr)
- KS X 1001は、韓国でハングルや漢字をあらわすのに用いられている文字コード(符号化文字集合)の規格(、KS)。以前はKS C 5601の規格名だった。単にKSコードとも呼ばれる。 現代韓国でUnicodeと並んで用いられるほぼ唯一の文字コードである。 (ja)
- KS X 1001은 한국 산업 규격으로 지정된 한국어 문자 집합으로서, 정식 규격명은 ‘정보 교환용 부호계 (한글 및 한자)’이며, 옛 이름인 KS C 5601로도 알려져 있다. 1974년에 처음으로 제정되었고, 2004년에 개정된 ‘KS X 1001:2004’가 최신 규격이다. 이 규격은 2바이트 부호계로서, x2121 - x7E7E까지 영역에서 8,836문자의 표현을 규정하는데, 문자는 제어 문자와 도형 문자로 분류하며, 도형 문자는 특수 문자, 괘선 조각, 숫자, 한글 낱자, 한글 글자 마디, 한자, 기본 로마 문자, 확장 로마 문자, 그리스 문자, 가나 문자, 키릴 문자로 구성되어 있다. 한글 부분은 기본적으로 2바이트 완성형 코드이지만, 부속서 3에서 2바이트 조합형 코드도 보조 부호계로서 규정되어 있다. KS X 1001은 유니코드를 제외하고 대한민국에서 사용되는 거의 유일한 문자 집합이다. KS X 1001 기반의 문자 인코딩으로는 EUC-KR(완성형)과 ISO-2022-KR (과거 인터넷 메일에서 쓰던 문자 인코딩)이 있다. MS 윈도에서 사용하는 CP949은 EUC-KR의 확장으로 2바이트로 표현할 수 없는 한글 글자 마디 8,822자를 추가한 것이다. (ko)
- KS X 1001是韓國用於書寫的諺文和漢字的字元編碼規格。以前稱作KS C 5601,現在多稱作KS X 1001,有时也简称为KS編碼。 其与JIS X 0208的94×94字集类似,包含諺文2,350字、漢字4,888字、英文字母、數字和假名共,8226字。諺文是由字母組合成一个音節的,但在这种编码中用一个字符表示一整个音节,难以包括所有可能的組成符號,存在許多無法表示的音節,受到許多批評。百事可樂的韓國法人因 KS X 1001 不含「펲」,在1992年改用 KS X 1001 中存在的諺文「펩」表示。 漢字則是照讀音順序來配置的。朝鮮語原則上一字一音,但也存在破音字,KS X 1001對這樣的漢字在不同的读音位置重複編碼。这被称为「预组合字符编码」(Wansung,韓語:완성,羅馬化:wanseong,直译:预组合)。 雖然也有不一樣的,使用頭音法則,即轉成最先遇到的那個讀音,但如「盧」和「李」如此常用的字也有別的讀音和重複編碼。最多的是有4個重複編碼的「樂」。這個方式的好處是、字的讀音利於機械的判定,但卻也被批評違反字符編碼的大原則。此外,這樣重複編碼的漢字在統一碼和通用字符集中因互換性的關係,中日韓統一表意文字只收錄一個、其它的則收錄於中日韓兼容漢字。 KS X 1001在EUC的編碼稱作韓文EUC(EUC-KR)。實際上,KS X 1001 完全沒有被用於其它編碼(ISO-2022-KR完全沒有被使用),單獨的 KS C 5601 通常意指 EUC-KR 。 一些電腦系統将此標準改編成诸多版本。但他們並非完全一致,如將原标准中放在 0x5C 的反斜線改成韓圓(₩)。有些系統則使用非常規方法來擴充此標準。KS X 1001 可編碼成 EUC-KR、(EUC-KR 的超集)、ISO-2022-KR 和「雙位元組合型符號」(Johab)。但後二個很少使用。 朝鮮則使用另一規格KPS 9566。 (zh)
|
rdfs:comment
|
- KS X 1001は、韓国でハングルや漢字をあらわすのに用いられている文字コード(符号化文字集合)の規格(、KS)。以前はKS C 5601の規格名だった。単にKSコードとも呼ばれる。 現代韓国でUnicodeと並んで用いられるほぼ唯一の文字コードである。 (ja)
- KS X 1001 (auch Wansung (완성) genannt) ist eine südkoreanische Norm, die eine Zeichenkodierung für die koreanische Schrift festlegt. Sie wurde 1974 als KS C 5601 eingeführt und 1982, 1987, 1992, 1998, 2002 und zuletzt 2004 revidiert. Der Zeichensatz kodiert nur die 2.350 häufigsten Hangeul-Silben, was vor allem mit Fremdwörtern und Eigennamen Probleme bereitet, da die dafür verwendeten Silben meist nicht in KS X 1001 enthalten sind. In Nordkorea wird anstelle dieses Zeichensatzes KPS 9566 benutzt. (de)
- KS X 1001, "Code for Information Interchange (Hangul and Hanja)", formerly called KS C 5601, is a South Korean coded character set standard to represent hangul and hanja characters on a computer. KS X 1001 is encoded by the most common legacy (pre-Unicode) character encodings for Korean, including EUC-KR and Microsoft's Unified Hangul Code (UHC). It contains Korean Hangul syllables, CJK ideographs (Hanja), Greek, Cyrillic, Japanese (Hiragana and Katakana) and some other characters. (en)
- KS X 1001, intitulé 정보 교환용 부호계 (한글 및 한자) (en coréen code pour échange d’information (hangeul et hanja)), est une norme sud-coréenne de codage des caractères sur 2 octets. Elle initialement identifiée comme KS C 5601 en 1974, et dans les révisions de 1982, 1987 et 1992, avant de devenir KS X 1001, et dans les révisions de 1998, 2002 et finalement 2004.Ces codes sont organisés en table de 94 par 94 octes, avec des code de caractères composés de deux chiffres entre 1 et 94.Elle est implémentée de différentes manières sur différents systèmes d’exploitation, généralement en combinaison avec le KS X 1003, dont notamment les codages EUC-KR, Windows-949, ISO-2022-KR et .Elle contient 2350 codes de caractères hangeul, 4888 de hanja, et plusieurs codes de symboles et caractères spéciaux, latins, gre (fr)
- KS X 1001은 한국 산업 규격으로 지정된 한국어 문자 집합으로서, 정식 규격명은 ‘정보 교환용 부호계 (한글 및 한자)’이며, 옛 이름인 KS C 5601로도 알려져 있다. 1974년에 처음으로 제정되었고, 2004년에 개정된 ‘KS X 1001:2004’가 최신 규격이다. 이 규격은 2바이트 부호계로서, x2121 - x7E7E까지 영역에서 8,836문자의 표현을 규정하는데, 문자는 제어 문자와 도형 문자로 분류하며, 도형 문자는 특수 문자, 괘선 조각, 숫자, 한글 낱자, 한글 글자 마디, 한자, 기본 로마 문자, 확장 로마 문자, 그리스 문자, 가나 문자, 키릴 문자로 구성되어 있다. 한글 부분은 기본적으로 2바이트 완성형 코드이지만, 부속서 3에서 2바이트 조합형 코드도 보조 부호계로서 규정되어 있다. (ko)
- KS X 1001是韓國用於書寫的諺文和漢字的字元編碼規格。以前稱作KS C 5601,現在多稱作KS X 1001,有时也简称为KS編碼。 其与JIS X 0208的94×94字集类似,包含諺文2,350字、漢字4,888字、英文字母、數字和假名共,8226字。諺文是由字母組合成一个音節的,但在这种编码中用一个字符表示一整个音节,难以包括所有可能的組成符號,存在許多無法表示的音節,受到許多批評。百事可樂的韓國法人因 KS X 1001 不含「펲」,在1992年改用 KS X 1001 中存在的諺文「펩」表示。 漢字則是照讀音順序來配置的。朝鮮語原則上一字一音,但也存在破音字,KS X 1001對這樣的漢字在不同的读音位置重複編碼。这被称为「预组合字符编码」(Wansung,韓語:완성,羅馬化:wanseong,直译:预组合)。 雖然也有不一樣的,使用頭音法則,即轉成最先遇到的那個讀音,但如「盧」和「李」如此常用的字也有別的讀音和重複編碼。最多的是有4個重複編碼的「樂」。這個方式的好處是、字的讀音利於機械的判定,但卻也被批評違反字符編碼的大原則。此外,這樣重複編碼的漢字在統一碼和通用字符集中因互換性的關係,中日韓統一表意文字只收錄一個、其它的則收錄於中日韓兼容漢字。 朝鮮則使用另一規格KPS 9566。 (zh)
|