About: Windows-1258

An Entity of Type: work, from Named Graph: http://dbpedia.org, within Data Space: dbpedia.org

Windows-1258 is a code page used in Microsoft Windows to represent Vietnamese texts. It makes use of combining diacritical marks. Windows-1258 is compatible with neither the Vietnamese standard (TCVN 5712 / VSCII), nor the various other encodings in use in practice (VISCII, VNI, VPS). Rather, it is very similar to Windows-1252, with the differences being that s-caron and z-caron (which were added to Windows-1252 later) are missing, five of the letters with diacritics have been replaced by combining diacritics for Vietnamese tone marks, one has been replaced with the đông sign, and eight others (four per case) have been changed to four otherwise-unsupported Vietnamese letters.

Property Value
dbo:abstract
  • Windows-1258 ist eine 8-Bit-Zeichenkodierung des Windows-Betriebssystems. Sie deckt die Orthographie der vietnamesischen Sprache ab. Da diese Orthographie insgesamt 134 Zeichen außer den ASCII-Zeichen verwendet, ist eine einfache Erweiterung des ASCII-Zeichensatzes auf 8-Bit nicht möglich. Windows-1258 löst dieses Problem durch die Verwendung kombinierender Zeichen, die sich mit den Basiskonsonanten verbinden und so die nötigen Kombinationen erzeugen. Der Zeichensatz selber basiert größtenteils auf Windows-1252, enthält jedoch außer den Diakritiken einige weitere vietnamesische Buchstaben und Zeichen. Die folgende Tabelle zeigt das Repertoire von Windows-1258. Diakritische Zeichen sind rot markiert, weitere Unterschiede zu Windows-1252 gelb. Unbelegte Positionen sind grün markiert. (de)
  • La page de code Windows-1258 (dans le registre IANA des jeux de caractères codés pour l’informatique et les normes Internet, aussi connue comme CP1258) est utilisée dans Microsoft Windows pour représenter les textes en quôc ngu, l’actuelle adaptation de l’écriture latine utilisée pour la langue vietnamienne moderne. C‘est une variante de la page de code Windows-1252 (ou CP1252, utilisée pour les langues d’Europe occidentale à écriture latine), avec quelques positions modifiées : * comme la page de code Windows-1252 ou les pages de code de la norme ISO/CEI 8859, elle est compatible avec les pages de code sur 7 bits de la norme ISO 646 (ici dans sa version américaine pour les positions variables, version communément appelée ASCII) dans toutes les positions hexadécimales 00 à 7F (les 8 premières rangées de la table ci-dessous) ; * comme la page de code Windows-1252, c’est également une variante du jeu de caractères codés ISO/CEI 8859-1 sur 8 bits de la norme ISO/CEI 8859 et utilisée pour les langues occidentales à écriture latine ; * comme toutes les pages de code sur 8 bits pour Windows basées sur la norme ISO/IEC 8859, elle s’écarte de cette norme pour placer (dans les positions hexadécimales 80 à 9F) des caractères typographiques, des symboles monétaires ou des lettres supplémentaires, à la place du jeu de caractères de contrôle C1 (inutilisés dans Windows) ; * les 18 positions qui sont modifiées par rapport à la page de code CP1252 sont indiquées dans la table ci-dessous par la bordure en tirets épais des cases : * ce sont les 5 signes diacritiques combinants (marques de ton), les 6 lettres latines diacritées (1 consonne et 2 voyelles phonémiques, chacune dans les deux casses) et 1 symbole monétaire nécessaires au vietnamien, présents dans les 4 dernières rangées de la table ci-dessous (ils remplacent des lettres latines diacritées utilisées dans les langues d’Europe centrale ou orientale et précomposées avec le caron ou hacek en chef, ainsi que la lettre latine edh encore utilisée en islandais, mais remplacée ici par la lettre latine d avec barre inscrite), * ainsi que 4 caractères supprimés et non remplacées (dans les rangées numéro 8 et 9, correspondant aux extensions de CP1252, par rapport à l’ISO/IEC 8859-1, et dans le cas présent pour 2 autres lettres latines avec caron). Bizarrement, Microsoft a modifié cette page de code pour y placer le symbole « € » (U+20AC) de l’euro en position 0x80 (comme dans la plupart des pages de codes pour Windows) lors de son introduction en 1999 (alors que l’euro n’est pas officiellement utilisé au Viêt Nam), mais a tout de même placé le symbole monétaire « ₫ » (U+20AB) du dong (localement đồng en vietnamien) en position 0xFE et qui, dans cette page de code, est différent de la lettre latine minuscule d barrée normale « đ » codée en position 0xF0 (l’initiale du nom de la devise en vietnamien, mais non transcrite en exposant souligné comme le symbole monétaire). Dans la table ci-dessus, les cases à fond rouge indiquent des positions réservées aux caractères de contrôle, les cases grisées indiquent des positions totalement inutilisés. Les cases à fond bleu clair indiquent des signes diacritiques combinants (qui doivent être utilisés après une lettre de base) utilisés comme marques de ton en vietnamien (affichées ici en combinaison avec un cercle pointillé et non une lettre) : * soit après une des 6 voyelles de l’alphabet latin de base (12 en comptant aussi les variantes majuscules), * soit après une des 6 autres voyelles diacrités de l’alphabet latin qui correspondent à une modification vocalique en vietnamien (12 en comptant aussi les variantes majuscules), * soit après l‘espace insécable (noté « NBSP » dans le tableau) qui permet d’afficher le diacritique seul sans le lier à une lettre et de traiter l’ensemble comme s’il s’agissait d’une lettre normale. Les voyelles de base et espaces avec lesquelles ces diacritiques doivent pouvoir être utilisés pour l’écriture du vietnamien sont indiquées dans les cases à fond jaune : elles peuvent aussi être utilisées seules (sans signe diacritique de ton) pour marquer le ton « moyen trainant » (ngang) par défaut du vietnamien, ou pour les textes transcrits sous forme simplifiée sans leur tonalité. Quelques-unes des combinaisons d’une voyelle phonémique et d’une marque de ton sont aussi disponibles sous forme de caractères précomposés dans cette table, ce sont celles qui correspondent aux principales langues européennes a écriture latine, avec lesquelles le vietnamien est utilisé. Les cases à fond blanc indiquent les autres caractères utilisables directement en vietnamien, y compris l’espace normale sécable, notée « SP », la ponctuation générale, les signes mathématiques, les dix chiffres latino-arabes, ainsi que les 8 voyelles précomposées (notant à la fois une voyelle phonémique de l’alphabet de base et une marque de ton) parmi les 60 (12 × 5) voyelles possibles (comprenant une marque de ton), chacune de ces voyelles dans les deux casses possibles, ainsi que les 4 symboles précombinés parmi les 5 symboles possibles par les mêmes marques de ton en isolation (car déjà précombinés avec une espace insécable). Les cases à fond rose clair indiquent des lettres simples ou precomposées, ou des symboles ou signes, non destinés à la transcription classique du vietnamien ou pour lesquels d’autres transcriptions leur sont préférées en vietnamien. Ils sont toutefois parfaitement utilisables dans cette page de code (notamment pour les textes internationaux et les mots importés de langues occidentales tels que les noms propres ou les marques commerciales). (fr)
  • Windows-1258 is a code page used in Microsoft Windows to represent Vietnamese texts. It makes use of combining diacritical marks. Windows-1258 is compatible with neither the Vietnamese standard (TCVN 5712 / VSCII), nor the various other encodings in use in practice (VISCII, VNI, VPS). Rather, it is very similar to Windows-1252, with the differences being that s-caron and z-caron (which were added to Windows-1252 later) are missing, five of the letters with diacritics have been replaced by combining diacritics for Vietnamese tone marks, one has been replaced with the đông sign, and eight others (four per case) have been changed to four otherwise-unsupported Vietnamese letters. Use of combining diacritics means that Windows-1258 can cover the large number of combinations of letters and tone marks in Vietnamese without compromising coverage of control codes or symbols. However it also means that software must be careful to handle conversions between precomposed characters and combining sequences correctly when converting to/from other encodings and makes determining user-visible length of a string more difficult. IBM uses code page 1258 (CCSID 1258 and euro sign extended CCSID 5354) for Windows-1258. UTF-8 is the preferred encoding for Vietnamese in modern applications. Windows-1258 may not always round-trip Unicode encoded Vietnamese due to changes caused by Unicode normalization. Combining diacritics are encoded after the letter in both Windows-1258 and Unicode (like VNI, unlike ANSEL). (en)
  • Windows-1258, znane także jako CP-1258, bądź WinVietnamese, jest 8–bitowym kodowaniem znaków zaprojektowanym do pokrycia języka wietnamskiego, jest używane w systemie Microsoft Windows. Korzysta z . Nie jest kompatybilne z kodowaniem , jest natomiast podobne do Windows-1252, różniąc się brakującymi znakami „Š” i „Ž” (które do CP1252 zostały dodane później), czterema literami z diakrytykami zastąpionymi samymi łączonymi znakami diakrytycznymi, oraz kilkoma innymi zmienionymi kombinacjami litera/znak diakrytyczny. Użycie łączonych diakrytyków spowodowało, że Windows-1258 może pokryć dużą liczbę kombinacji litera/znak diakrytyczny z języka wietnamskiego bez konieczności uszczuplenia pokrycia symboli, bądź znaków kontrolnych. (pl)
dbo:wikiPageExternalLink
dbo:wikiPageID
  • 503149 (xsd:integer)
dbo:wikiPageLength
  • 31259 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID
  • 1091091090 (xsd:integer)
dbo:wikiPageWikiLink
dbp:alias
  • cp1258 (en)
dbp:basedon
dbp:by
dbp:classification
dbp:lang
dbp:mime
  • windows-1258 (en)
dbp:name
  • Windows-1258 (en)
dbp:standard
  • WHATWG Encoding Standard (en)
dbp:wikiPageUsesTemplate
dcterms:subject
gold:hypernym
rdf:type
rdfs:comment
  • Windows-1258 ist eine 8-Bit-Zeichenkodierung des Windows-Betriebssystems. Sie deckt die Orthographie der vietnamesischen Sprache ab. Da diese Orthographie insgesamt 134 Zeichen außer den ASCII-Zeichen verwendet, ist eine einfache Erweiterung des ASCII-Zeichensatzes auf 8-Bit nicht möglich. Windows-1258 löst dieses Problem durch die Verwendung kombinierender Zeichen, die sich mit den Basiskonsonanten verbinden und so die nötigen Kombinationen erzeugen. Der Zeichensatz selber basiert größtenteils auf Windows-1252, enthält jedoch außer den Diakritiken einige weitere vietnamesische Buchstaben und Zeichen. (de)
  • La page de code Windows-1258 (dans le registre IANA des jeux de caractères codés pour l’informatique et les normes Internet, aussi connue comme CP1258) est utilisée dans Microsoft Windows pour représenter les textes en quôc ngu, l’actuelle adaptation de l’écriture latine utilisée pour la langue vietnamienne moderne. C‘est une variante de la page de code Windows-1252 (ou CP1252, utilisée pour les langues d’Europe occidentale à écriture latine), avec quelques positions modifiées : (fr)
  • Windows-1258 is a code page used in Microsoft Windows to represent Vietnamese texts. It makes use of combining diacritical marks. Windows-1258 is compatible with neither the Vietnamese standard (TCVN 5712 / VSCII), nor the various other encodings in use in practice (VISCII, VNI, VPS). Rather, it is very similar to Windows-1252, with the differences being that s-caron and z-caron (which were added to Windows-1252 later) are missing, five of the letters with diacritics have been replaced by combining diacritics for Vietnamese tone marks, one has been replaced with the đông sign, and eight others (four per case) have been changed to four otherwise-unsupported Vietnamese letters. (en)
  • Windows-1258, znane także jako CP-1258, bądź WinVietnamese, jest 8–bitowym kodowaniem znaków zaprojektowanym do pokrycia języka wietnamskiego, jest używane w systemie Microsoft Windows. Korzysta z . Nie jest kompatybilne z kodowaniem , jest natomiast podobne do Windows-1252, różniąc się brakującymi znakami „Š” i „Ž” (które do CP1252 zostały dodane później), czterema literami z diakrytykami zastąpionymi samymi łączonymi znakami diakrytycznymi, oraz kilkoma innymi zmienionymi kombinacjami litera/znak diakrytyczny. (pl)
rdfs:label
  • Windows-1258 (de)
  • Windows-1258 (fr)
  • Windows-1258 (pl)
  • Windows-1258 (en)
owl:sameAs
prov:wasDerivedFrom
foaf:isPrimaryTopicOf
is dbo:wikiPageRedirects of
is dbo:wikiPageWikiLink of
is foaf:primaryTopic of
Powered by OpenLink Virtuoso    This material is Open Knowledge     W3C Semantic Web Technology     This material is Open Knowledge    Valid XHTML + RDFa
This content was extracted from Wikipedia and is licensed under the Creative Commons Attribution-ShareAlike 3.0 Unported License