About: KOI8-R

An Entity of Type: fictional character, from Named Graph: http://dbpedia.org, within Data Space: dbpedia.org

KOI8-R (RFC 1489) is an 8-bit character encoding, derived from the KOI-8 encoding by the programmer Andrei Chernov in 1993 and designed to cover Russian, which uses a Cyrillic alphabet. KOI8-R was based on Russian Morse code, which was created from a phonetic version of Latin Morse code. As a result, Russian Cyrillic letters are in pseudo-Roman order rather than the normal Cyrillic alphabetical order. Although this may seem unnatural, if the 8th bit is stripped, the text is partially readable in ASCII and may convert to syntactically correct KOI-7. For example, "Русский Текст" in KOI8-R becomes rUSSKIJ tEKST ("Russian Text").

Property Value
dbo:abstract
  • KOI8-R aus der KOI8-Familie ist eine 8-Bit-Zeichenkodierung des kyrillischen Alphabets, wie es für die russische Sprache benutzt wird. KOI8-R ist eine Übermenge von ASCII und enthält somit auch die 26 Buchstaben des lateinischen Alphabets. Die Kodierung kann auch für Bulgarisch benutzt werden, während für Ukrainisch eine verwandte Zeichenkodierung KOI8-U entworfen wurde, die vier zusätzlich erforderliche Codes enthält. KOI8 ist die russische Abkürzung für „Kod Obmena Informazijei, 8 bit“ (Код Обмена Информацией, 8 бит), übersetzt „Code für Informationsaustausch, 8 Bit“. KOI8-R ist beschrieben in RFC 1489 und ist IANA-registriert und für MIME zugelassen. Die KOI8-Zeichenkodierungen sind so entworfen, dass die kyrillischen Buchstaben nicht in ihrer natürlichen alphabetischen Ordnung angeordnet sind, sondern in der alphabetischen Ordnung der lateinischen Buchstaben, die sich bei einer (groben) Transliteration ergeben. Damit ergibt sich die interessante Eigenschaft, dass beim Weglassen des höchstwertigen Bits kyrillischer Text als lateinische Transliteration (mit Mühe) lesbar bleibt. Dabei wurde die Zuordnung so gewählt, dass Groß- und Kleinbuchstaben vertauscht werden. Zum Beispiel wird aus Русский Текст bei Weglassen des MSB rUSSKIJ tEKST. Diese Eigenschaft ist heute kaum mehr als eine historische Kuriosität, da es fast keine Übertragungswege mehr gibt, die nicht 8-bit clean sind, und weil andererseits die „automatische“ Transliteration einer echten Transliteration gegenüber minderwertig ist. Alternativen zu KOI8 sind Windows-1251, ISO 8859-5 und Unicode. (de)
  • KOI8-R es una codificación de caracteres de 8 bits, diseñado para el idioma ruso, para el uso del alfabeto cirílico. También sirve para el idioma búlgaro. Una derivación de esta codificación es el , el cual agrega caracteres para el idioma ucraniano. La codificación original KOI-8 fue diseñado por las autoridades de la Unión Soviética en 1974. KOI8 sigue siendo más utilizado que la norma , la cual realmente no se utiliza. Otra codificación de caracteres cirílicos es el Windows-1251. Una forma de representar caracteres cirílicos junto con otros caracteres no latinos es Unicode. En ruso, KOI8 es el acrónimo de Kod Obmena Informatsiey, 8 bit (en caracteres cirílicos: Код Обмена Информацией, 8 бит) el cual en español significa "código para el intercambio de información, 8 bits". Los conjuntos de caracteres KOI8 tiene la propiedad de que las letras cirílicas rusas están en un orden pseudo-romano en lugar del orden natural del alfabeto cirílico como en la norma ISO 8859-5. A pesar de que esto no se ve natural, tiene una propiedad muy útil la cual es que cuando se elimina el 8.º bit, el texto se vuelve parcialmente legible en ASCII y puede convertirse sintacticamente en forma correcta al . Por ejemplo, Русский Текст en KOI8-R ,si se elimina el 8.º bit, se convierte en rUSSKIJ tEKST ("Texto ruso"); cuando se quiere interprear la cadena ASCII rUSSKIJ tEKST como KOI7 resulta Русский Текст. (es)
  • KOI8-R (RFC 1489) is an 8-bit character encoding, derived from the KOI-8 encoding by the programmer Andrei Chernov in 1993 and designed to cover Russian, which uses a Cyrillic alphabet. KOI8-R was based on Russian Morse code, which was created from a phonetic version of Latin Morse code. As a result, Russian Cyrillic letters are in pseudo-Roman order rather than the normal Cyrillic alphabetical order. Although this may seem unnatural, if the 8th bit is stripped, the text is partially readable in ASCII and may convert to syntactically correct KOI-7. For example, "Русский Текст" in KOI8-R becomes rUSSKIJ tEKST ("Russian Text"). KOI8 stands for Kod Obmena Informatsiey, 8 bit (Russian: Код Обмена Информацией, 8 бит) which means "Code for Information Exchange, 8 bit". In Microsoft Windows, KOI8-R is assigned the code page number 20866. In IBM, KOI8-R is assigned code page 878. KOI8-R also happens to cover Bulgarian, but has not been used for that purpose since CP1251 was accepted. The use of these older code pages is being replaced with Unicode as a more common way to represent Cyrillic together with other languages. Unicode is preferred to KOI-8 and its variants (KOI8-R, the most popular variant, is used by less than 0.004% of websites, mainly used for Russians, which prefer other encodings, and so do Bulgarians too) or other Cyrillic encodings in modern applications, especially on the Internet, making UTF-8 the dominant encoding for web pages. (For further discussion of Unicode's complete coverage, of 436 Cyrillic letters/code points, including for Old Cyrillic, and how single-byte character encodings, such as Windows-1251 and KOI8 variants, cannot provide this, see Cyrillic script in Unicode.) (en)
  • KOI8-R (Код Обмена Информацией, 8 бит) est une page de code, conçue pour représenter les lettres cyrilliques (russe, par exemple). La RFC adéquate est RFC 1489. Il y a aussi une description GOST 19768-74. Le codage KOI8-R est vu comme le standard de facto pour les systèmes d'exploitation de type UNIX en Russie. (fr)
  • KOI8-R è un sistema di codifica di caratteri a 8-bit progettato per essere adoperato con il russo e con tutte quelle lingue che utilizzano l'alfabeto cirillico. Il sistema originale, il KOI8, il cui nome sta per Kod Obmena Informaciej, 8 bit (in russo Код Обмена Информацией, 8 бит, Codice per lo scambio di informazioni, 8 bit), fu progettato dalle autorità sovietiche nel 1974 e da allora ne sono stati creati vari derivati, tra cui il KOI8-U, che aggiunge al KOI8 i caratteri dell'ucraino. Il KOI8-R rimase il sistema di codifica più utilizzato anche per il bulgaro fino a che per quest'ultimo non fu universalmente accettato l'uso del CP-1251. Il KOI8-R ed il CP-1251 sono ancora molto più utilizzati dell'ISO 8859-5, che in effetti non ha mai trovato grande utilizzo, anche se oggi, ormai, nella stragrande maggioranza degli utilizzi moderni, viene loro preferito l'Unicode. Il KOI8 ed i sistemi da lui derivati hanno la particolarità di avere le lettere cirilliche disposte in ordine pseudo-latino piuttosto che nel comune ordine dell'alfabeto cirillico come hanno per esempio l'ISO 8859-5 e l'Unicode. Sebbene questo possa sembrare anti intuitivo, questa caratteristica risulta utile per il fatto che se l'ottavo bit viene eliminato, il testo è parzialmente leggibile utilizzando il sistema ASCII e può essere convertito in un testo in KOI7 sintatticamente corretto. Per esempio se dalla scritta in KOI8-R "Русский Текст" viene eliminato l'ottavo bit, essa diventa rUSSKIJ tEKST ("Testo russo") ed un tentativo di interpretare tale stringa con il KOI7 porta a "РУССКИЙ ТЕКСТ". Il KOI8 fu creato basandosi sul codice Morse russo (che a sua volta fu creato dal codice Morse internazionale basandosi sulle assonanze) e la connessione riguardante l'ordine delle lettere tra il codice Morse russo e quello internazionale è la stessa che esiste tra il KOI8 e l'ASCII. Nel sistema operativo Microsoft Windows, il numero di code page assegnato al sistema KOI8-R è 20866, nei sistemi di IBM è invece il numero 878. (it)
  • KOI8-Rはロシア語のキリル文字を扱うよう設計された、8ビットの文字コードである。ブルガリア語も扱える。ここから派生したKOI8-Uには、ウクライナ語の文字が追加されている。最初のKOI-8符号はソビエト当局により1974年に設計された。 KOI8はISO 8859-5よりもはるかに広く使われ続けている。ISO 8859-5が人気だったことはない。他のよく知られたキリル語文字コードはである。キリル語を他の非ラテン言語と一緒に表現する方法としてUnicodeがある。 KOI8はロシア語でKod Obmena Informatsiey, 8 bit (Код Обмена Информацией, 8 бит) の略であり、「情報交換用符号、8ビット」という意味である。 KOIシリーズの文字集合におけるロシア語のキリル文字は、ISO 8859-5のような自然なキリル文字のアルファベット順ではなく、主に発音の対応するASCIIのラテン文字の符号位置の順で並べられているという特性を持つ。さらに、大文字と小文字の符号位置は逆になっている。これは一見して不自然に見えるが、8ビット目が欠落する文字化けに対処できるという利点がある。たとえば、KOI8-Rで表現した"Русский Текст" (ラテン文字転写例: Russkij Tjekst)は8ビット目を落とすと"rUSSKIJ tEKST"になる。大文字と小文字が逆になることで文字化けが発生したことが分かり、文字の発音も近いため、そのまま読めるか、少なくとも復元することはできる。また、これは正しいKOI-7として解釈できる。ASCII文字列"rUSSKIJ tEKST"をKOI-7(КОИ-7 Н1)として解釈すれば"Русский Текст"である。一方で、文字コードでソートしても正しいキリル文字の順序にならないという欠点もある。 (ja)
  • KOI8-R is een standaard voor 8-bits codering van tekst in het Cyrillische alfabet. In het Russisch staat KOI8 voor Kod Obmena Informatsiey 8-bit (Код Обмена Информацией, 8 бит), wat "8-bitcode voor informatieoverdracht" betekent. De oorspronkelijke KOI8-codering werd in 1974 door de Sovjet-autoriteiten ontworpen. Een variant op de KOI8-R-codering is KOI8-U, die Oekraïense tekens gebruikt. KOI8 wordt veel meer gebruikt dan , dat nooit echt een succes werd. ISO 8859-5 is de Cyrillische variant van het in het Nederlands bekendere ISO 8859-1. KOI8-R is een uitbreiding van ASCII, waarbij de Cyrillische tekens codes boven de 127 gekregen hebben. De codering is niet in de volgorde van het Cyrillische alfabet, maar volgens de overeenkomstige Latijnse tekens, door 128 bij hun waarde op te tellen en dan hoofd- en kleine letters te verwisselen. De letters zonder Latijns equivalent bezetten de overige codes met gelijke meest significante 3 bits. Door bit 7 van de code te wissen kan dan al een gedeeltelijke transliteratie worden verkregen, bijvoorbeeld: "Русский Текст" in KOI8-R wordt "rUSSKIJ tEKST" ("Russische tekst") en dan wordt de tekst wel ineens in het Latijnse alfabet leesbaar. (nl)
  • KOI8-R是KOI-8系列的斯拉夫文字8位元编码,供俄语及保加利亚语使用。在Unicode未流行之前,KOI8-R 是最为广泛使用的俄语编码,使用率甚至比ISO/IEC 8859-5还高。 Andrey Chernov 把 KOI8-R 整理后,提交了给互联网协会(ISOC),成了 RFC 1489 文件 ("Registration of a cyrillic Character Set")。 在上表中,0x20是空格、0x9A是不换行空格。 0x95 在 RFC 1489 之中是 U+2219 (∙),但有时会使用 U+2022 (·) 以配合 Windows-1251 编码。 (zh)
dbo:wikiPageExternalLink
dbo:wikiPageID
  • 612349 (xsd:integer)
dbo:wikiPageLength
  • 23649 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID
  • 1118130104 (xsd:integer)
dbo:wikiPageWikiLink
dbp:alias
  • cp878 (en)
dbp:basedon
dbp:classification
  • 8 (xsd:integer)
dbp:extends
dbp:lang
dbp:name
  • KOI8-R (en)
dbp:otherrelated
dbp:wikiPageUsesTemplate
dcterms:subject
gold:hypernym
rdf:type
rdfs:comment
  • KOI8-R (Код Обмена Информацией, 8 бит) est une page de code, conçue pour représenter les lettres cyrilliques (russe, par exemple). La RFC adéquate est RFC 1489. Il y a aussi une description GOST 19768-74. Le codage KOI8-R est vu comme le standard de facto pour les systèmes d'exploitation de type UNIX en Russie. (fr)
  • KOI8-R是KOI-8系列的斯拉夫文字8位元编码,供俄语及保加利亚语使用。在Unicode未流行之前,KOI8-R 是最为广泛使用的俄语编码,使用率甚至比ISO/IEC 8859-5还高。 Andrey Chernov 把 KOI8-R 整理后,提交了给互联网协会(ISOC),成了 RFC 1489 文件 ("Registration of a cyrillic Character Set")。 在上表中,0x20是空格、0x9A是不换行空格。 0x95 在 RFC 1489 之中是 U+2219 (∙),但有时会使用 U+2022 (·) 以配合 Windows-1251 编码。 (zh)
  • KOI8-R aus der KOI8-Familie ist eine 8-Bit-Zeichenkodierung des kyrillischen Alphabets, wie es für die russische Sprache benutzt wird. KOI8-R ist eine Übermenge von ASCII und enthält somit auch die 26 Buchstaben des lateinischen Alphabets. Die Kodierung kann auch für Bulgarisch benutzt werden, während für Ukrainisch eine verwandte Zeichenkodierung KOI8-U entworfen wurde, die vier zusätzlich erforderliche Codes enthält. KOI8 ist die russische Abkürzung für „Kod Obmena Informazijei, 8 bit“ (Код Обмена Информацией, 8 бит), übersetzt „Code für Informationsaustausch, 8 Bit“. (de)
  • KOI8-R (RFC 1489) is an 8-bit character encoding, derived from the KOI-8 encoding by the programmer Andrei Chernov in 1993 and designed to cover Russian, which uses a Cyrillic alphabet. KOI8-R was based on Russian Morse code, which was created from a phonetic version of Latin Morse code. As a result, Russian Cyrillic letters are in pseudo-Roman order rather than the normal Cyrillic alphabetical order. Although this may seem unnatural, if the 8th bit is stripped, the text is partially readable in ASCII and may convert to syntactically correct KOI-7. For example, "Русский Текст" in KOI8-R becomes rUSSKIJ tEKST ("Russian Text"). (en)
  • KOI8-R es una codificación de caracteres de 8 bits, diseñado para el idioma ruso, para el uso del alfabeto cirílico. También sirve para el idioma búlgaro. Una derivación de esta codificación es el , el cual agrega caracteres para el idioma ucraniano. La codificación original KOI-8 fue diseñado por las autoridades de la Unión Soviética en 1974. KOI8 sigue siendo más utilizado que la norma , la cual realmente no se utiliza. Otra codificación de caracteres cirílicos es el Windows-1251. Una forma de representar caracteres cirílicos junto con otros caracteres no latinos es Unicode. (es)
  • KOI8-R è un sistema di codifica di caratteri a 8-bit progettato per essere adoperato con il russo e con tutte quelle lingue che utilizzano l'alfabeto cirillico. Il sistema originale, il KOI8, il cui nome sta per Kod Obmena Informaciej, 8 bit (in russo Код Обмена Информацией, 8 бит, Codice per lo scambio di informazioni, 8 bit), fu progettato dalle autorità sovietiche nel 1974 e da allora ne sono stati creati vari derivati, tra cui il KOI8-U, che aggiunge al KOI8 i caratteri dell'ucraino. Il KOI8-R rimase il sistema di codifica più utilizzato anche per il bulgaro fino a che per quest'ultimo non fu universalmente accettato l'uso del CP-1251. (it)
  • KOI8-Rはロシア語のキリル文字を扱うよう設計された、8ビットの文字コードである。ブルガリア語も扱える。ここから派生したKOI8-Uには、ウクライナ語の文字が追加されている。最初のKOI-8符号はソビエト当局により1974年に設計された。 KOI8はISO 8859-5よりもはるかに広く使われ続けている。ISO 8859-5が人気だったことはない。他のよく知られたキリル語文字コードはである。キリル語を他の非ラテン言語と一緒に表現する方法としてUnicodeがある。 KOI8はロシア語でKod Obmena Informatsiey, 8 bit (Код Обмена Информацией, 8 бит) の略であり、「情報交換用符号、8ビット」という意味である。 (ja)
  • KOI8-R is een standaard voor 8-bits codering van tekst in het Cyrillische alfabet. In het Russisch staat KOI8 voor Kod Obmena Informatsiey 8-bit (Код Обмена Информацией, 8 бит), wat "8-bitcode voor informatieoverdracht" betekent. De oorspronkelijke KOI8-codering werd in 1974 door de Sovjet-autoriteiten ontworpen. Een variant op de KOI8-R-codering is KOI8-U, die Oekraïense tekens gebruikt. KOI8 wordt veel meer gebruikt dan , dat nooit echt een succes werd. ISO 8859-5 is de Cyrillische variant van het in het Nederlands bekendere ISO 8859-1. (nl)
rdfs:label
  • KOI8-R (de)
  • KOI8-R (es)
  • KOI8-R (en)
  • KOI8-R (fr)
  • KOI8-R (it)
  • KOI8-R (nl)
  • KOI8-R (ja)
  • KOI8-R (zh)
owl:sameAs
prov:wasDerivedFrom
foaf:isPrimaryTopicOf
is dbo:knownFor of
is dbo:wikiPageRedirects of
is dbo:wikiPageWikiLink of
is dbp:basedon of
is dbp:extensions of
is dbp:knownFor of
is dbp:map of
is dbp:otherrelated of
is foaf:primaryTopic of
Powered by OpenLink Virtuoso    This material is Open Knowledge     W3C Semantic Web Technology     This material is Open Knowledge    Valid XHTML + RDFa
This content was extracted from Wikipedia and is licensed under the Creative Commons Attribution-ShareAlike 3.0 Unported License