An Entity of Type: organisation, from Named Graph: http://dbpedia.org, within Data Space: dbpedia.org

Indian Script Code for Information Interchange (ISCII) is a coding scheme for representing various writing systems of India. It encodes the main Indic scripts and a Roman transliteration. The supported scripts are: Bengali–Assamese, Devanagari, Gujarati, Gurmukhi, Kannada, Malayalam, Oriya, Tamil, and Telugu. ISCII does not encode the writing systems of India that are based on Persian, but its writing system switching codes nonetheless provide for Kashmiri, Sindhi, Urdu, Persian, Pashto and Arabic. The Persian-based writing systems were subsequently encoded in the PASCII encoding.

Property Value
dbo:abstract
  • Indian Script Code for Information Interchange (ISCII) ist die nationale indische Norm für die Kodierung der Zeichen der verschiedenen indischen Schriften, die sämtlich Abkömmlinge der Brahmi-Schrift sind. Sie sind prinzipiell sehr ähnlich strukturiert, jedoch sind die Buchstabenformen sehr unterschiedlich. So versucht ISCII, die logische Struktur dieser Schriften zu kodieren, während die Auswahl der speziellen Buchstabenformen von einer Auszeichnungssprache oder einer Schrifttechnik wie OpenType vorgenommen wird. ISCII umfasst die folgenden Schriften: Bengali, Devanagari, Gujarati, Gurmukhi, Kannada, Malayalam, Oriya, Tamilisch und Telugu. Wird ein Text auf eine andere Schrift umgestellt, erfolgt eine automatische Transliteration. ISCII ist ein 8-Bit Zeichensatz, bei dem, wie bei den ISO 8859 und vielen anderen Zeichensätzen, die unteren 128 Zeichen dem ASCII-Standard entsprechen. In Unicode ist die Kodierungsart von ISCII weitgehend beibehalten worden. Hier aber sind die unterschiedlichen Schriften in separaten jeweils 128 Byte großen Codeblöcken im Bereich U+0900 bis U+0DFF kodiert. D9hex: INVUnsichtbares (invisible) Zeichen, mit dem in Verbindung mit Halant (siehe unten) sogenannte Halbformen kombinierender Zeichen isoliert dargestellt werden können, z. B. क (ka) + ् (Halant) + INV = क्‍ .‍ In Unicode folgt auf das Halant U+094D stattdessen das Zeichen ZERO WIDTH JOINER U+200D.INV wird auch als (leeres) Basiszeichen zur Darstellung kombinierender Vokalzeichen verwendet. In Unicode wird stattdessen NBSP U+00A0 oder der gepunktete Kreis ◌ U+25CC verwendet.EFhex: ATRSchalter zur Auswahl einer bestimmten Schriftformatierung oder -sprache bis zum Zeilenende. Steht dazu vor einem Bytecode.F0hex: EXTVedischer Akzent. Auswahl durch folgendes Byte.E8hex: Halant (Virama)Entfernt den vorhergehenden inhärenten Vokal und verbindet Konsonanten zu Clustern, z. B. क (ka) + ् (Halant) + त (ta) = क्त (kta).Die Sequenz ् (Halant) + ् (Halant) erzeugt ein explizites Halant, z. B. क (ka) + ् (Halant) + ् (Halant) + त (ta) = क्‌त.Die Sequenz ् (Halant) + ़ (Nukta) erzeugt Halbkonsonanten, wenn möglich, z. B. क (ka) + ् (Halant) + ़ (Nukta) = क्‍. E9hex: NuktaErzeugt nachgestellt seltenere Zeichen ohne eigenen Code, z. B. क (ka) + ़ (Nukta) = क़ (qa). (de)
  • Indian Script Code for Information Interchange (ISCII) is a coding scheme for representing various writing systems of India. It encodes the main Indic scripts and a Roman transliteration. The supported scripts are: Bengali–Assamese, Devanagari, Gujarati, Gurmukhi, Kannada, Malayalam, Oriya, Tamil, and Telugu. ISCII does not encode the writing systems of India that are based on Persian, but its writing system switching codes nonetheless provide for Kashmiri, Sindhi, Urdu, Persian, Pashto and Arabic. The Persian-based writing systems were subsequently encoded in the PASCII encoding. ISCII has not been widely used outside certain government institutions, although a variant without the mechanism was used on classic Mac OS, Mac OS Devanagari, and it has now been rendered largely obsolete by Unicode. Unicode uses a separate block for each Indic writing system, and largely preserves the ISCII layout within each block. (en)
  • L’IS 13194:91, ou Indian Standard Code for Information Interchange (ISCII), en français Code indien normalisé pour l’échange d’information, est un codage de caractères permettant de représenter plusieurs systèmes d’écriture alphasyllabaires d’Inde et une translittération latine (suffisante pour l’anglais basique), publiée en 1991. Les écritures couvertes sont le bengalî (dont l’assamais), le dévanâgarî, le goudjarâtî, le gourmoukhî, le kannada (ou kannara), le malayalam, l’odia (or oriya), le tamoul et le télougou. Les langues utilisant l’écriture arabe ne sont pas couvertes par l’ISCII. Le codage est basé sur le jeu sur 7 bits ISO/CEI 646 dans sa version américaine (ASCII), complété par une page de code haute, sélectionnable selon l’écriture désirée par des séquences de contrôle ou d’échappement, le codage ISCII utilisant un ensemble de codets sur 8 bits dont l'interprétation est contextuelle : hors du jeu ASCII de base, les autres caractères peuvent être codés selon l’état sur un ou plusieurs codets. Le codage ISCII proposait également un mécanisme de mise en forme du style basé également sur des séquences de contrôle qui étendent la fonction de changement d'écriture aux fonctions classiques de mise en forme (gras, italique, soulignement, détourage, ombrage, inversion vidéo) et de changement de taille (sur les terminaux avec des polices à chasse fixe, en permettant de représenter des demi-caractères ou quarts de caractères, codés de façon répétée en juxtaposition horizontale ou verticale pour représenter le caractère agrandi complet). La mise en œuvre de cette possibilité est cependant restée rare (limitée à quelques logiciels émulateurs de terminaux le plus souvent expérimentaux rarement maintenus), car insuffisante pour une bonne typographie et lisibilité du texte avec des polices à chasse fixe ; elle n'est pas utilisée pour la production de documents de qualité (les logiciels de mise en page n'en ont pas besoin et utilisent des mécanismes génériques plus pratiques pour la mise en forme), et très peu pratique pour la saisie de textes simples ou de bases de données textuelles réutilisables. Aujourd’hui le jeu de caractère universel basé sur les normes ISO/CEI 10646 et Unicode (et encodé dans une de leurs formes normalisées) ont largement supplanté l'ISCII, d'autant plus que le jeu universel offre un support plus avancé et plus complet des différentes écritures, codées de façon simplifiée dans l’ISCII (qui ne peut pas encoder complètement toutes les langues transcrites dans les écritures supportées par l’ISCII) et de façon beaucoup moins contextuelle (ce qui facilite le traitement automatique du texte). Dans les différents blocs maintenant alloués dans le jeu universel pour chaque écriture dans Unicode 1.1, chaque table correspondait à une simple translation de la page haute de l’ISCII par une constante dépendante de l'écriture, les différentes séquences d'échappement et de contrôle contextuel n’étant plus nécessaire. Depuis, le jeu universel a été étendu à d'autres caractères plus rares des mêmes écritures mais non représentés dans l’ISCII. Enfin le jeu universel peut prendre en charge d’autres langues indiennes ou d’ailleurs dans le monde, ce qui permet la création de documents multilingues. Cependant les fonctions de contrôle de la mise en forme ne sont pas codées dans le jeu universel, la mise en forme du texte utilisant des langages de mise en forme (dont les feuilles de style) séparés du codage du texte lui-même. (fr)
  • ISCII (Indian Script Code for Information Interchange सूचना अन्तरविनिमय के लिए भारतीय लिपि संहिता、情報交換用インド文字符号 IS13194:1991) はインドの各種書記系を表現するための符号化方式である。主要なインド系文字とローマ字転写を符号化する。対応している用字系は以下の通り: アッサム文字、ベンガル文字、デーヴァナーガリー、グジャラーティー文字、グルムキー文字、カンナダ文字、マラヤーラム文字、オリヤー文字、タミル文字、およびテルグ文字。ISCIIはアラビア文字に基づく書記系を符号化しないが、それにもかかわらず、カシミール語、シンド語、ウルドゥー語、ペルシア語、パシュトー語およびアラビア語の書記系切り替え符号が提供されている。アラビア文字に基づく書記系は、その後PASCII文字コードで符号化された。 ブラーフミー文字から派生した書記系はそのほとんどが類似した構造を持つが、文字の形状が異なるため、ISCIIは同じ音価の文字を同じ符号位置に符号化して、各種の用字系を重ね合わせている。たとえば、ISCII符号0xB3 0xDBは[ki]を表す。これはデーヴァナーガリーではकिのように、グルムキー文字ではਕਿのように、そしてタミル文字ではகிのように描画される。書記系はリッチテキストではマークアップによって選択され、プレーンテキストでは後述のATRを用いて選択される。 単一の符号化を使用する動機の1つは、ある書記系から他のものへの翻字が容易になることである。しかしながら、あまりに非互換性が大きいためこれは実際には現実的な考えではない。ISCIIについて(英語)を参照。 ISCIIは固定長の8ビット符号である。下位128個の符号位置はASCIIそのままで、上位128個の符号位置がISCII特有である。ISCIIではデフォルトで使われる「デフォルト書記系」を指定する手段は提供されていない。 (ja)
  • L'Indian Standard Code for Information Interchange o ISCII (in italiano: Codice standard indiano per lo scambio di informazioni) è uno schema di codifiche per rappresentare diversi sistemi di scrittura dell'India.Codifica le principali scritture indiane e una traslitterazione latina (romanizzazione). Le scritture supportate sono: , Devanagari, , Gurmukhi, , Malayalam, Oriya, Tamil e Telugu. L'ISCII non codifica i sistemi di scrittura dell'India basati sull'alfabeto arabo, che sono invece codificati dal PASCII. (it)
  • 印度文字資訊交換碼(英:Indian Script Code for Information Interchange,縮:ISCII,印度文: सूचना अन्तरविनिमय के लिए भारतीय लिपि संहिता,IS13194:1991)是一種編碼系統,其對象為多種在印度所使用的書寫系統。它包含婆羅米系文字,所支援的文字包含了:、孟加拉文、天城文、古吉拉特文、古木基文、卡納達文、馬拉雅拉姆文、奧里亞文、泰米爾文和泰盧固文。它不支援由阿拉伯文所衍生出來的印度書寫系統。但它仍混和使用喀什米爾語、信德語、烏爾都語、波斯語、普什圖語和阿拉伯語。由阿拉伯語衍生的書寫系統則採用之後的波斯阿拉伯文字資訊交換碼。 婆羅米系書寫系統在結構上類似,只是使用不同的字母外形。此編碼將相同音的編在相同碼位。如 0xB3 0xDB 代表 [ki]。在天城文中産生 कि ,在古木基文中為 ਕਿ,在泰米爾文中則為 கி 。在富文件可以利用標記來選擇或在純文件中使用 ATR 碼。 使用此方法的動機為,它可以很容易地在不同書寫系統間做轉寫。然而,其彼此間的不相容又使得這在實作不容易。見 關於印度文字資訊交換碼(页面存档备份,存于互联网档案馆)。 此編碼是八位元編碼。其較低的 128 碼位為純ASCII,其較高 128 碼位為此編碼專用。除了表示字符的碼位,此編碼還包括一個記憶用碼位,用來指示接下來的位元組包含兩種資訊之一。一種會改變書寫系統直到下一個書寫系統指示器或行結尾。另一種則選擇顯示模式,如粗體或斜體。此編碼並未提供預設書寫系統。 (zh)
dbo:wikiPageExternalLink
dbo:wikiPageID
  • 533706 (xsd:integer)
dbo:wikiPageLength
  • 43605 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID
  • 1118245354 (xsd:integer)
dbo:wikiPageWikiLink
dbp:wikiPageUsesTemplate
dcterms:subject
gold:hypernym
rdf:type
rdfs:comment
  • L'Indian Standard Code for Information Interchange o ISCII (in italiano: Codice standard indiano per lo scambio di informazioni) è uno schema di codifiche per rappresentare diversi sistemi di scrittura dell'India.Codifica le principali scritture indiane e una traslitterazione latina (romanizzazione). Le scritture supportate sono: , Devanagari, , Gurmukhi, , Malayalam, Oriya, Tamil e Telugu. L'ISCII non codifica i sistemi di scrittura dell'India basati sull'alfabeto arabo, che sono invece codificati dal PASCII. (it)
  • Indian Script Code for Information Interchange (ISCII) ist die nationale indische Norm für die Kodierung der Zeichen der verschiedenen indischen Schriften, die sämtlich Abkömmlinge der Brahmi-Schrift sind. Sie sind prinzipiell sehr ähnlich strukturiert, jedoch sind die Buchstabenformen sehr unterschiedlich. So versucht ISCII, die logische Struktur dieser Schriften zu kodieren, während die Auswahl der speziellen Buchstabenformen von einer Auszeichnungssprache oder einer Schrifttechnik wie OpenType vorgenommen wird. (de)
  • Indian Script Code for Information Interchange (ISCII) is a coding scheme for representing various writing systems of India. It encodes the main Indic scripts and a Roman transliteration. The supported scripts are: Bengali–Assamese, Devanagari, Gujarati, Gurmukhi, Kannada, Malayalam, Oriya, Tamil, and Telugu. ISCII does not encode the writing systems of India that are based on Persian, but its writing system switching codes nonetheless provide for Kashmiri, Sindhi, Urdu, Persian, Pashto and Arabic. The Persian-based writing systems were subsequently encoded in the PASCII encoding. (en)
  • L’IS 13194:91, ou Indian Standard Code for Information Interchange (ISCII), en français Code indien normalisé pour l’échange d’information, est un codage de caractères permettant de représenter plusieurs systèmes d’écriture alphasyllabaires d’Inde et une translittération latine (suffisante pour l’anglais basique), publiée en 1991. (fr)
  • ISCII (Indian Script Code for Information Interchange सूचना अन्तरविनिमय के लिए भारतीय लिपि संहिता、情報交換用インド文字符号 IS13194:1991) はインドの各種書記系を表現するための符号化方式である。主要なインド系文字とローマ字転写を符号化する。対応している用字系は以下の通り: アッサム文字、ベンガル文字、デーヴァナーガリー、グジャラーティー文字、グルムキー文字、カンナダ文字、マラヤーラム文字、オリヤー文字、タミル文字、およびテルグ文字。ISCIIはアラビア文字に基づく書記系を符号化しないが、それにもかかわらず、カシミール語、シンド語、ウルドゥー語、ペルシア語、パシュトー語およびアラビア語の書記系切り替え符号が提供されている。アラビア文字に基づく書記系は、その後PASCII文字コードで符号化された。 単一の符号化を使用する動機の1つは、ある書記系から他のものへの翻字が容易になることである。しかしながら、あまりに非互換性が大きいためこれは実際には現実的な考えではない。ISCIIについて(英語)を参照。 (ja)
  • 印度文字資訊交換碼(英:Indian Script Code for Information Interchange,縮:ISCII,印度文: सूचना अन्तरविनिमय के लिए भारतीय लिपि संहिता,IS13194:1991)是一種編碼系統,其對象為多種在印度所使用的書寫系統。它包含婆羅米系文字,所支援的文字包含了:、孟加拉文、天城文、古吉拉特文、古木基文、卡納達文、馬拉雅拉姆文、奧里亞文、泰米爾文和泰盧固文。它不支援由阿拉伯文所衍生出來的印度書寫系統。但它仍混和使用喀什米爾語、信德語、烏爾都語、波斯語、普什圖語和阿拉伯語。由阿拉伯語衍生的書寫系統則採用之後的波斯阿拉伯文字資訊交換碼。 婆羅米系書寫系統在結構上類似,只是使用不同的字母外形。此編碼將相同音的編在相同碼位。如 0xB3 0xDB 代表 [ki]。在天城文中産生 कि ,在古木基文中為 ਕਿ,在泰米爾文中則為 கி 。在富文件可以利用標記來選擇或在純文件中使用 ATR 碼。 使用此方法的動機為,它可以很容易地在不同書寫系統間做轉寫。然而,其彼此間的不相容又使得這在實作不容易。見 關於印度文字資訊交換碼(页面存档备份,存于互联网档案馆)。 (zh)
rdfs:label
  • Indian Script Code for Information Interchange (de)
  • ISCII (fr)
  • Indian Script Code for Information Interchange (en)
  • Indian Standard Code for Information Interchange (it)
  • ISCII (ja)
  • 印度文字資訊交換碼 (zh)
owl:sameAs
prov:wasDerivedFrom
foaf:isPrimaryTopicOf
is dbo:wikiPageRedirects of
is dbo:wikiPageWikiLink of
is dbp:basedon of
is dbp:sources of
is foaf:primaryTopic of
Powered by OpenLink Virtuoso    This material is Open Knowledge     W3C Semantic Web Technology     This material is Open Knowledge    Valid XHTML + RDFa
This content was extracted from Wikipedia and is licensed under the Creative Commons Attribution-ShareAlike 3.0 Unported License