About: UTF-7

An Entity of Type: fictional character, from Named Graph: http://dbpedia.org, within Data Space: dbpedia.org

UTF-7 (7-bit Unicode Transformation Format) is an obsolete variable-length character encoding for representing Unicode text using a stream of ASCII characters. It was originally intended to provide a means of encoding Unicode text for use in Internet E-mail messages that was more efficient than the combination of UTF-8 with quoted-printable. UTF-7 has never has been an official standard of the Unicode Consortium. It is known to have security issues, which is why software has been changed to disable its use. It is prohibited in HTML 5.

Property Value
dbo:abstract
  • UTF-7 (7-bit Unicode Transformation Format) és una codificació de caràcters de longitud variable que va ser proposada per representar text codificat amb Unicode utilitzant un flux de caràcters ASCII, per ser usat, per exemple en missatges de correu electrònic d'Internet. Malgrat el nom, UTF-7 no és un format de transformació i no forma part de l'estàndard Unicode. El protocol bàsic de transport de missatges de correu electrònic a Internet, SMTP especifica que el format de transmissió és ASCII i no permet valors de bytes fora d'aquest rang. MIME proveeix una manera d'especificar un , permetent l'ús de diferents conjunts de caràcters incloent UTF-8 i UTF-16. No obstant això, la infraestructura de transmissió subjacent encara no garanteix suport per a 8 bits i per tant és necessari codificar el contingut per poder transmetre-ho. Per desgràcia, base64 té el problema de fer illegibles fins i tot els caràcters ASCII i la combinació de UTF-8 amb produeix un format molt ineficient, ja que requereixen entre 6 a 9 bytes per cada caràcter no ASCII dins de i 12 bytes per a caràcters fora de . Seguint les regles de codificació de UTF-7 és possible enviar text en un correu electrònic sense necessitat d'utilitzar un transfer encoding de MIME diferent, però tot i així ha de ser explícitament identificat amb el conjunt de caràcters del text. Si és utilitzat en capçaleres de correu electrònic com "Subject:" UTF-7 ha de ser contingut dins d'un encoded word identificant el conjunt de caràcters. Atès que encoded word obliga a l'ús de o base64, UTF-7 està dissenyat per no fer servir el símbol "=" com un caràcter d'escapament per evitar conflictes quan es combini amb . UTF-7 generalment no s'utilitza com una representació nativa dins d'aplicacions, ja que és un procés bastant difícil de manejar. També s'ha introduït amb propòsits similars, aquest redueix la necessitat de codificar missatges amb format 7-bit. Tot i els avantatges de mida que presenta sobre la combinació d'UTF-8 ja sigui amb o base64, el no recomana la seva ús. En el protocol de recuperació de missatges IMAP actualment s'utilitza una forma modificada de UTF-7. Vegeu la secció 5.1.3 de RFC 3501 per més detalls. (ca)
  • UTF-7 ist eine Kodierung des Unicode-Zeichensatzes, die in RFC 2152 definiert wird. UTF-7 ist trotz der Namensähnlichkeit zu anderen Kodierungen nicht Bestandteil des Unicode-Standards. UTF-7 erlaubt die Verwendung von Unicode in nicht 8-bit-festen Umgebungen. (de)
  • UTF-7 (7-bit Unicode Transformation Format) es una codificación de caracteres de longitud variable que fue propuesta para representar texto codificado con Unicode usando un flujo de caracteres ASCII, para ser usado, por ejemplo en mensajes de correo electrónico de Internet. A pesar del nombre, UTF-7 no es un formato de transformación y no forma parte del estándar Unicode. El protocolo básico de transporte de mensajes de correo electrónico en Internet, SMTP especifica que el formato de transmisión es ASCII y no permite valores de bytes fuera de ese rango. MIME provee una forma de especificar un conjunto de caracteres, permitiendo el uso de diferentes conjuntos de caracteres incluyendo UTF-8 y UTF-16. Sin embargo, la infraestructura de transmisión que subyace aún no garantiza soporte para 8-bit y por tanto es necesario codificar el contenido para poder transmitirlo. Por desgracia, base64 tiene el problema de hacer ilegibles incluso los caracteres ASCII y la combinación de UTF-8 con Quoted-Printable produce un formato muy ineficiente puesto que requieren entre 6 a 9 bytes por cada carácter no ASCII dentro de y 12 bytes para caracteres fuera de . Siguiendo las reglas de codificación de UTF-7 es posible enviar texto en un correo electrónico sin necesidad de utilizar un transfer encoding de MIME diferente, pero aun así debe ser explícitamente identificado con el conjunto de caracteres del texto. Si es utilizado en encabezados de correo electrónico como "Subject:" UTF-7 debe ser contenido dentro de un encoded word identificando el conjunto de caracteres. Dado que encoded word obliga al uso de quoted-printable o base64, UTF-7 está diseñado para no usar el símbolo "=" como un carácter de escape para evitar conflictos cuando se combine con quoted-printable. UTF-7 generalmente no se utiliza como una representación nativa dentro de aplicaciones dado que es un proceso bastante difícil de manejar. También se ha introducido 8BITMIME con propósitos similares, este reduce la necesidad de codificar mensajes con formato 7-bit. A pesar de las ventajas de tamaño que presenta sobre la combinación de UTF-8 ya sea con quuoted-printable o base64, el no recomienda su uso. En el protocolo de recuperación de mensajes IMAP actualmente se utiliza una forma modificada de UTF-7. Véase la sección 5.1.3 de RFC 3501 para más detalles. (es)
  • UTF-7 (UCS ou Unicode transformation format 7 bits) est un codage de caractères informatiques à longueur variable conçu pour coder l’ensemble des caractères internationaux d’Unicode dans le courrier électronique de manière plus efficace que l’UTF-8 à l’aide de quoted-printable. UTF-7 n’est pas une norme Unicode, le standard Unicode ne mentionne que UTF-8, UTF-16 et UTF-32. UTF-7 est proposé pour la première fois comme protocole expérimental dans le , A Mail-Safe Transformation Format of Unicode (Un format de transformation d’Unicode sûr pour le courrier). Cet RFC est rendu obsolète par le , un RFC informel qui n’est jamais devenu une norme et qui spécifie clairement qu’il n’est pas une norme Internet. Malgré cela, le est cité comme définition de l’UTF-7 dans la liste des codages de caractères de l’IANA. définit une version modifiée parfois identifiée comme UTF-7, mUTF-7, et l’utilise dans le protocole IMAP. * Portail de l’informatique * Portail de l’écriture (fr)
  • UTF-7(ユーティーエフなな、ユーティーエフセブン)はISO/IEC 10646(UCS)とUnicodeで使える7ビット符号単位の文字符号化形式及び文字符号化スキーム。 7ビットでしか送信できない制限があるプロトコル上のメールやニュースなどの環境で、その体系上でUnicodeのメールを送信可能にするために作られた規格である。 現在では正しく実装されていないアプリケーション上でセキュリティー上の脆弱性を発生させることがあることから、あまり使われなくなっている。 IMAP4では、UTF-7を変更した規格である修正UTF-7の規格があり、この規格は2010年代現在においては頻繁に使用される。 (ja)
  • UTF-7 (7-bit Unicode Transformation Format) is an obsolete variable-length character encoding for representing Unicode text using a stream of ASCII characters. It was originally intended to provide a means of encoding Unicode text for use in Internet E-mail messages that was more efficient than the combination of UTF-8 with quoted-printable. UTF-7 (according to its RFC) isn't a "Unicode Transformation Format", as the definition can only encode code points in the BMP (the first 65536 Unicode code points, which does not include emojis and many other characters). However if a UTF-7 translator is to/from UTF-16 then it can (and probably does) encode each surrogate half as though it was a 16-bit code point, and thus can encode all code points. It is unclear if other UTF-7 software (such as translators to UTF-32 or UTF-8) support this. UTF-7 has never has been an official standard of the Unicode Consortium. It is known to have security issues, which is why software has been changed to disable its use. It is prohibited in HTML 5. (en)
  • UTF-7(7비트 유니코드 변환 포맷, 7-bit Unicode Transformation Format)은 아스키 문자의 스트림을 사용하여 유니코드를 표현하는 가변 길이의 문자 인코딩이다. 원래는 UTF-8을 과 결합해서 사용하는 것보다 더 효율적인 인터넷 이메일 메시지에 사용할 목적으로 유니코드 텍스트를 인코딩하는 수단으로서 제공하는 것이 목적이다. UTF-7를 사용하는 웹사이트는 전체 웹사이트 가운데 0.003% 미만이다. UTF-8이 2009년 이후부터 월드 와이드 웹의 우세한 인코딩 방식이 되고 있다. (ko)
  • UTF-7 (ang. 7-bit ) – sposób zapisu tekstu w formacie Unicode przy użyciu zmiennej liczby znaków ASCII, nadający się na przykład do użycia w wiadomościach MIME. Wiadomości e-mail wysyłane przy użyciu MIME muszą być zapisane wyłącznie przy użyciu kodów ASCII, więc każdy używający bezpośrednio ośmio- lub szesnastobitowego unikodu (na przykład UTF-16) jest traktowany jako wadliwy. Unikod zapisany przy użyciu UTF-7 może być przesyłany bez użycia nagłówka Content-Transfer-Encoding (który specyfikuje sposób reprezentacji danych binarnych za pomocą tekstu ASCII), ale pod warunkiem, że kodowanie znaków zostanie jawnie określone. Dodatkowo, przy użyciu UTF-7 w nagłówkach (np. Subject:), należy wykorzystać Encoded-Word ze standardu MIME, żeby to ujawnić. Główną wadą UTF-7 jest jego niewygodne przetwarzanie: większość znaków ASCII może kodować niemal dowolne znaki Unicode, a każdy znak Unicode można zakodować na wiele sposobów (w zależności od sąsiednich znaków). Internet Mail Consortium zachęca do niestosowania UTF-7 w poczcie elektronicznej. Zmodyfikowana postać UTF-7 jest używana przez protokół IMAP. (pl)
  • UTF-7 (Unicode Transformation Format, 7 bit) è una codifica di caratteri in sequenze di byte di lunghezza variabile, proposto per la rappresentazione di testo Unicode utilizzando un flusso di caratteri ASCII. Originariamente destinato alla codifica del testo in Unicode per la composizione di messaggi di posta elettronica in modo più efficiente rispetto alla combinazione di codifiche UTF-8 e , non diventò mai una codifica standard. (it)
  • O UTF-7 (Formato de Transformação Unicode de 7 bits) é uma codificação de caracteres de tamanho variável capaz de representar um texto Unicode usando uma seqüência de caracteres ASCII. É usada principalmente em emails. O principal padrão de transferência de email na Internet, o SMTP, define que somente caracteres ASCII devem ser usados, não permitindo que qualquer byte com valor superior aos definidos pelo padrão ASCII seja usado. MIME oferece uma maneira de especificar-se a codificação de caracteres utilizada permitindo o uso de outras opções como o UTF-8 ou UTF-16. Entretanto a infraestrutura de transmissão subjacente da internet ainda não é 8 bits compatível, consequentemente devem ser utilizados. Dentre as opções de codificação de conteúdo para transferência, o base64 tem o problema de deixar ilegíveis mesmo os caracteres ASCII e o UTF-8 é bastante ineficiente utilizando entre 6 a 9 bytes para caracteres não-ASCII do Basic Multilingual Plane (BMP) e 12 bytes para os caracteres fora do BMP. Se algumas regras forem seguidas durante a codificação, o UTF-7 pode ser enviado em um email sem utilizar-se uma seção MIME dedicada mas deve ser explicitamente identificada como a codificação de caracteres utilizada. Além disso, se for utilizado em cabeçalhos de email como "Subject:" o UTF-7 deverá estar contido em MIME que identifiquem a codificação de caracteres utilizada. Como palavras codificadas exigem o uso de ou base64 o UTF-7 foi projetado para evitar o sinal = como caracteres especial, evitando assim o choque com o uso do = pelo quoted-printable. O UTF-7 não é normalmente usado internamente em aplicações pois seu processamento é bastante desagradável. A criação do reduziu a necessidade de codificar-se mensagens em formatos . Apesar de seu menor tamanho em relação ao uso combinado do UTF-8 com o quoted-printable ou base 64, o (Internet Mail Consortium) recomenda que não se use o UTF-7. Uma versão modificada do UTF-7 é usada pelo protocolo de recuperação de de mensagens IMAP para nomes de caixas postais. Veja a seção 5.1.3 do para maiores detalhes. (pt)
  • UTF-7 (от англ. 7-bit Unicode Transformation Format — «формат преобразования Юникода, 7 бит») формат кодирования текста Юникод с переменной длиной символьных слов в последовательность символов ASCII. Первоначально предназначался для кодирования текстов Юникода в сообщениях электронной почты Интернета, которые были более эффективными, чем комбинация UTF-8 с quoted-printable. (ru)
  • UTF-7(全称:7位元Unicode轉換格式)是一種可變長度字元編碼方式,用以將Unicode字元以ASCII編碼的字元串來呈現,可以應用在電子郵件傳輸之類的應用。 SMTP為基本的電子郵件傳輸標準之一,其指明了傳輸格式為US-ASCII,並且不允許超過ASCII所定義的字元範圍以外的位元值,也就是說八位元的字串將無法正常的被傳輸。MIME(RFC 2045 ~ 2049)擴展了網路郵件以支援不同的媒體類型以及字元集,包含UTF-8與UTF-16的字元集皆可被指定使用。但由於MIME並未明確將Unicode定義為可支援的字元集,並且也沒有說明其應如何編碼,這使得既有的SMTP傳輸架構下仍舊無法保證可正確的處理8位元資料。base64編碼也有其問題,例如甚至連純英文的US-ASCII字元也可能會變成不可辨認;至於像是UTF-8與quoted-printable的編碼結合,則需要6~9個位元來為非ASCII的字元(Unicode的基本多文種平面中定義的字元)進行編碼,至於在基本多文種平面(BMP)以外的字原則需要多達12位元的長度才能完成編碼。 (zh)
dbo:wikiPageID
  • 321787 (xsd:integer)
dbo:wikiPageLength
  • 13075 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID
  • 1106294305 (xsd:integer)
dbo:wikiPageWikiLink
dbp:classification
dbp:encodes
  • ISO/IEC 10646 (en)
dbp:lang
  • International (en)
dbp:name
  • UTF-7 (en)
dbp:next
  • UTF-8 over 8BITMIME (en)
dbp:prev
dbp:wikiPageUsesTemplate
dcterms:subject
gold:hypernym
rdf:type
rdfs:comment
  • UTF-7 ist eine Kodierung des Unicode-Zeichensatzes, die in RFC 2152 definiert wird. UTF-7 ist trotz der Namensähnlichkeit zu anderen Kodierungen nicht Bestandteil des Unicode-Standards. UTF-7 erlaubt die Verwendung von Unicode in nicht 8-bit-festen Umgebungen. (de)
  • UTF-7(ユーティーエフなな、ユーティーエフセブン)はISO/IEC 10646(UCS)とUnicodeで使える7ビット符号単位の文字符号化形式及び文字符号化スキーム。 7ビットでしか送信できない制限があるプロトコル上のメールやニュースなどの環境で、その体系上でUnicodeのメールを送信可能にするために作られた規格である。 現在では正しく実装されていないアプリケーション上でセキュリティー上の脆弱性を発生させることがあることから、あまり使われなくなっている。 IMAP4では、UTF-7を変更した規格である修正UTF-7の規格があり、この規格は2010年代現在においては頻繁に使用される。 (ja)
  • UTF-7(7비트 유니코드 변환 포맷, 7-bit Unicode Transformation Format)은 아스키 문자의 스트림을 사용하여 유니코드를 표현하는 가변 길이의 문자 인코딩이다. 원래는 UTF-8을 과 결합해서 사용하는 것보다 더 효율적인 인터넷 이메일 메시지에 사용할 목적으로 유니코드 텍스트를 인코딩하는 수단으로서 제공하는 것이 목적이다. UTF-7를 사용하는 웹사이트는 전체 웹사이트 가운데 0.003% 미만이다. UTF-8이 2009년 이후부터 월드 와이드 웹의 우세한 인코딩 방식이 되고 있다. (ko)
  • UTF-7 (Unicode Transformation Format, 7 bit) è una codifica di caratteri in sequenze di byte di lunghezza variabile, proposto per la rappresentazione di testo Unicode utilizzando un flusso di caratteri ASCII. Originariamente destinato alla codifica del testo in Unicode per la composizione di messaggi di posta elettronica in modo più efficiente rispetto alla combinazione di codifiche UTF-8 e , non diventò mai una codifica standard. (it)
  • UTF-7 (от англ. 7-bit Unicode Transformation Format — «формат преобразования Юникода, 7 бит») формат кодирования текста Юникод с переменной длиной символьных слов в последовательность символов ASCII. Первоначально предназначался для кодирования текстов Юникода в сообщениях электронной почты Интернета, которые были более эффективными, чем комбинация UTF-8 с quoted-printable. (ru)
  • UTF-7(全称:7位元Unicode轉換格式)是一種可變長度字元編碼方式,用以將Unicode字元以ASCII編碼的字元串來呈現,可以應用在電子郵件傳輸之類的應用。 SMTP為基本的電子郵件傳輸標準之一,其指明了傳輸格式為US-ASCII,並且不允許超過ASCII所定義的字元範圍以外的位元值,也就是說八位元的字串將無法正常的被傳輸。MIME(RFC 2045 ~ 2049)擴展了網路郵件以支援不同的媒體類型以及字元集,包含UTF-8與UTF-16的字元集皆可被指定使用。但由於MIME並未明確將Unicode定義為可支援的字元集,並且也沒有說明其應如何編碼,這使得既有的SMTP傳輸架構下仍舊無法保證可正確的處理8位元資料。base64編碼也有其問題,例如甚至連純英文的US-ASCII字元也可能會變成不可辨認;至於像是UTF-8與quoted-printable的編碼結合,則需要6~9個位元來為非ASCII的字元(Unicode的基本多文種平面中定義的字元)進行編碼,至於在基本多文種平面(BMP)以外的字原則需要多達12位元的長度才能完成編碼。 (zh)
  • UTF-7 (7-bit Unicode Transformation Format) és una codificació de caràcters de longitud variable que va ser proposada per representar text codificat amb Unicode utilitzant un flux de caràcters ASCII, per ser usat, per exemple en missatges de correu electrònic d'Internet. Malgrat el nom, UTF-7 no és un format de transformació i no forma part de l'estàndard Unicode. En el protocol de recuperació de missatges IMAP actualment s'utilitza una forma modificada de UTF-7. Vegeu la secció 5.1.3 de RFC 3501 per més detalls. (ca)
  • UTF-7 (7-bit Unicode Transformation Format) es una codificación de caracteres de longitud variable que fue propuesta para representar texto codificado con Unicode usando un flujo de caracteres ASCII, para ser usado, por ejemplo en mensajes de correo electrónico de Internet. A pesar del nombre, UTF-7 no es un formato de transformación y no forma parte del estándar Unicode. En el protocolo de recuperación de mensajes IMAP actualmente se utiliza una forma modificada de UTF-7. Véase la sección 5.1.3 de RFC 3501 para más detalles. (es)
  • UTF-7 (UCS ou Unicode transformation format 7 bits) est un codage de caractères informatiques à longueur variable conçu pour coder l’ensemble des caractères internationaux d’Unicode dans le courrier électronique de manière plus efficace que l’UTF-8 à l’aide de quoted-printable. UTF-7 n’est pas une norme Unicode, le standard Unicode ne mentionne que UTF-8, UTF-16 et UTF-32. * Portail de l’informatique * Portail de l’écriture (fr)
  • UTF-7 (7-bit Unicode Transformation Format) is an obsolete variable-length character encoding for representing Unicode text using a stream of ASCII characters. It was originally intended to provide a means of encoding Unicode text for use in Internet E-mail messages that was more efficient than the combination of UTF-8 with quoted-printable. UTF-7 has never has been an official standard of the Unicode Consortium. It is known to have security issues, which is why software has been changed to disable its use. It is prohibited in HTML 5. (en)
  • O UTF-7 (Formato de Transformação Unicode de 7 bits) é uma codificação de caracteres de tamanho variável capaz de representar um texto Unicode usando uma seqüência de caracteres ASCII. É usada principalmente em emails. O UTF-7 não é normalmente usado internamente em aplicações pois seu processamento é bastante desagradável. A criação do reduziu a necessidade de codificar-se mensagens em formatos . Apesar de seu menor tamanho em relação ao uso combinado do UTF-8 com o quoted-printable ou base 64, o (Internet Mail Consortium) recomenda que não se use o UTF-7. (pt)
  • UTF-7 (ang. 7-bit ) – sposób zapisu tekstu w formacie Unicode przy użyciu zmiennej liczby znaków ASCII, nadający się na przykład do użycia w wiadomościach MIME. Wiadomości e-mail wysyłane przy użyciu MIME muszą być zapisane wyłącznie przy użyciu kodów ASCII, więc każdy używający bezpośrednio ośmio- lub szesnastobitowego unikodu (na przykład UTF-16) jest traktowany jako wadliwy. Unikod zapisany przy użyciu UTF-7 może być przesyłany bez użycia nagłówka Content-Transfer-Encoding (który specyfikuje sposób reprezentacji danych binarnych za pomocą tekstu ASCII), ale pod warunkiem, że kodowanie znaków zostanie jawnie określone. Dodatkowo, przy użyciu UTF-7 w nagłówkach (np. Subject:), należy wykorzystać Encoded-Word ze standardu MIME, żeby to ujawnić. (pl)
rdfs:label
  • UTF-7 (ca)
  • UTF-7 (de)
  • UTF-7 (es)
  • UTF-7 (fr)
  • UTF-7 (it)
  • UTF-7 (ko)
  • UTF-7 (ja)
  • UTF-7 (pl)
  • UTF-7 (pt)
  • UTF-7 (en)
  • UTF-7 (ru)
  • UTF-7 (zh)
owl:sameAs
prov:wasDerivedFrom
foaf:isPrimaryTopicOf
is dbo:wikiPageDisambiguates of
is dbo:wikiPageRedirects of
is dbo:wikiPageWikiLink of
is dbp:next of
is rdfs:seeAlso of
is foaf:primaryTopic of
Powered by OpenLink Virtuoso    This material is Open Knowledge     W3C Semantic Web Technology     This material is Open Knowledge    Valid XHTML + RDFa
This content was extracted from Wikipedia and is licensed under the Creative Commons Attribution-ShareAlike 3.0 Unported License