ホーム > ストレージネットワーキング用語集 > UTF-8

UTF-8

ASCIIテキストが自身に符号化され,POSIX文字列操作ルーチンの多くが意図した通りに機能する,Unicodeなどのマルチバイト文字スキームの符号化.16ビットUnicode文字列でASCIIテキストを符号化すると,文字列内のデータバイトが一つおきにゼロに設定される.このテキストをUTF-8で符号化すると最後のみゼロになる.

使用分野: General

An encoding for multi-byte character schemes such as Unicode, in which ASCII text encodes to itself and POSIX string manipulation routines work largely as expected. A 16-bit Unicode string that encodes ASCII text will have every other data byte within it set to zero. The UTF-8 encoding of this text will have a zero only at the end.

CONTEXT [General]

Copyright © 2019 SNIA Japan

このページのトップへ移動