endian的来由
1、Definition
endian: The ordering of bytes in a multi-byte number.
定义:在计算机系统体系结构中用来描述在多字节数中各个字节的存储顺序。
2、Etymology
The term comes from Swift's 'Gulliver's Travels' via the famous paper'On Holy Wars and a Plea for Peace' by Danny Cohen, USC/ISI IEN 137, 1980-04-01.
The Lilliputians, being very small, had correspondingly small political problems. The Big-Endian and Little-Endian parties debated over whether soft-boiled eggs should be opened at the big end or the little end.[From: Free On-Line Dictionary Of Computing or Jargon File]
词源:据Jargon File记载,endian这个词来源于Jonathan Swift在1726年写的讽刺小说 'Gulliver's Travels'(《格利佛游记》)。该小说在描述Gulliver畅游小人国时碰到了如下的一个场景。在小人国里的小人因为非常小(身高6英寸)所以总是碰到一些意想不到的问题。有一次因为对水煮蛋该从大的一端(Big-End)剥开还是小的一端(Little-End)剥开的争论而引发了一场战争,并形成了两支截然对立的队伍:支持从Big-End剥开的人Swift就称作Big-Endians而支持从Little-End剥开的人就称作Little-Endians……(后缀ian表明的就是支持某种观点的人:-)。Endian这个词由此而来。
1980年,Danny Cohen在其著名的论文'On Holy Wars and a Plea for Peace'中为了平息一场关于在消息中字节该以什么样的顺序进行传送的争论而引用了该词。
该文中,Cohen非常形象贴切地把支持从一个消息序列的MSB开始传送的那伙人叫做Big-Endians,支持从LSB开始传送的相对应地叫做Little-Endians。此后Endian这个词便随着这篇论文而被广为采用。
各种endian:
1、big-endian
A computer architecture in which, within a given multi-byte numeric representation, the most significant byte has the lowest address (the word is stored 'big-end-first').
Most processors, including the IBM 370 family, the PDP-10, the Motorola microprocessor families, and most of the various RISC designs current in mid-1993, are big-endian. [From: Free On-Line Dictionary Of Computing or Jargon File]
big-endian:计算机体系结构中一种描述多字节存储顺序的术语,在这种机制中最重要字节(MSB)存放在最低端的地址上。采用这种机制的处理器有IBM3700系列、PDP-10、Mortolora微处理器系列和绝大多数的RISC处理器。
+----------+
|
0x34
|<-- 0x00000021
+----------+
|
0x12
|<-- 0x00000020
+----------+
图1:双字节数0x1234以big-endian的方式存在起始地址0x00000020中
在Big-Endian中,对于bit序列中的序号编排方式如下(以双字节数0x8B8A为例):
bit
0 1 2 3 4 5 6 7
8 9 10 11 12 13 14 15
+----------------------------------------+
val | 1 0 0 0 1 0 1 1 | 1 0 0
0
1
0
1
0 |
+----------------------------------------+
^
0x8B
0x8A
^
MSB
LSB
图2:Big-Endian的bit序列编码方式
注1:通常在TCP/IP协议栈所说的网络序(Network Order)就是遵循Big-Endian规则。在TCP/IP网络通信中,通信双方把消息按照如图2的方式进行编码,然后按从MSB(Bit0)到LSB的顺序在网络上传送。
2、little-endian
<data, architecture> A computer architecture in which, within a given 16- or 32-bit word,bytes at lower addresses have lower significance (the word is stored 'little-end-first'). The PDP-11 and VAX families of computers and Intel microprocessors and a lot of communications and networking hardware are little-endian.
The term is sometimes used to describe the ordering of units other than bytes; most often, bits within a byte. [From: Free On-Line Dictionary Of Computing or Jargon File]
little-endian:计算机体系结构中一种描述多字节存储顺序的术语,在这种机制中最不重要字节(LSB)存放在最低端的地址上。采用这种机制的处理器有PDP-11、VAX、Intel系列微处理器和一些网络通信设备。该术语除了描述多字节存储顺序外还常常用来描述一个字节中各个比特的排放次序。
+----------+
|
0x12
|<-- 0x00000021
+----------+
|
0x34
|<-- 0x00000020
+----------+
图3:双字节数0x1234以little-endian的方式存在起始地址0x00000020中
在Little-Endian中,对于bit序列中的序号编排和Big-Endian刚好相反,其方式如下(以双字节数0x8B8A为例):
bit
15 14 13 12 11 10 9 8
7 6 5 4 3 2 1 0
+-----------------------------------------+
val | 1
0
0
0
1
0
1 1 | 1 0 0 0 1 0 1 0 |
+-----------------------------------------+
^
0x8B
0x8A
^
MSB
LSB
图4:Little-Endian的bit序列编码方式
注2:正因为这两种机制对于同一bit序列的序号编排方式恰恰相反,所以《现代英汉词典》中对MSB的翻译为“最高有效位”欠妥,故本文定义为“最重要的bit/byte”。
3、middle-endian:
<data, architecture> Neither big-endian nor little-endian. Used of perverse byte orders such as 3-4-1-2 or 2-1-4-3, occasionally found in the packed decimal formats of some minicomputer manufacturers.[From: Free On-Line Dictionary Of Computing or Jargon File]
middle-endian:除了big-endian和little-endian之外的多字节存储顺序就是middle-endian,比如以4个字节为例:象以3-4-1-2或者2-1-4-3这样的顺序存储的就是middle-endian。这种存储顺序偶尔会在一些小型机体系中的十进制数的压缩格式中出现。
收尾
要详细解释这两种编码顺序已经超出本文所涉及的内容,如果你有兴趣的话可以参考上面提及的Danny Cohen的论文('On Holy Wars and a Plea for Peace'),该论文详细的描述了这两种编码顺序的历史、所基于的数学理论和各自拥护者争论的焦点等知识,绝对可以大饱你打破沙锅问到底的内心需要。
References & WebLinks
1.
Free On-Line Dictionary Of Computing
2.
Jargon File 3.
Gulliver's Travels《格利佛游记》4.
On Holy Wars and a Plea for Peace
一个16位整数,由两个字节组成。内存中存储这两个字节有两种方法:一种是将低序字节存储在起始地址,称为little-endian(小端)字节序,另一种方法是将高序字节存储在起始地址,称为big-endian(大端)字节序。术语little-endian和big-endian表示多字节的哪一端存储在该值的起始地址。
例如:0x0102
little-endian: A 0x02
A+1 0x01
big-endian: A 0x01
A+1 0x02
最新ARM技术、嵌入式培训新班开课接受报名中!QQ:313807838