【C语言进阶】数据如何安家?C语言内存中的存储艺术深度解析

Eternity._ 2024-08-23 08:35:06 阅读 85

📝个人主页🌹:Eternity._

⏩收录专栏⏪:C语言 “ 登神长阶 ”

🤡往期回顾🤡:C语言调试

🌹🌹期待您的关注 🌹🌹

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

❀C语言数据在内存中的存储

📒1. 数据类型介绍🍁类型的基本归类

📚2. 整型在内存中的存储🌄原码、反码、补码🏞️大小端字节序⛰️判断机器字节序的方法

📜3. 浮点型在内存中的存储🎈分析一段代码🎩浮点数存储规则

📖4. 总结


前言:在当今这个数据驱动的世界里,无论是软件开发、系统编程还是嵌入式系统开发,对数据的处理与存储都占据着举足轻重的地位。C语言,作为一门历史悠久且功能强大的编程语言,其直接操作内存的能力使得它在处理复杂数据结构和高性能数据存储方面展现出独特的优势。因此,深入理解C语言中的数据存储机制,对于任何希望成为高效程序员或系统分析师的学习者而言,都是不可或缺的一步

本文旨在为读者揭开C语言数据存储的神秘面纱,从最基本的变量类型与内存分配讲起,我们将通过理论讲解与实例演示相结合的方式,帮助读者构建扎实的C语言数据存储知识体系,掌握如何在C语言中高效、安全地处理各种类型的数据

让我们一同踏上这段探索C语言数据存储奥秘的旅程,开启编程世界的新篇章!


📒1. 数据类型介绍

<code>// 基本的内置类型

char //字符数据类型

short //短整型

int //整形

long //长整型

long long //更长的整形

float //单精度浮点数

double //双精度浮点数

类型的意义:

使用这个类型开辟内存空间的大小(大小决定了使用范围)如何看待内存空间的视角


🍁类型的基本归类

基本数据类型是C语言中最基础、最直接由语言本身支持的数据类型,它们是所有复杂数据类型和程序的基础

⭐整形家族:

char

unsigned char

signed char

short

unsigned short [int]

signed short [int]

int

unsigned int

signed int

long

unsigned long [int]

signed long [int]

⭐浮点数家族:

float

double

⭐构造类型:

// 数组类型

struct // 结构体类型

enum // 枚举类型

union // 联合类型

⭐指针类型

int *pi;

char *pc;

float* pf;

void* pv;

⭐空类型:

void 表示空类型(无类型)通常应用于函数的返回类型、函数的参数、指针类型


📚2. 整型在内存中的存储

整型在内存中的存储涉及多个方面,包括整数的表示方法(原码、反码、补码)、大小端字节序等


🌄原码、反码、补码

原码: 直接将二进制按照正负数的形式翻译成二进制就可以反码: 将原码的符号位不变,其他位依次按位取反就可以得到了补码: 反码+1就得到补码

正数的原码、反码、补码相同;负数的原码是符号位为1,其余各位为该数绝对值的二进制表示三种表示方法均有符号位和数值位两部分,符号位都是用0表示“正”,用1表示“负”,而数值位

正数的原、反、补码都相同计算机系统中,数值一律用补码来表示和存储。这是因为使用补码可以将符号位和数值位统一处理,同时加法和减法也可以统一,CPU只有加法器

在这里插入图片描述

我们可以通过编译器来查看数据的存储,但是存储顺序似乎和我们料想的不一样,它不是按我们正常的读写顺序


🏞️大小端字节序

概念:

大端存储模式:数据的低位保存在内存的高地址中,而数据的高位保存在内存的低地址中小端存储模式:数据的低位保存在内存的低地址中,而数据的高位保存在内存的高地址中

意义:

大小端存储模式主要是为了解决多字节存储安排问题。在计算机系统中,我们通常是以字节为单位存储数据的,每个地址对应一个字节。但是,对于位数大于8位的处理器(如16位或32位处理器),由于寄存器宽度大于一个字节,因此存在如何将多个字节安排的问题,这就导致了大小端存储模式的诞生

例如:我们有一个16位的整数0x1234 ,那么 0x12 为高字节, 0x34 为低字节。需要将其存储到内存中。大端模式,刚好相反,在小端存储模式下,这个数的存储方式如下:

内存地址 存储内容(十六进制) 存储内容(二进制)
低地址 0x34 0011 0100
高地址 0x12 0001 0010

在这个例子中,0x34是0x1234的低位字节,它被存储在内存的低地址处;而0x12是0x1234的高位字节,它被存储在内存的高地址处


⛰️判断机器字节序的方法

这里我们介绍两种判断机器字节序的方法

<code>//代码1 -> 通过类型的特点

#include <stdio.h>

int check_sys()

{

int i = 1;

return (*(char*)&i);

}

//代码2 -> 通过联合体

int check_sys()

{

union

{

int i;

char c;

}un;

un.i = 1;

return un.c;

}

int main()

{

int ret = check_sys();

if (ret == 1)

{

printf("小端\n");

}

else

{

printf("大端\n");

}

return 0;

}

代码一:

在这里插入图片描述

代码二:

在这里插入图片描述


📜3. 浮点型在内存中的存储

浮点型在内存中的存储主要遵循IEEE 754标准,该标准定义了浮点数的表示和运算规则。浮点型数据在内存中的存储结构通常分为单精度(32位)和双精度(64位)两种格式


🎈分析一段代码

在这里插入图片描述

先思考这段代码输出的值;

我想很多人应该会觉得输出值无非就是 9 或 9.0

但结果真的是这样吗?

在这里插入图片描述

我想这个结果肯定会让人大吃一惊,让我们来分析分析为什么这样输出


🎩浮点数存储规则

⭐国际标准IEEE 754

要搞懂上面的代码就必须要了解浮点数在计算机内的存储规则。

根据国际标准IEEE(电气和电子工程协会) 754,

任意一个二进制浮点数V可以表示成下面的形式:

● (-1)^S * M * 2^E

● (-1)^S表示符号位,当S=0,V为正数;当S=1,V为负数。

● M表示有效数字,大于等于1,小于2。

● 2^E表示指数位。

在这里插入图片描述

在这里插入图片描述

也就是说:

十进制的5.0,写成二进制是 101.0 ,相当于 1.01×2^2 。

那么,按照上面V的格式,可以得出S=0,M=1.01,E=2。

十进制的-5.0,写成二进制是 -101.0 ,相当于 -1.01×2^2 。

那么,S=1,M=1.01,E=2。

然后根据国际标准IEEE 754规定:

对于32位的浮点数,最高的1位是符号位s,接着的8位是指数E,剩下的23位为有效数字M。

在这里插入图片描述

对于64位的浮点数,最高的1位是符号位S,接着的11位是指数E,剩下的52位为有效数字M。

在这里插入图片描述

IEEE 754对有效数字M和指数E,还有一些特别规定。

1≤M<2 ,M可以写成 1.xxxxxx 的形式,其中xxxxxx表示小数部分。

一般在计算机内部保存M时,默认这个数的第一位总是1,因此可以被舍去,

保存1.01的时候,只保存01。

在这里插入图片描述

在这里插入图片描述

⭐关于指数E

(1) E为一个无符号整数

如果E为8位,它的取值范围为0-255;

如果E为11位,它的取值范围为0-2047。

科学计数法中的E是可以出现负数的,

所以IEEE 754规定,存入内存时E的真实值必须再加上一个中间数,

对于8位的E,这个中间数是127;

对于11位的E,这个中间数是1023。

比如,2^10的E是10,所以保存成32位浮点数时,必须保存成10+127=137,即

10001001。

⭐E不全为0或不全为1

浮点数就采用下面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加上第一位的1。

比如:

0.5(1/2)的二进制形式为0.1,由于规定正数部分必须为1,即将小数点右移1位,则为

1.0*2^(-1),其阶码为-1+127=126,表示为

01111110,而尾数1.0去掉整数部分为0,补齐0到23位00000000000000000000000,则其二进制表示形式为:

在这里插入图片描述

⭐E全为0

浮点数的指数E等于1-127(或者1-1023)即为真实值,有效数字M不再加上第一位的1,而是还原为0.xxxxxx的小数。这样做是为了表示±0,以及接近于

0的很小的数字。

⭐E全为1

这时,如果有效数字M全为0,表示±无穷大(正负取决于符号位s);


说了这么多回到开始我们就可以明白了

int n = 9;

float* pFloat = (float*)&n;

我们直接列出9的原 ,反 , 补码

00000000000000000000000000001001

00000000000000000000000000001001

00000000000000000000000000001001

由于是按%f去输出所以:

0 00000000 00000000000000000001001

E=1-127=-126

M=00000000000000000001001

所以结果为:

在这里插入图片描述

显然所得的值是一个很小的接近于0的正数,所以用十进制小数表示就是0.000000。

而后面的,

*pFloat = 9.0;

1001.0

S=0;

E=2^3;

M=1.001

所以在这里9.0的补码就大不相同了

E=3+127

9.0补码

0 10000010 00100000000000000000000

在这里插入图片描述


📖4. 总结

在深入剖析C语言中数据在内存中的存储这一漫长而精妙的旅程即将画上句号之际,我们不禁为这一编程语言所展现出的底层魅力和强大能力所折服。C语言,作为计算机科学领域的基石之一,其直接操作内存的能力不仅赋予了程序员前所未有的灵活性和控制权,也要求我们必须对数据的存储细节有着深刻的理解

通过本文的探讨,我们揭示了整型、浮点型、字符型等基本数据类型在内存中的布局与表示方式,理解了大小端字节序对数据存储顺序的影响

然而,这只是冰山一角。C语言中的数据存储与内存管理远不止于此。随着对C语言深入学习的推进,我们还将面临更多挑战与机遇,比如动态内存分配与释放、内存泄漏的检测与预防、缓冲区溢出的防范等。这些高级话题不仅要求我们具备扎实的理论基础,更需要我们在实践中不断摸索与总结,形成一套行之有效的编程习惯与技巧

在这里插入图片描述

希望本文能够为你提供有益的参考和启示,让我们一起在编程的道路上不断前行!

谢谢大家支持本篇到这里就结束了,祝大家天天开心!

在这里插入图片描述



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。