标准库之random模块

cnblogs 2024-09-30 11:39:00 阅读 68

一、介绍random模块

1.1、random模块简介

random模块是Python标准库中用于生成伪随机数的模块,伪随机数是通过算法生成的数列,在一定范围内表现出随机性,虽然这些数列在一定程度上是可预测的,但对于大多数应用来说已经足够。

二、random模块的基本功能

2.1、整数用函数

2.1.1、random.randrange()

random.randrange(start, stop[, step])

返回从 range(start, stop, step) 随机选择的一个元素。

支持设置步长,可以生成按固定间隔的随机数,这对于需要特定模式或间隔的随机数生成非常有用。注意:不包括右边界

<code># 返回 0 <= N < 100 范围内的随机整数

print(random.randrange(100))

# 返回 100 <= N < 200 范围内的随机整数

print(random.randrange(100, 200))

# 返回 100 <= N < 200 范围内的随机整数,步长为5

print(random.randrange(100, 200, 5))

2.1.2、random.randint()

random.randint(a, b)

返回随机整数 N 满足 a <= N <= b。相当于 randrange(a, b+1)。

不支持设置步长,只能生成指定范围内的任意整数。注意:包括左边界和右边界

# 返回 100 <= N <= 200 范围内的随机整数

print(random.randint(100, 200))

2.1.3、random.getrandbits()

random.getrandbits(k)

返回随机整数 N 满足 0 <= N <= 2^k-1,例如,getrandbits(16)将生成一个0到65535之间的随机整数。这个函数特别适用于需要生成大范围随机数的情况。

# 返回 0 <= N <= 65535(2的16次方再减去1) 范围内的随机整数

print(random.getrandbits(16))

2.2、序列用函数

2.2.1、random.choice()

random.choice(seq)

从非空序列 seq 返回一个随机元素。 如果 seq 为空,则引发 IndexError。

a = ['alice', 'bob', 'helen', 'jack', 'sue']

b = ('alice', 'bob', 'helen', 'jack', 'sue')

c = {'alice', 'bob', 'helen', 'jack', 'sue'}

d = {'alice': 16, 'bob': 18, 'helen': 19, 'jack': 20, 'sue': 22}

e = 'ABCDEFGHIJKLMNOPQRSTUVWXYZ'

# 从列表中随机选取一个元素

print(random.choice(a))

# 从元组中随机选取一个元素

print(random.choice(b))

# 从字符串中随机选取一个元素

print(random.choice(e))

# ———————————————————————————————————————————

# 不支持从集合中随机选取,会报错

# print(random.choice(c))

# 不支持从字典中随机选取,会报错,但可以使用 random.choice(list(d.items())) 的方法来实现

# print(random.choice(d))

2.2.2、random.choices()

random.choices(population, weights=None, *, cum_weights=None, k=1)

  • population:必需参数,指定要进行选择的序列(可以是列表、元组、字符串等)。
  • weights:可选参数,指定每个元素的权重(概率)。如果不指定,则默认每个元素的权重相等。
  • cum_weights:可选参数,指定累计权重。如果指定了cum_weights,则必需省略weights参数。
  • k:可选参数,指定要选择的元素个数。默认为1,即只选择一个元素。

从序列中有放回地随机抽取k个元素,并返回对应的数组,weights参数代表每个元素被选到的相对权重,而cum_weights代表的是累积权重,它们的长度需和待抽取序列population长度一致。若无设置权重,则每个元素被抽到的权重是一样的。

注意:权重不能为负值,否则会报错。

import random

fruits = ['apple', 'banana', 'orange', 'grape', 'watermelon']

weights = [0.1, 0.2, 0.3, 0.2, 0.2]

cum_weights = [0.1, 0.4, 0.7, 0.9, 1.0]

# 从列表中随机选择一个元素

chosen_fruit = random.choices(fruits)

# 选择多个元素

chosen_fruits = random.choices(fruits, k=3)

# 按照概率从列表中随机选择一个元素

chosen_fruit = random.choices(fruits, weights=weights)

# 利用cum_weights参数选择元素

chosen_fruit = random.choices(fruits, cum_weights=cum_weights)

选择多个元素并计算选择的次数

import random

fruits = ['apple', 'banana', 'orange', 'grape', 'watermelon']

chosen_fruits = random.choices(fruits, k=1000)

fruit_counts = {}

for fruit in chosen_fruits:

if fruit in fruit_counts:

fruit_counts[fruit] += 1

else:

fruit_counts[fruit] = 1

print(fruit_counts)

2.2.3、random.shuffle()

random.shuffle(x)

就地将序列 x 随机打乱位置。

import random

fruits = ['apple', 'banana', 'orange', 'grape', 'watermelon']

random.shuffle(fruits) # 注意:改变的是原列表

print(fruits) # ['orange', 'watermelon', 'grape', 'banana', 'apple']

2.2.4、random.sample()

random.sample(population, k, *, counts=None)

从序列中无放回地随机抽取k个元素。用于无重复的随机抽样。

import random

fruits = ['apple', 'banana', 'orange', 'grape', 'watermelon']

# 返回一个新的随机打乱序列, 注意:原列表是没有改变的

print(random.sample(fruits,len(fruits))) # ['orange', 'watermelon', 'apple', 'banana', 'grape']

print(fruits) # ['apple', 'banana', 'orange', 'grape', 'watermelon']

重复的元素可以一个个地直接列出,或使用可选的仅限关键字形参 counts 来指定。 例如,sample(['red', 'blue'], counts=[4, 2], k=5) 等价于 sample(['red', 'red', 'red', 'red', 'blue', 'blue'], k=5)。

要从一系列整数中选择样本,请使用 range() 对象作为参数。 对于从大量人群中采样,这种方法特别快速且节省空间:sample(range(10000000), k=60) 。

2.3、离散分布

2.3.1、random.binomialvariate()

random.binomialvariate(n=1, p=0.5)

二项式分布。 返回 n 次独立试验在每次试验的成功率为 p 时的成功次数

2.4、实值分布

2.4.1、random.random()

random.random()

返回 0.0 <= X < 1.0 范围内的随机浮点数

2.4.2、random.uniform(a, b)

random.uniform(a, b)

返回一个随机浮点数 N ,a <= N <= b。

import random

print(random.uniform(60, 100))

2.4.2.1、保留小数点后n位的方法

2.4.2.1.1、使用round()函数

num = 3.14159

# 这种方式是进行的四舍五入

rounded_num = round(num, 2) # 输出: 3.14

2.4.2.1.2、使用format()函数

num = 3.14159

# 这种方式是进行的四舍五入,注意:得到的是字符串形式的浮点数

formatted_num = "{:.2f}".format(num) # 输出: '3.14'

2.4.2.1.3、使用decimal模块进行精确控制

from decimal import Decimal, ROUND_HALF_UP

num = Decimal('3.14159')

context = Decimal(1) / Decimal(10) ** 2

# 这种方式是进行的四舍五入

rounded_num = num.quantize(context, rounding=ROUND_HALF_UP) # 输出: Decimal('3.14')

2.4.2.1.4、使用f-string(Python 3.6+)

num = 3.14159

formatted_num = f"{num:.2f}" # 输出: '3.14'

三、与random相关的模块

3.1、secrets模块

secrets 模块用于生成高度加密的随机数,适于管理密码、账户验证、安全凭据及机密数据。

3.1.1、secrets.choice()

secrets.choice(seq)

返回一个从非空序列中随机选取的元素。

import secrets

# 假设我们有一个元素列表

fruits = ['apple', 'banana', 'orange', 'grape', 'watermelon']

# 使用 secrets.choice 来安全地选择列表中的一个随机元素

secure_random_element = secrets.choice(fruits)

print(secure_random_element)

3.1.2、secrets.randbelow()

secrets.randbelow(exclusive_upper_bound)

返回 [0, exclusive_upper_bound) 范围内的随机整数。

import secrets

# 生成一个安全的随机整数,范围在 0 <= N < 10之间

secure_int = secrets.randbelow(10)

print(f"安全随机整数:{secure_int}")

3.1.3、secrets.randbits()

secrets.randbits(k)

返回一个具有k个随机位的非负整数。如 secrets.randbits(3),表示取值为 0 <= N < 2^3,也就是 [0, 8) 之间的随机整数。

3.1.4、secrets.token_bytes()

secrets.token_bytes([nbytes=None])

如果指定了 nbytes, secrets.token_bytes(nbytes) 会返回一个包含 nbytes 个随机字节的 bytes 对象。 如果未提供 nbytes 参数,它会返回一个合适用于安全令牌的默认长度的随机字节序列(通常为 32 个字节)。

import secrets

# 生成默认长度(通常为32个字节)的随机字节序列

random_token = secrets.token_bytes()

print(len(random_token)) # 输出:32

print(random_token) # 输出随机字节序列:b'<\xa1\xc2\xb9k\xf4\x9e$\xd9\x03\xd5H\xb8\x1e\xe2d\xe0\x82x\xe9)\x11\xe9\x04l\xda\x95\xe3\xf0C\x88\xba'

# 生成指定长度的随机字节序列

specified_length_token = secrets.token_bytes(16)

print(specified_length_token) # 输出随机字节序列:b'\xa2C\x98H\xb2\xca5\n\xb69h{\xfa\xb3n\xc5'

3.1.5、secrets.token_hex()

secrets.token_hex([nbytes=None])

如果提供了 nbytes 参数,则会生成长度为 nbytes*2 的十六进制字符串(每个字节转换为两个十六进制字符)。 如果未提供 nbytes 参数,则会生成一个适用于安全令牌的默认长度的十六进制字符串(通常是 32 个字符)。

import secrets

# 生成默认长度(通常为32个字符)的随机十六进制字符串

random_hex_token = secrets.token_hex()

print(random_hex_token) # 53063bd5d38f7f032e146d769567254748dcbc34de37f716043a21d4b9ef0575

# 生成指定长度的随机十六进制字符串

specified_length_hex_token = secrets.token_hex(16)

print(specified_length_hex_token) # bcce543dee60747639895e2fcffcfaf8

3.1.6、secrets.token_urlsafe()

secrets.token_urlsafe([nbytes=None])

返回安全的 URL 随机文本字符串,包含 nbytes 个随机字节。文本用 Base64 编码,平均来说,每个字节对应 1.3 个结果字符。 未提供 nbytes 或为 None 时,它会生成一个适合于安全令牌的默认长度随机 URL 安全字符串。 这个函数生成的返回值是一个只包含 URL 安全字符(字母、数字、下划线和短横线)的字符串。

import secrets

# 生成默认长度的随机 URL 安全字符串

random_urlsafe_token = secrets.token_urlsafe()

print(len(random_urlsafe_token)) # 输出:43

print(random_urlsafe_token) # 输出:t6GrND8P32pL763R36VQIaB70jf8r_uruvSa0wgQYrY

# 生成指定长度的随机 URL 安全字符串

specified_length_urlsafe_token = secrets.token_urlsafe(16)

print(specified_length_urlsafe_token) # 输出:dUA2mPJbbWtB6rLj8hoC1g

3.1.7、secrets.compare_digest()

secrets.compare_digest(a, b)

用于比较两个字符串 a 和 b,并且在字符串匹配时具有防止时间侧信道攻击的特性。在密码学和安全相关的场景中,比较两个敏感字符串时,使用 secrets.compare_digest 要优于简单的 == 操作符。 该函数返回一个布尔值,如果 a 和 b 匹配,返回 True,否则返回 False。这种比较在比较时间上更加均匀,不易受到时间侧信道攻击的影响。在比较敏感数据时,尤其是在密码验证或令牌比对时使用这个函数,可以提高系统的安全性。

生成系统密码示例

import string

import random

import secrets

def generate_password(min_length, max_repeat, max_class_repeat, *char_credits):

characters = [string.digits, string.ascii_uppercase, '!@#$%^&*(){}<>,?`~+-=[]', string.ascii_lowercase]

all_characters = ''.join(characters)

while True:

# 生成每个字符类别的字符

password = [secrets.choice(char) for char, count in zip(characters, char_credits) for _ in range(count)]

# 添加字符以满足最小密码长度要求

remaining_len = min_length - sum(char_credits)

password += [secrets.choice(all_characters) for _ in range(remaining_len)]

random.shuffle(password)

if is_valid_password(min_length, password, characters, max_repeat, max_class_repeat):

return ''.join(password)

def is_valid_password(min_length, password, characters, max_repeat, max_class_repeat):

# 判断是否以=开头

if ''.join(password).startswith("="):

return False

# 检查字符和类别是否连续重复超过了规定次数

repeat_count = max(password.count(char) for char in set(password))

if repeat_count > min_length // 4:

return False

for char_class in characters:

char_class_positions = [idx for idx, char in enumerate(password) if char in char_class]

for idx in char_class_positions:

if idx < len(password) - max_class_repeat:

if all(password[idx + i] in char_class for i in range(0, max_class_repeat + 1)):

return False

# 判定同一个字符的索引

char_repeat = [char for char in set(password) if password.count(char) > max_repeat]

char_repeat_positions = {}

for idx, char in enumerate(password):

if char in char_repeat:

if char not in char_repeat_positions:

char_repeat_positions[char] = [idx]

else:

char_repeat_positions[char].append(idx)

# 判定相同字符是否连续

for _, index in char_repeat_positions.items():

for idx in index:

if idx < len(password) - max_repeat:

if all(password[idx + i] == password[idx] for i in range(0, max_repeat + 1)):

return False

return True

if __name__ == '__main__':

# 设置密码生成的参数

min_length = 16

char_credits = (3, 3, 3, 3) # 数字、大写字母、特殊字符、小写字母

# 同一个字符不能连续重复的数量

max_repeat = 2

# 同一类字符不能连续重复的数量

max_class_repeat = 3

# 生成和打印密码

for _ in range(100):

generated_password = generate_password(min_length, max_repeat, max_class_repeat, *char_credits)

print(generated_password)

生成密码重置URL示例

import secrets

import string

# 生成安全令牌,用于密码恢复应用程序

security_token = ''.join(secrets.choice(string.ascii_letters + string.digits) for _ in range(16))

# 构建临时密保URL

temp_url = f"https://example.com/password-recovery?token={security_token}"

print("生成的临时密保URL:", temp_url) # 输出:生成的临时密保URL: https://example.com/password-recovery?token=90HOEUVFroaJIO5D



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。