上一篇介绍了如何在 Oracle 生成随机数字、字符串、日期、验证码以及 UUID,今天我们继续讨论在 MySQL 中生成各种随机数据的方法。
"htmlcode">
SELECT rand(); rand() | ------------------| 0.7245639057127423| SELECT rand(); rand() | -------------------| 0.01697599982561171|该函数返回的数据类型为 double,包含 16 位小数;每次调用都会返回不同的数据。
如果想要重现某些场景,需要确保每次运行时生成相同的随机数。这种情况下可以为 RAND 函数传递一个输入参数,设置一个随机数种子。例如:
SELECT rand(1); rand(1) | -------------------| 0.40540353712197724| SELECT rand(1); rand(1) | -------------------| 0.40540353712197724|从结果可以看出,相同的种子返回了相同的随机数。
生成指定范围内的随机数
基于 RAND 函数和数学运算,可以返回任意两个数字之间的随机数:
low + RAND() * (high "htmlcode">SELECT 10 + rand(1) * 10; 10 + rand(1) * 10 | ------------------| 14.054035371219772|以上示例返回了一个大于等于 10 且小于 20 的随机数字。
如果想要生成某个范围内的随机整数,可以加上 FLOOR 函数。例如:
SELECT floor(10 + rand(1) * (10)) AS rd; rd | ----| 14.0|该语句返回了一个大于等于 10,小于等于 19(不是 20)的随机整数。
生成 6 位数字手机验证码
我们已经获得了指定范围内的随机整数,加上 LPAD 函数就可以生成由 6 位数字字符组成的手机验证码。例如:
SELECT lpad(floor(rand(999) * 1000000), 6, '0') AS captcha; captcha| -------| 088146 |其中,lpad 函数可以确保数据不够 6 位时在前面补足 0。
生成遵循正态分布的随机数
RAND 函数生成的是一个遵循均匀分布的随机数,MySQL 没有提供生成遵循正态分布(normal distribution)的随机数。我们可以创建一个存储函数来模拟正态分布的随机数:
delimiter // create function normal_distrib(mean double, stdev double) returns double no sql begin set @x = rand(), @y = rand(); set @nd = (sqrt(-2 * log(@x)) * cos(2 * pi() * @y)) * stdev + mean; return @nd; end // delimiter ;以上函数利用 Box-Muller 变换算法通过两个平均分布的随机数生成正态分布的随机数。
以下语句通过 normal_distrib 函数生成了一个期望值为 0,标准差为 1 的正态分布随机数:
SELECT normal_distrib(0,1); normal_distrib(0,1)| -------------------| 1.4930564399841173|以下语句可以用于验证 normal_distrib 函数是否遵循正态分布:
with recursive temp(val) as ( select normal_distrib(0,1) union all select normal_distrib(0,1) from temp limit 1000000 ) select /*+ set_var(cte_max_recursion_depth = 1m) */avg(val),std(val) from temp; avg(val) |std(val) | ---------------------|------------------| -0.002340136192616743|0.9994844557755181|通过运行 1000000 次,计算这些数据的平均值和标准差,返回结果非常接近 0 和 1。
生成随机字符串
生成固定长度的随机字符串
除了随机数字之外,有时候我们也需要生成一些随机的字符串。MySQL 没有提供专门生成随机字符串的函数,但是可以通过其他函数进行模拟。例如:
SELECT char(floor(rand() * 26)+65) as rand_char; rand_char| ---------| T |以上查询返回了一个随机的大写字母,char 函数用于将 ASCII 码转换为对应的字符。我们可以基于该查询进一步创建一个存储函数:
delimiter // create function rand_string(len integer) returns text no sql begin declare counter int default 1; declare str text default ''; if len < 1 then return null; end if; while counter <= len do set str = concat(str, char(floor(rand() * 94) + 33)); set counter = counter + 1; end while; return str; end // delimiter ;rand_string 函数可以返回由任意可打印字符(ASCII 码从 33 到 126)组成的随机字符串。例如:
rand_string(8)| --------------| 7j5dz[58 |以上示例返回了一个长度为 8,由可打印字符组成的随机字符串。
另外,MySQL 中的 elt 函数也可以用于返回指定位置中的元素。例如:
SELECT elt(1 + floor(rand() * 36), 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 'A','B','C','D','E','F','G', 'H','I','J','K','L','M','N', 'O','P','Q','R','S','T', 'U','V','W','X','Y','Z') as val; val| ---| B |以上语句返回了一个随机的数字或者大写字母,将其替换到 rand_string 函数可以返回一个由数字和大写字母组成的随机字符串。
生成可变长度的随机字符串
那么,怎么返回一个长度可变的随机字符串呢?很简单,为 rand_string 函数指定一个随机的长度参数即可。例如:
SELECT rand_string(floor(10 + rand() * 11)); rand_string(floor(10 + rand() * 11))| ------------------------------------| 4U13MjO+($}k"cO@5%[ |以上示例返回了一个长度大于等于 10 且小于等于 20,由可打印字符组成的随机字符串。
生成随机日期和时间
将指定日期增加一个随机的数字,就可以得到随机的日期。例如:
SELECT date_add('2020-01-01', interval rand() * 31 day) rand_date; rand_date | ----------| 2020-01-19|以上示例返回了 2020 年 1 月中的某个随机日期。以下语句则返回了一天中的某个随机时间:
SELECT sec_to_time(rand() * 3600) rand_time; rand_time | ------------------| 00:05:29.546878000|其中,sec_to_time 函数用于将秒数转换为时间数据。
获取表中的随机记录
对于返回多行数据的查询语句,RAND 函数每次都会返回不同的随机数据。例如:
SELECT rand(1) FROM employee; rand(1) | --------------------| 0.40540353712197724| 0.8716141803857071| 0.1418603212962489| ...利用这个特性,我们可以从表中返回随机的数据行。例如:
SELECT emp_id,emp_name FROM employee ORDER BY rand(1) LIMIT 5; emp_id|emp_name | ------|----------| 6|魏延 | 14|张苞 | 16|周仓 | 15|赵统 | 1|刘备 |以上示例从 employee 表中返回了 5 行随机记录。该方法需要为表中的每行数据都生成一个随机数,然后进行排序;所以会随着表中的数据量增加而逐渐变慢。
如果表中存在自增主键,也可以基于主键生成一个随机数据。例如:
SELECT round(rand() * (SELECT max(emp_id) FROM employee)) AS id; id | ----| 10.0|然后基于这个随机数返回一条随机的记录:
SELECT e.emp_id, e.emp_name FROM employee e INNER JOIN (SELECT round(rand() * (SELECT max(emp_id) FROM employee)) AS id ) AS t WHERE e.emp_id >= t.id LIMIT 1; emp_id|emp_name| ------|--------| 9|赵云 |这种方法一次只能返回一条随机记录,而且只有当自增字段的值没有间隙时才会返回均匀分布的随机记录。
生成 UUID
UUID(Universal Unique Identifier)或者 GUID(Globally Unique Identifier)是一个 128 比特的数字,可以用于唯一标识每个网络对象或资源。由于它的生成机制,一个 UUID 可以保证几乎不会与其他 UUID 重复,因此常常用于生成数据库中的主键值。
MySQL 提供了一个系统函数 UUID,可以用于生成 UUID。例如:
SELECT uuid(); uuid() | ------------------------------------| 35f67fde-e0e9-11ea-9d25-0800272142b1|如果想要生成没有中划线(-)的 UUID,可以使用 REPLACE 函数:
SELECT replace(uuid(),'-',''); replace(uuid(),'-','') | --------------------------------| 8505290be0ea11ea9d250800272142b1|除此之外,MySQL 还提供了一个UUID_SHORT 函数,它可以返回一个 64 比特的无符号整数。例如:
SELECT uuid_short(); uuid_short() | -----------------| 98862025337208832|该函数返回的是一个“短的”唯一标识符,只有满足以下条件时才具有唯一性:
- 当前服务器的 server_id 位于 0 到 255 之间,并且在复制结构中具有唯一性;
- 重启 mysqld 前后没有将服务器主机的系统时间往回调整;
- 每秒钟的平均调用次数少于 1600 万次。
总结
本文介绍了在 MySQL 数据库中生成随机数据的方法,包括随机数字、验证码、随机字符串以及随机日期和时间等,同时还介绍了如何从表中返回随机记录,以及如何生成 UUID。