本文共 6485 字,大约阅读时间需要 21 分钟。
PostgreSQL , 数独
不知道什么时候开始数独游戏风靡起来了,数独游戏由一个N*N的矩阵组成,N必须是一个可以被开根的数值,例如4,9,16,25等。
任意一个像素,必须在三个方向上保证值唯一。这三个方向分别是X,Y,BOX。XY很好理解就是纵横的一条线(X,Y的像素个数就是N)。BOX指这个像素所在的BOX(BOX是由 (N的平方根)*(N的平方根) 个像素组成的矩阵)。
如图,一个9*9个像素的数独。(我把基数称为3)
1616的数独,16行,16列。同时分成44个BOX。(我把基数称为4)
那么如何生成一个有解的数独呢?
这个方法可行吗?
以下方法是按从左到右,从上到下的顺序来生成随机数的,看起来可行,实际上大多数情况下都无法生成有解数独,因为前面还比较容易满足条件,后面基本上就无法满足条件了。
create or replace function gen_sudoku( dim int -- 基数 ) returns int[] as $$ declare res int[]; vloops int := 2 * (dim^5); vloop int :=0; ovloops int := 2 * (dim^5); ovloop int :=0; rand int; begin -- 初始化矩阵 select array( select (select array_agg(0) from generate_series(1,(dim^2)::int)) from generate_series(1,(dim^2)::int)) into res; loop -- 无法生成并返回 if ovloop >= ovloops then raise notice '已循环%次,可能无法生成数独。', ovloop; return res; end if; ovloop := ovloop+1; <> for x in 1..dim^2 loop raise notice 'start again %', ovloop; for y in 1..dim^2 loop vloop := 0; loop -- 生成随机值 rand := 1+(random()*((dim^2)-1))::int; -- 这轮循环无法生成并返回 if vloop >= vloops then -- raise notice '1 %此数已循环%次,可能无法生成数独。', rand, vloop; -- return res; exit outer; end if; vloop := vloop+1; -- 横向验证 perform 1 where array(select res[x][generate_series(1,(dim^2)::int)]) && array[rand]; if found then --raise notice '2 %此数已循环%次,可能无法生成数独。%', rand, vloop, array(select res[x][generate_series(1,(dim^2)::int)]) ; continue; end if; -- 纵向验证 perform 1 where array(select res[generate_series(1,(dim^2)::int)][y]) && array[rand]; if found then --raise notice '3 %此数已循环%次,可能无法生成数独。%', rand, vloop, array(select res[generate_series(1,(dim^2)::int)][y]); continue; end if; -- BOX验证 perform 1 where array(select res[xx][yy] from (select generate_series(((((x-1)/dim)::int)*dim)+1, ((((x-1)/dim)::int)*dim)+dim) xx) t1, (select generate_series(((((y-1)/dim)::int)*dim)+1, ((((y-1)/dim)::int)*dim)+dim) yy) t2) && array[rand]; if found then --raise notice '4 %此数已循环%次,可能无法生成数独。%', rand, vloop, array(select res[xx][yy] from (select generate_series(((((x-1)/dim)::int)*dim)+1, ((((x-1)/dim)::int)*dim)+dim) xx) t1, (select generate_series(((((y-1)/dim)::int)*dim)+1, ((((y-1)/dim)::int)*dim)+dim) yy) t2); continue; end if; -- 通过验证 res[x][y] := rand; raise notice 'res[%][%] %', x, y, rand; -- 跳出循环 exit; end loop; end loop; end loop; end loop; return res; end; $$ language plpgsql strict;
以上方法最大的问题是,因为是左右,前后顺序在生成数独,实际上越到后面,会导致可以填充的满足XYB约束值越少,甚至没有。
为了尽可能的每次填充的值都有较大概率,可以在生成顺序上进行调整,不使用从左到右,从上到下的方法。
而是每一步都选择在XYB方向上还有最大概率(即最多没有填充的值)的像素。(我不清楚下围棋先占4个角,是不是也是同样的道理?)
输入一个矩阵,得到另一个矩阵,表示当前位置在XYB轴的未填充值的个数。(非空值的xyb返回x,y,0,0,0)因为非空值不需要再填充它,所以无所谓。
1、首先要创建一个类型,包括数独矩阵的 X,Y坐标。以及这个坐标的横、竖、BOX三个方向上的剩余未填充值的个数。
create type xyb as ( ax int, -- 横坐标 ay int, -- 纵坐标 x int, -- 横向还有多少未填充像素 y int, -- 竖向还有多少未填充像素 b int -- BOX内还有多少未填充像素 );
2、编写一个函数,用来计算一个为完成数独矩阵,其每一个像素的XYB值。
create or replace function comp_xyb( int[], -- 包含一些值的数独二维矩阵,当像素值为0时,表示这个值没有填充 int -- 数独的基数(比如2,3,。。。),3就是常见的9*9数独,4就是16*16数独。 ) returns xyb[] -- 返回一个复合类型的数组矩阵,矩阵像素和输入矩阵一样,每个像素表示这个像素在XYB轴上还有多少个没有填充的值(没有填充的值用0表示) as $$ declare dims int := ($2)^2; -- 基数的平方,表示行、列、BOX的像素个数。也是每个方向上的矩阵标记上限 res xyb[]; -- 结果 vx int; -- 横向还有多少未填充像素 vy int; -- 竖向还有多少未填充像素 vb int; -- BOX内还有多少未填充像素 lx int; -- box的X方向矩阵下标 ux int; -- box的X方向矩阵上标 ly int; -- box的Y方向矩阵下标 uy int; -- box的Y方向矩阵上标 begin -- 初始化矩阵 select array ( select array( select format('(%s,%s,0,0,0)', x, y) from generate_series(1,dims) t(y)) from (select generate_series(1, dims) x) t ) into res; -- X坐标 for x in 1..dims loop -- Y坐标 for y in 1..dims loop -- 如果这个像素的值不等于0,说明已经是一个已经填充过的像素,返回0,0,0 if ($1)[x][y] <> 0 then -- 不计算已填充了非0值的像素 continue; else -- x,计算X方向有多少个未填充的像素 select sum(case arr when 0 then 1 else 0 end) from (select ($1)[x][generate_series(1, dims)] as arr) t into vx; -- y,计算Y方向有多少个未填充的像素 select sum(case arr when 0 then 1 else 0 end) from (select ($1)[generate_series(1, dims)][y] as arr) t into vy; -- b,计算BOX内有多少个未填充的像素 -- x下限 lx := ((x-1)/$2)::int * $2 + 1; -- x上限 ux := ((x-1)/$2)::int * $2 + $2; -- y下限 ly := ((y-1)/$2)::int * $2 + 1; -- y上限 uy := ((y-1)/$2)::int * $2 + $2; -- 计算BOX内有多少个未填充的像素 select sum(case arr when 0 then 1 else 0 end) from (select ($1)[xx][yy] as arr from (select generate_series(lx,ux) xx) t1, (select generate_series(ly,uy) yy) t2 ) t into vb; -- 将XYB的值,写入结果变量的对应像素中 res[x][y] := format('(%s,%s,%s,%s,%s)',x,y,vx,vy,vb)::xyb; end if; end loop; end loop; return res; end; $$ language plpgsql strict immutable;
3、用法举例
计算以下2为基数,4*4的矩阵的xyb值
{1,2,3,4}, {0,1,1,0}, {0,1,1,0}, {0,1,1,0}
postgres=# select array(select (comp_xyb('{ {1,2,3,4},{0,1,1,0},{0,1,1,0},{0,1,1,0}}', 2))[x][generate_series(1,4)]) from generate_series(1,4) t(x); array ----------------------------------------------------------- {"(1,1,0,0,0)","(1,2,0,0,0)","(1,3,0,0,0)","(1,4,0,0,0)"} {"(2,1,2,3,1)","(2,2,0,0,0)","(2,3,0,0,0)","(2,4,2,3,1)"} {"(3,1,2,3,2)","(3,2,0,0,0)","(3,3,0,0,0)","(3,4,2,3,2)"} {"(4,1,2,3,2)","(4,2,0,0,0)","(4,3,0,0,0)","(4,4,2,3,2)"} (4 rows)
使用unnest可以解开,按XYB三个方向总大小排序,再按某个方向最大排序,从而做到逐级收敛,真正每一次填充的像素,都是具备最大概率的像素。
postgres=# select * from unnest( comp_xyb('{ {1,2,3,4},{0,1,1,0},{0,1,1,0},{0,1,1,0}}', 2)) t where t.x+t.y+t.b <> 0order by (t.x+t.y+t.b) desc, greatest(t.x,t.y,t.b) desc; ax | ay | x | y | b ----+----+---+---+--- 3 | 1 | 2 | 3 | 2 3 | 4 | 2 | 3 | 2 4 | 1 | 2 | 3 | 2 4 | 4 | 2 | 3 | 2 2 | 1 | 2 | 3 | 1 2 | 4 | 2 | 3 | 1(6 rows)
通过这个SQL得到了某个像素,这个像素的XYB方向上,还有最多的像素没有被填充。
因此这个像素如果生成一个随机值的话,违反数独的约束(或者叫冲突)的概率是最小的。
postgres=# select * from unnest( comp_xyb('{ {1,2,3,4},{0,1,1,0},{0,1,1,0},{0,1,1,0}}', 2)) t where t.x+t.y+t.b <> 0order by (t.x+t.y+t.b) desc, greatest(t.x,t.y,t.b) desc limit 1; ax | ay | x | y | b ----+----+---+---+--- 3 | 1 | 2 | 3 | 2(1 row)
用AX,ZY坐标值,往矩阵的这个像素填充符合数独条件的随机值,可以大幅提高构造可解数独的概率。
本文先介绍如何得到这样的一个像素,填充一个值进行,这个值的取值区间应该是最大的(最不会与数独的游戏规则违背),从而更大可能的生成一个完整可解的数独。
下面一篇文章再介绍如何生成一个N*N的数独。
NP完全问题近似求解。
转载地址:http://qsujl.baihongyu.com/