本文共 946 字,大约阅读时间需要 3 分钟。
生成线性相关的测试数据。
同样可以用到generate_series和随机数。 例子 生成10万条随机数字。select trunc(10000 + 1000000*random()) id from generate_series(1,100000);
根据刚才那组数据,加减5以内的随机数,生成另一组数字。
select id, trunc(id + 5-random()*10) from (select trunc(10000 + 1000000*random()) id from generate_series(1,100000)) t;
如下
postgres=# create table corr_test(c1 int, c2 int);CREATE TABLEpostgres=# insert into corr_test select id, trunc(id + 5-random()*10) from (select trunc(10000 + 1000000*random()) id from generate_series(1,100000)) t;INSERT 0 100000
线性相关性如下:
postgres=# select corr(id, trunc(id + 5-random()*10)) from (select trunc(10000 + 1000000*random()) id from generate_series(1,100000)) t; corr ------------------- 0.999999999954681(1 row)... ...postgres=# select corr(id, trunc(id + 5-random()*10)) from (select trunc(10000 + 1000000*random()) id from generate_series(1,100000)) t; corr ------------------- 0.999999999954898(1 row)
p元回归的测试数据也可以使用以上方法生成。
转载地址:http://ghwcl.baihongyu.com/