就靠你给的这5个条件,不是那么容易构造的,首先它就不是数学上的描述。而且我估计满足这些条件的解也不是唯一的(也可能没有解,反正我还没仔细研究)。
有些的概率论知识的人都知道,给出一列随机数,至少可以分成两类:
一类就是前后之间的随机量是独立的,前面的数是几,和后面的数没关系。只要研究出整体的分布规律,那么这个规律就适用于所有的数(其实就是随机序列退化为随机变量)。比如如果是均匀分布,那么不管前面是怎么样的序列,下一个数是几的概率都是1/26。但这种情况可能不是楼主要的。
另一类,就是前后的不独立。那么此时也有多种理论可以研究它:
比如认为该数列是来自某一总体的抽样(数理统计)。这是从整体分布的角度考虑数列,但因为它们的独立性不能保证,此时也许不能认为这列数是简单随机样本。
另一种是专门从前后影响关系出发考虑(随机过程)。这样,从理论上讲,我们就要研究有限维分布(可以理解成以序列的长度为划分单位,来研究不同长度的序列之下数之间的前后影响关系)。一般来说,这是极为困难的。即使在单个变量的分布规律已知的情况下,这也可能很不容易。
另外楼主给出条件的描述离数学描述很远。
比如第一个条件,可以有很多种理解:假如按数理统计来考虑,我假设整体是均匀分布,那么既可以构造样本的 χ2分布,也可以构造样本的 K分布,然后按求拟然率之类方法的求出每个数的概率。不过一旦这样做,模型基本就算定了,只能用这个模型构造出的结果,检查剩下的条件是否都满足。
另一点比较有意思的是,楼主给的 1,3,4,5 这些条件都是定性描述的,比如“什么什么的概率大一点”“什么什么的要大得多”。但 2 是定量的。
当然定量描述更好,因为 2 的描述最接近数学描述。但 “第一个数是 20的概率是 1/26,第二个数是 20 的概率是 1/26^2” 这种描述,似乎是想暗示我们这个是序列是前后独立的,第一次出现 20 这个事件,并没有影响第二次出现 20 的概率(还是 1/26)。
考虑到楼主的数学功底可能不是很好。我也许希望楼主提供更多一些的背景知识:比如做这个小软件是用来估算什么的?用它来计算的序列是从哪里产生的?是否已经有很多序列的样本,可以提供用来观察序列特性?
也许只是楼主自己意会的数学模型不正确而已。没准问题有其它的解决办法。