動的計画法による最大化問題

参照：JavaScriptの計算プログラム

最適配分問題の説明

動的計画法により、
　　　目的関数：R_x = f₁(x₁) + f₂(x₂) + ・・・ + f_n(x_n) →最大
　　　制約条件：Ｑ＝x₁ + x₂ + ・・・ + x_n ≦ Ｑmax　　0 ≦ x_i ≦ xmax_i
を解く方法を解説します。

これは、「ｎ個の投資があり、投資ｉに x_i の資金を配分したときの利益が f_i(x_i) であるとしたとする。全投資のための資金の上限がＱmaxであるとき、利益最大にする各投資への資金配分額を求めよ。ただし、投資ｉに配分できる資金は 0 ≦ x_i ≦ xmax_i であるとする。」という意味です。
　数値例では、３個の投資について、配分費用と利益が表のように与えられているとき、資金上限が４であるとすれば、各投資への配分を求めることになります（その解答は、投資１に１、投資２に１、投資３に２としたとき利益は最大値１５になります）。

　　　　　　　　　　　配分資金　　　　　上限値
　　　　　　　　０　　１　　２　　３　　(xmax)
　↓　投資１　　０　　２　　４　　６　　　３
　ｉ　投資２　　０　　５　　５　　６　　　３
　　　投資３　　０　　０　　８　　－　　　２

ここで、ある投資に配分限界以上に資金を配分したときには、限界内での最大利益になるという条件をつけましょう。例えば、投資１に４の資金を配分したときの利益は６、投資３に３の資金を配分した（表の「－」の部分）ときの利益は８であるとします。

動的計画法による解

最適性の原理によって、
　　　P_i(Q) = max{ f_i(x_i) + P_i-1(Q-x_i) }　　i=２～ｎ　　0 ≦ Q ≦ Qmax　　0 ≦ x_i ≦ Q
　　　P₁(Q) = max{ f₁(x₁)　　x₁=0～Q } = f₁(Q)　　0 ≦ Q ≦ Qmax
の関係があります。

上の式は、次のことを表しています。
max{ } の中は、全体の配分資金をＱとしたとき、
　　新投資ｉを加えたときの利益
　　　＝「新投資ｉに x_i を配分したときの利益」　　f₂(x₂)
　　　＋「それまでの投資にＱ－x_i を投資したときの最大利益」　　P₁(Q-x₂)
であり、
　P_i(Q) とは、x_i を０～Ｑまで変化させたときの最大利益、すなわち、資金がＱで新投資ｉを加えたときの最大利益を示しています。
　このように、「全体の配分が最適なときは、新しい投資にどのような決定をするかに関係なく、それまでの投資での最適配分は維持される」というのが最適性の原理であり、「それまでの投資での最適配分」を記録しておき、有効に活用するのが動的計画法の特徴なのです。

上の式では、P_i-1 を用いているので、最初の投資１に適用することはできません。それで、投資１（ｉ＝１）には下の式が必要になります。
　投資１では、x₁＝Ｑになります。それで、f₁(x₁) で x_i を０～Ｑまで変化させたときの最大利益を P₁(Q) とするのですが、実務的に考えれば「配分を多くしたら利益が下がる」ような場合は、利益最大のところで打ち切るでしょうから、f₁(x₁) は右上がりになっているはずです。それで、　　max{ f₁(x₁) } = f₁(Q) とすることができます。

これを用いて上の問題を解いてみましょう。この手順は、まず投資１だけの場合を計算し、次に投資２を加えたときを計算し、次に投資３を・・・というように計算していきます。そのとき、直前の結果を記録しておくことにより、計算量を少なくしています。

全投資資金の上限Ｑmax＝４とします。
●ｉ＝１（投資１だけのとき）
　上の表から、xmax₁ = 3
　　f₁(0) = 0　　f₁(1) = 2　　f₁(2) = 4　　f₁(3) = 6
になっています。
　例えば f₁(2) = 4 とは、「投資１に２の資金を配分したときの利益は４である」ことを示しています。そして、
　　P₁(x₁) = f₁(k₁)
　ですので、
　　P₁(0) = f₁(0) = 0
　　P₁(1) = f₁(1) = 2
　　P₁(2) = f₁(2) = 4
　　P₁(3) = f₁(3) = 6
になります。
　さらに、「配分上限値以上の配分をしたときは、限界内での最大値とする」という条件により、
　　P₁(4) = 6
とします。
　結果として、ｉ＝１が完了したときには、
　　　P₁(0)=0, P₁(1)=2, P₁(2) = 4, P₁(3) = 6, P₁(4) = 6
になっています。

●ｉ＝２（投資２を加えたとき）
　ここまでに、
　　　P₁(0) = 0　　　f₂(0) = 0
　　　P₁(1) = 2　　　f₂(1) = 5
　　　P₁(2) = 4　　　f₂(2) = 5
　　　P₁(3) = 6　　　f₂(3) = 6
　　　P₁(4) = 6
がわかっており、
　　P₂(Q) = max{ f₂(x₂) + P₁(Q-x₂) }　　0 ≦ Q ≦ Qmax　　x₂ = 1～Q
を用いて計算します。

Ｑ＝０（資金が０のとき）
　　P₂(0) = max{ f₂(0) + P₁(0-x₂) x₂=0} = 0 + 0 = 0
Ｑ＝１（資金が１のとき）
　　P₂(1) = max{ f₂(x₂) + P₁(1-x₂)　　x₂=0～1}
　　　　投資２に０を配分（投資１に１を配分）　f₂(0) + P₁(1) = 0 + 1 = 2
　　　　投資２に１を配分（投資１に０を配分）　f₂(1) + P₁(0) = 5 + 0 = 5 ←max
　　　＝５
Ｑ＝２（資金が２のとき）
　　P₂(2) = max{ f₂(x₂) + P₁(1-x₂)　　x₂=0～2}
　　　　投資２に０を配分（投資１に２を配分）　f₂(0) + P₁(2) = 0 + 4 = 4
　　　　投資２に１を配分（投資１に１を配分）　f₂(1) + P₁(1) = 5 + 2 = 7 ←max
　　　　投資２に２を配分（投資１に０を配分）　f₂(2) + P₁(0) = 5 + 0 = 5
　　　＝７
Ｑ＝３（資金が３のとき）
　　P₂(2) = max{ f₂(x₂) + P₁(1-x₂)　　x₂=0～3}
　　　　投資２に０を配分（投資１に３を配分）　f₂(0) + P₁(3) = 0 + 6 = 6
　　　　投資２に１を配分（投資１に２を配分）　f₂(1) + P₁(2) = 5 + 4 = 9 ←max
　　　　投資２に２を配分（投資１に１を配分）　f₂(2) + P₁(1) = 5 + 2 = 7
　　　　投資２に３を配分（投資１に０を配分）　f₂(3) + P₁(0) = 6 + 0 = 6
　　　＝７
Ｑ＝４（資金が４のとき）
　　P₂(2) = max{ f₂(x₂) + P₁(1-x₂)　　x₂=0～4}
　　　★投資２に０を配分（投資１に４を配分）　f₂(0) + P₁(4) = 0 + 6 =　6
　　　　投資２に１を配分（投資１に３を配分）　f₂(1) + P₁(3) = 5 + 6 = 11 ←max
　　　　投資２に２を配分（投資１に２を配分）　f₂(2) + P₁(2) = 5 + 4 =　9
　　　　投資２に３を配分（投資１に１を配分）　f₂(3) + P₁(1) = 6 + 2 =　8
　　　★投資２に４を配分（投資１に０を配分）　f₂(4) + P₁(0) = 6 + 0 =　6
　　　＝１１
　結果として、ｉ＝２が完了したときには、
　　　P₂(0)=0, P₂(1)=5, P₂(2) = 7, P₂(3) = 9, P₂(4) = 11
になっています。

（★は、x_i＞xmax_i、または、Q-x_i＞max{ xmax_k　　k=１～i-1 } のときは、各投資の配分上限以上に配分することであり、それが最大になることはないので計算する必要はありません。以下同様です。）

●ｉ＝３（投資３を加えたとき）
　ここまでに、
　　　P₂(0) = 0　　　f₃(0) = 0
　　　P₂(1) = 5　　　f₃(1) = 0
　　　P₂(2) = 7　　　f₃(2) = 8
　　　P₂(3) = 9　　　f₃(3) = 8★
　　　P₂(4) = 11
がわかっており、
　　P₃(Q) = max{ f₃(x₃) + P₂(Q-x₂) }　　0 ≦ Q ≦ Qmax　　x₃ = 1～Q
を用いて計算します。
　f₃(x₃) は、全体の資金Ｑのうち、投資３に x₃ を配分したときの利益であり、P₂(Q-x₂) は、残りの資金Ｑ－x₃ を、これまでの投資（投資１と投資２）に配分したときの最大利益です。

Ｑ＝０（資金が０のとき）
　　P₃(0) = max{ f₃(0) + P₂(0-x₂) x₃=0} = 0 + 0 = 0
Ｑ＝１（資金が１のとき）
　　P₃(1) = max{ f₃(x₃) + P₂(1-x₃)　　x₃=0～1}
　　　　投資３に０を配分（投資１・２に１を配分）　f₃(0) + P₂(1) = 0 + 5 = 5 ←max
　　　　投資３に１を配分（投資１・２に０を配分）　f₃(1) + P₂(0) = 0 + 0 = 0
　　　＝５
Ｑ＝２（資金が２のとき）
　　P₃(2) = max{ f₃(x₃) + P₂(2-x₃)　　x₃=0～2}
　　　　投資３に０を配分（投資１・２に２を配分）　f₃(0) + P₂(2) = 0 + 7 = 7
　　　　投資３に１を配分（投資１・２に１を配分）　f₃(1) + P₂(1) = 0 + 5 = 5
　　　　投資３に２を配分（投資１・２に０を配分）　f₃(2) + P₂(0) = 8 + 0 = 8 ←max
　　　＝８
Ｑ＝３（資金が３のとき）
　　P₃(3) = max{ f₃(x₃) + P₂(3-x₃)　　x₃=0～3}
　　　　投資３に０を配分（投資１・２に３を配分）　f₃(0) + P₂(3) = 0 + 9 =　5
　　　　投資３に１を配分（投資１・２に２を配分）　f₃(1) + P₂(2) = 0 + 7 =　7
　　　　投資３に２を配分（投資１・２に１を配分）　f₃(2) + P₂(1) = 8 + 5 = 13 ←max
　　　★投資３に３を配分（投資１・２に０を配分）　f₃(3) + P₂(0) = 8 + 0 =　5
　　　＝１３
Ｑ＝４（資金が４のとき）
　　P₃(3) = max{ f₃(x₃) + P₂(3-x₃)　　x₃=0～4}
　　　★投資３に０を配分（投資１・２に４を配分）　f₃(0) + P₂(4) = 0 +13 = 13
　　　　投資３に１を配分（投資１・２に３を配分）　f₃(1) + P₂(3) = 0 + 9 =　9
　　　　投資３に２を配分（投資１・２に２を配分）　f₃(2) + P₂(2) = 8 + 7 = 15 ←max
　　　★投資３に３を配分（投資１・２に１を配分）　f₃(3) + P₂(1) = 8 + 5 = 13
　　　★投資３に４を配分（投資１・２に０を配分）　f₃(4) + P₂(0) = 8 + 0 =　8
　　　＝１３
　結果として、ｉ＝３が完了したときには、
　　　P₃(0)=0, P₃(1)=5, P₃(2) = 8, P₃(3) = 13, P₃(4) = 15
になっています。

これより、
　　　P₃(0) から、投資資金０のときは、最大利益は　０
　　　P₃(1) から、投資資金１のときは、最大利益は　５
　　　P₃(2) から、投資資金２のときは、最大利益は　８
　　　P₃(3) から、投資資金３のときは、最大利益は１３
　　　P₃(4) から、投資資金４のときは、最大利益は１５
であることがわかります。

最大利益１５になるときの各投資への配分、x₁、x₂、・・・、x_n は、次の手順で知ることができます。

ｉ＝３、Ｑ＝４、x₃＝２のときで最大になったのですから、投資３に２を配分します。残りの資金２（＝Ｑmax－x₃）が、投資１と投資２に配分されたことがわかります。
ｉ＝２、Ｑ＝２のときは、x₂＝１のときに最大になったのだから、投資２に１を配分したときだとわかり、
その残り１（２－１）を投資１に配分すればよいことがわかります。

配分資金	投資１	投資２	投資３
1
2
3