動的計画法の概要

動的計画法（Dynamic Programming）とは、最適性の原理を用いて、多段決定問題を取り扱うＯＲ技法です。
　最適性の原理とは、「決定の全系列にわたって最適化を行うためには，初期の状態と最初の決定がどんなものであっても，残りの決定は最初の決定から生じた状態に関して最適な政策を構成していなければならない」（ＪＩＳの定義）ということです。いいかえれば、「全体が最適化されたときは、その部分も最適化されている」ということです。

最短経路問題による考え方の説明

例えば、次のような経路と所要時間があるとき、ＡからＫまで行く時間を最小になる経路を探すとき、全体の最短経路がＧを経由するとすれば、ＡからＧまでの最短経路がわからなくても、ＧからＫまでは最短経路になっていなければならないということです。
→詳細説明と計算プログラム：「最短経路問題」（or-dp-shortpath）

最適配分問題による最適性の原理の説明

動的計画法では、小さな部分問題を計算して得られた解を記録しておき、それを、さらに大きい問題を解くために有効に使うことが特徴です。
　例えば、いくつかの投資案について、投資資金と利益の表が与えられ、全体の投資上限額が与えられたとき、利益を最大にするために、どのように資金を配分すべきかという問題を考えます。
　投資ｉにｘ_ｉ万円を配分したときの利益を、ｆ_ｉ(ｘ_ｉ) 万円とし、全体の投資上限額をＱmax万円とすれば、
　　　　目的関数：ｆ_１(ｘ_１) ＋ｆ_２(ｘ_２) ＋・・・＋ｆ_ｎ(ｘ_ｎ) →最大
　　　　制約条件：ｘ_１＋ｘ_２＋・・・＋ｘ_ｎ＝Ｑ≦Ｑmax
と定式化されます。

まず、投資案１に、ｘ＝０,１,２，・・・,Ｑmax万円かけたときの最大利益Ｐ_１(ｘ) はｆ_１(ｘ) になります。Ｐ_１(ｘ) を記録しておきます。
　次に投資案２を加えてｘ万円を配分すると、投資案２からｆ_２(ｘ) の利益があり、それまでの投資への配分はＱ－ｘ万円になるので、その利益はＰ_１(Ｑ－ｘ) となります。それで、投資案２を加えたときの最大利益Ｐ_２(ｘ) は、
　　　　Ｐ_２(ｘ) ＝ｍａｘ｛ｆ_２(ｘ) ＋Ｐ_１(Ｑ－ｘ)｝　　ｘ＝０,１,２，・・・,Ｑ
となります。
　これを一般化すれば、
　　　　Ｐ_ｉ(ｘ) ＝ｍａｘ｛ｆ_ｉ(ｘ) ＋Ｐ_ｉ－１(Ｑ－ｘ)｝　　ｘ＝０,１,２，・・・,Ｑ
になります。このようにして、投資ｎまでを行えば、全体の最適配分を求めることができます。

ここで、ｆ_ｉ(ｘ) ＋Ｐ_ｉ－１(Ｑ－ｘ) を最大とするｘの値をｘ_ｉ(Ｑ) に記録しておくと、次に加えられる投資のいかんにかかわらず、投資ｉまでの配分がｋだとすれば、その配分構成ｘ_ｉ(Ｑ) は変わらないことになります。これが最適性の原理です。
→詳細説明と計算プログラム：「動的計画法による最適配分問題」（or-dp-max）

ナップザック問題による計算量の説明

最適配分問題を拡張したものにナップザック問題があります。
　ナップザック問題とは、ナップザックには最大重量がＱmax であり、入れたい品物の重量ｗ_ｉと、入れることによる利益ｗ_ｉが与えられているとき、利益を最大にするには、どの品物を選択すればよいかという問題です。次の式で表現できます。
　　　目的関数：f₁x_i ＋ f₂x_i ＋・・・＋ f_nx_i →最大
　　　制約条件：w₁x_i ＋ w₂x_i ＋・・・＋ w_nx_i ＝Ｑ≦Ｑmax
　これは、最適配分問題と同じような手順で解くことができます。
→詳細説明と計算プログラム：「ナップサック問題」（or-dp-knapsack）

とくに、同一の品物が１個だけのとき（x_i が０または１だけのとき）を０－１ナップザック問題といいます。それを例にして、動的計画法により計算量が小さくなる（短時間で計算できる）ことを示します。
　品物の個数がｎであるとき、すべてのケースを総当たりで調べる方法では、品物ｉを選択するかどうかの２通りなので、ｎ個では２^ｎ回になり、最大利益を探すのにｎ回の計算が必要になるので、全体として２^×ｎｎ回の計算が必要になります。そのため、ｎが大きくなると、実際に解くことが不可能です（そのような問題をＮＰ完全問題といいます）。
　それに対して動的計画法を用いると、「品物ｉを加えたときに、ｎ回の計算をして最大利益を得る」計算をｉを１からｎまで行うのですから、ｎ^２に比例した回数でよいことになります。