Pythonから混合整数計画ソルバー(MIP solver)を使用

tk87

3 4月, 2022

はじめに

数理最適化の問題を解くときに第一に挙がることが多いのが線形/整数計画法だというイメージはあるが、いつもheuristic的な解法に頼りきりで、使えると便利だろうなと思う場面がありながらほとんど混合整数計画法には手を出していなかったので一度は触った方がよいと思い試してみました。以前C++でシンプレックスで分枝限定法でソルバーを作ってみたことはあるが、性能的には悲惨な状態でツールを使った方がはやいと感じたりしたので放置状態でした。本格的に使用したいわけではなく考察の補助として使用できればと考えています。

PythonのMIP Solver

混合整数計画法おそらく一番に挙がるのがgurobiだと思うが、ライセンスが必要で若干面倒なので手軽に使えるCOIN CBCを使用した。さらに性能が必要だと感じたらまた考える。 COIN CBCのPythonインターフェースライブラリとしては

PuPL
Python-MIP

があるようなのでこれらを使用してみて良い方を選ぶことにしました。

数独(Sudoku)ソルバーを作る

まず練習で数独ソルバーを作りました。数独は9*9の81マスに数字を埋めるパズルですが、1マスにつき1-9の9つのバイナリ変数を設定します。よって変数の数は9*9*9個になります。例えば、(i,j)=(2,4)のマスに5が入る場合は$X_{5,2,4}=1$となります。ルールでは行、列、3*3の正方形ブロックにはそれぞれ1-9の数字が一つずつ入るので、

$\sum ^{9}_{i=1}x_{i,j,k}=1$

$\sum ^{9}_{j=1}x_{i,j,k}=1$

$\sum ^{3}_{i=1}\sum ^{3}_{j=1}x_{i,j,k}=1$

のように制約が定式化されます。三つ目の式はブロックの制約で行・列それぞれに3つ合計9つ分が必要になります。まずメイン部分は以下になります。 PuPLのドキュメントのものとほぼ同じです。

    #PuPL
import pulp as pl
# Python-MIP
# import mip
import time
from functools import wraps

def timer(func):
    @wraps(func)
    def wrapper(*args, **kargs):
        start = time.time()
        result = func(*args, **kargs)
        elapsed_time = time.time() - start
        print(f"elapsed {elapsed_time * 1000:.2f} ms")
        return result
    return wrapper

def main():
    with open("sudoku_data.txt") as f:
        data = [list(map(int, s.split())) for s in f.readlines()]

    choices = solve_sudoku(data)

    for r in range(1, 10):
        for c in range(1, 10):
            for v in range(1, 10):
                if pl.value(choices[v][r][c]) == 1:
                #if choices[v][r][c].x == 1:
                    print(v, end=" ")
        print()

PulPのソルバー部分は以下になります。

    @timer
def solve_sudoku(data):
    VALS = ROWS = COLS = range(1, 10)
    Boxes = [
        [(3 * i + k + 1, 3 * j + l + 1) for k in range(3) for l in range(3)]
        for i in range(3)
        for j in range(3)
    ]

    prob = pl.LpProblem("Sudoku_Problem")

    choices = pl.LpVariable.dicts("Choice", (VALS, ROWS, COLS), cat="Binary")

    for (v, r, c) in data:
        prob += choices[v][r][c] == 1

    for r in ROWS:
        for c in COLS:
            prob += pl.lpSum([choices[v][r][c] for v in VALS]) == 1
    
    for v in VALS:
        for r in ROWS:
            prob += pl.lpSum([choices[v][r][c] for c in COLS]) == 1
        for c in COLS:
            prob += pl.lpSum([choices[v][r][c] for r in ROWS]) == 1
        for b in Boxes:
            prob += pl.lpSum([choices[v][r][c] for (r, c) in b]) == 1

    prob.solve(pl.PULP_CBC_CMD(msg=0))

    print("Status:", pl.LpStatus[prob.status])

    return choices

Python-MIPのソルバー部分は以下になります。 PuPLとほとんど同じように書くことができます。

    @timer
def solve_sudoku(data):
    VALS = ROWS = COLS = range(9)
    Boxes = [
        [(3 * i + k, 3 * j + l) for k in range(3) for l in range(3)]
        for i in range(3)
        for j in range(3)
    ]

    model = mip.Model()

    x = [[
        [model.add_var(var_type=mip.BINARY) for j in COLS]
        for i in ROWS] for k in VALS]
    
    for (v, r, c) in data:
        model += x[v-1][r-1][c-1] == 1

    for r in ROWS:
        for c in COLS:
            model += mip.xsum(x[v][r][c] for v in VALS) == 1
    
    for v in VALS:
        for r in ROWS:
            model += mip.xsum(x[v][r][c] for c in COLS) == 1
        for c in COLS:
            model += mip.xsum(x[v][r][c] for r in ROWS) == 1
        for b in Boxes:
            model += mip.xsum(x[v][r][c] for (r, c) in b) == 1

    model.threads = -1
    model.verbose = 0

    model.optimize()

    print("Status:", model.status)

    return x

実際に実行したところ、 https://sudoku.com/ のEvilレベルを100ms以下で解くことができました。普通の枝狩りDFSでもこれほどは速くは解けないのでかなり速いです。この程度ならPuPL、Python-MIPどちらでも速度や使用感の差はありません。

TSPソルバー

続いて二つのソルバーの比較と使用感を確認するためTSPソルバーを作りました。こちらのソースコードを書いている途中、PuLPの付属CBCバイナリにはマルチスレッドが対応していないことに気づきました。 coinbrewという独自のビルダーでビルドをしなくてはならないようなので、こちらのマルチスレッド化はあきらめました。 Python-MIPの方は確認したところマルチスレッドにも対応していました。無向グラフの場合の定式化は以下になります。まず目的関数は以下を最小化することです。dijは頂点間距離、xijは辺ijを使用するかどうかのバイナリ変数です。

$\sum _{i,j}d_{ij}x_{ij}$

各頂点の入次数と出次数は1なので

$\sum _{j\in V/\{i\}}x_{i,j}=1$

$\sum _{i\in V/\{j\}}x_{i,j}=1$

また複数のループが発生しないように頂点0(始点/終点)以外の頂点にポテンシャルを導入してたどる順番にポテンシャルが増加するようにします。

$v_{i}-\left( n+1\right) x_{ij}\geq v_{j}-n$

PuLPの場合ソースコードは以下になります。

    @timer
def solve_tsp(dists):
    n = len(dists)

    prob = pl.LpProblem("TSP", pl.LpMinimize)
    
    x = pl.LpVariable.dicts("vertex",(range(n), range(n)), cat="Binary")
    y = pl.LpVariable.dicts("potential", range(n), 0, None)

    prob += pl.lpSum(dists[i][j] * x[i][j] for i in range(n) for j in range(n))

    for i in range(n):
        prob += pl.lpSum(x[i][j] for j in range(n) if i!=j) == 1

    for i in range(n):
        prob += pl.lpSum(x[j][i] for j in range(n) if i!=j) == 1

    for i in range(n):
        for j in range(n):
            if i!=0 and j!=0 and i!=j:
                prob += y[i] - (n+1)*x[i][j] >= y[j]-n

    prob.solve(pl.PULP_CBC_CMD(msg=0))

    print("Status:", pl.LpStatus[prob.status])
    print("objective", pl.value(prob.objective))

    return x

Python-MIPの場合は以下になります。 model.threadsを-1としてmultithread化しています。

    @timer
def solve_tsp(dists):
    n = len(dists)

    model = mip.Model()

    x = [
        [model.add_var(var_type=mip.BINARY) for j in range(n)]
        for i in range(n)]
    y = [model.add_var() for i in range(n)]

    model.objective = mip.minimize(mip.xsum(dists[i][j]*x[i][j] for i in range(n) for j in range(n)))

    for i in range(n):
        model += mip.xsum(x[i][j] for j in range(n) if i!=j) == 1

    for i in range(n):
        model += mip.xsum(x[j][i] for j in range(n) if i!=j) == 1

    for i in range(n):
        for j in range(n):
            if i!=0 and j!=0 and i!=j:
                model += y[i] - (n+1)*x[i][j] >= y[j]-n

    model.threads = -1
    model.verbose = 0

    model.optimize()

    print("Status:", model.status)
    print("objective", model.objective_value)

    return x

最初は頂点100辺数100*99で試しましたが短時間では完了しそうになかったので、頂点数を30に減らして行いました。頂点の生成にはまずx,y座標をrandom整数で0-300の範囲で作成し、それぞれの頂点間距離をユークリッド距離で算出し小数点以下を切り捨てて整数にして辺のコストとしました。以下は上記ソースコードで得られたTSPの解を自作で作ったRust+wasmのTSPソルバー兼ビジュアライザーによって図示したものです。

インターフェースライブラリ比較

以下に30頂点870辺TSPの実行時間による比較を示します。シングルスレッドで差が出ているのはcbcバイナリのバージョンの差と思われます。 Python-MIPはマルチスレッドの効果を確認できました。

各条件での実行時間比較(5回平均sec)i5-7600 CPU RAM 16GB
PuLP	Python-MIP	Python-MIP(multithread)
27.69	18.83	9.76

TSPをMIPソルバーで解くのは向いていないようでしたが、今回はお試しと比較が目的なので問題はありません。変数の数と式の数は辺数オーダーになるので仕方ありません。どちらかというと近似解を求めてからMIPソルバーにかけるという方法の方が良いように思います。

その他機能等について

双方のライブラリにもwarm start、time limit、下界(上界)とのgap差条件による停止、モデルの保存、特定の変数の固定機能は使えるようでどちらもほぼ同じ感じで使用可能です。ただofficialのドキュメントはPython-MIPの方が詳しく記載されていました。マルチスレッドの機能の面も考慮するとPuPLよりはPython-MIPの方が使用しやすそうです。ただ1.13.0よりバージョンが更新されていないことだけは気になります。しばらくはPython-MIPをメインに使用することにします。

Reference

tk87

化学系院卒のエンジニアです / Python, Rust, C++の使用頻度が高いです

Pythonから混合整数計画ソルバー(MIP solver)を使用

はじめに

PythonのMIP Solver

数独(Sudoku)ソルバーを作る

TSPソルバー

インターフェースライブラリ比較

その他機能等について

Reference

tk87

Categories

Blog Archive

Popular Posts

はじめに

PythonのMIP Solver

数独(Sudoku)ソルバーを作る

TSPソルバー

インターフェースライブラリ比較

その他機能等について

Reference

tk87

Categories

Blog Archive

Popular Posts

Pythonによる背景除去(Image Matting)モデル・ライブラリの紹介

Pythonによる画像背景除去方法(DeepLearning)

Pythonから混合整数計画ソルバー(MIP solver)を使用

ShaderToy用のVSCode拡張機能

セグメンテーション情報から写真画像生成(SPADE/GauGAN)