Yükseklik Fonksiyonu (Tepeler) Arasından En Düz, Optimal Yürüyüş Yolunu Bulmak

Elimizde bir alan içindeki yükseklikleri veren bir fonksiyon \(f(x,y)\) olduğunu düşünelim. Acaba verili bir başlangıç ve bitiş noktası arasındaki en “rahat’’ gidiş yolunu nasıl buluruz?

Yükseklikler bir \(E(x,y)\) fonksiyonunda olsun. Yolları nasıl temsil ederiz? Bir parametrik eğri kullanabiliriz, mesela

İstediğimiz derecede polinom parametrize eğrileri nasıl yaratacağımızı biliyoruz [3]. Böylece doğru, optimal bir yolu bulmak demek \(a_0,a_1,a_2,a_3,b_0,b_1,b_2,b_3\) katsayılarını doğru bulmak demek olacaktır. Bir optimizasyon problemi yani.

Peki o zaman optimize, minimize edilecek bedel fonksiyonu ne olmalı? Burada farklı yaklaşımlar olabilir.

Önce yükseklikleri ve eğrileri iki örnek üzerinde görelim. Bir rasgele tepe, ve bir rasgele yol çiziyoruz,

from mpl_toolkits.mplot3d import Axes3D
from scipy.spatial.distance import cdist
from matplotlib import cm
import sympy
from scipy.optimize import minimize, Bounds

def gfunc1(x, y):
    s1 = 2.2; x1 = 2.0; y1 = 2.0
    g1 = np.exp( -4 *np.log(2) * ((x-x1)**2+(y-y1)**2) / s1**2)
    return g1 * 10.0

def plot_surf_path(myfunc,a0,a1,a2,a3,a4,b0,b1,b2,b3,b4):

    D = 50
    x = np.linspace(0,5,D)
    y = np.linspace(0,5,D)
    xx,yy = np.meshgrid(x,y)
    zz = myfunc(xx,yy)

    fig, ax = plt.subplots(1, 1, subplot_kw={'projection': '3d'})
    ax.set_xlim(0,5)
    ax.set_ylim(0,5)
    surf = ax.plot_wireframe(xx, yy, zz,rstride=10, cstride=10)

    t_plot = np.linspace(0,1.0,100)

    x_plot = a0 + a1*t_plot + a2*t_plot**2 + a3*t_plot**3 + a4*t_plot**4
    y_plot = b0 + b1*t_plot + b2*t_plot**2 + b3*t_plot**3 + b4*t_plot**4

    ax.plot3D(x_plot, y_plot, myfunc(x_plot,y_plot),'r.')

# 1. gidis yolunun tanimi, uzun yoldan dolanarak gidiyor
a1_test,a2_test,a3_test = 1.5, 8.1, 4.0
b1_test,b2_test,b3_test = 0.3, 0.4, 23.3
a0_test,b0_test=(1.0,1.0)
ex_test,ey_test=(0.3,4.0)
a4_test = ex_test - a0_test - (a1_test+a2_test+a3_test)
b4_test = ey_test - b0_test - (b1_test+b2_test+b3_test)
test_coefs1 = (a0_test,a1_test,a2_test,a3_test,a4_test,b0_test,b1_test,b2_test,b3_test,b4_test)
plot_surf_path(gfunc1,*test_coefs1)

Başlangıç ve bitiş noktalarını nasıl formüle dahil ettiğimize dikkat, \(t=0\) olduğu anda \(x(t),y(t)\) değerleri sırasıyla \(a_0\) ve \(b_0\)’dir bunlar başlangıç değerleridir. Bitiş noktası ise \(t=1\) anında sahip olunması gereken değerdir, bu noktada

\[ x(1) = a_0 + a_1 + a_2 + a_3 + a_4 ,\quad y(1) = b_0 + b_1 + b_2 + b_3 + b_4 \]

olacağı için bitiş noktalarına \(e_x,e_y\) diyelim, \(x(t)\) için \(a_1,a_2,a_3\) katsayılarının değişmesine izin veririz, fakat sonuncu katsayı \(a_4\)’un ne olacağını formülde \(e_x\) üzerinden zorlarız, yani \(a_4 = e_x - (a_0 + a_1 + a_2 + a_3)\) hesabını yaparız. Böylece \(a_0 + a_1 + a_2 + a_3 + a_4\) toplamı \(e_x\) sonucunu vermelidir. \(y(t)\) ve \(e_y\) için benzer mantığı kullanırız. Bu şekilde başlangıç, bitiş noktalarını genel formülasyon üzerinde zorlamış olduk.

a1_test,a2_test,a3_test = 1.5, 3.0, 1.0
b1_test,b2_test,b3_test = 0.0, 1.0, 1.0
a0_test,b0_test=(1.0,1.0)
ex_test,ey_test=(0.3,4.0)
a4_test = ex_test - a0_test - (a1_test+a2_test+a3_test)
b4_test = ey_test - b0_test - (b1_test+b2_test+b3_test)
test_coefs2 = (a0_test,a1_test,a2_test,a3_test,a4_test,b0_test,b1_test,b2_test,b3_test,b4_test)
plot_surf_path(gfunc1,*test_coefs2) # Use * to unpack the tuple
plt.savefig('calc_multi_40_elev_03.png')

Bu yolları tabii ki rasgele parametreler üzerinden yarattık, bunlar optimal yollar değiller.

İlk kullanacağımız ölçüt çit yüksekliği denen [2]’de bahsedilen hesap, parametrik eğrinin gezdiği yol altında kalan yükseklikleri bir çit gibi düşünürsek bu çitin yan yüzeyinin alanı bir kısa yol ölçütü olarak kullanılabilir.

Öyle ya, yüksek tepelerden gitmeye kalksak çitin toplam alanı büyür, yol uzarsa yine büyür, bu sebeple çit alanını minimize etmeye uğraşan bir hesap yolu hem alçak yerlerden hem de kısa yollardan götürmeye uğraşacaktır.

Şimdi formülün gerektirdiği öğeleri birer birer bulalım, mesela \(x'(t)\), ve \(y'(t)\) sympy ile hesaplanabilir,

vars_sym = 't a0 a1 a2 a3 a4 b0 b1 b2 b3 b4 gamma x y'
t, a0, a1, a2, a3, a4, b0, b1, b2, b3, b4, gamma, x, y = sympy.symbols(vars_sym)

# xdef and ydef still defined globally as they are consistent
xdef = a0 + a1*t + a2*t**2 + a3*t**3 + a4*t**4
ydef = b0 + b1*t + b2*t**2 + b3*t**3 + b4*t**4

dxdt_test = sympy.diff(xdef,t)
dydt_test = sympy.diff(ydef,t)
sqrtdef_test = sympy.sqrt(dxdt_test**2 + dydt_test**2)
sqrdef_test = dxdt_test**2 + dydt_test**2
print (xdef)
print (ydef)

Şimdi sembolik olan hesaplara rasgele bazı katsayılar geçelim, ve sayısal bir sonucu görelim,

xsubs = {a0: 2, a1: 2, a2: 2, a3: 2, a4: 2, t:0.5}
xval = xdef.subs(xsubs)
ysubs = {b0: 3, b1: 3, b2: 3, b3: 3, b4: 3, t:0.5}
yval = ydef.subs(ysubs)
sqrval = float(sqrtdef_test.subs(xsubs).subs(ysubs).evalf()) # This line might have issues due to ysubs not having a0-a4 and vice versa
g1_val = gfunc1(float(xval.evalf()),float(yval.evalf()))
print (xval, yval, sqrval, g1_val)

Artık optimizasyonun kullanacağı bedeli kodlayabiliriz, bu üstteki bahsettiğimiz entegral olacak, \(t=0,t=1\) arasında hesaplanacak tabii ki (çünkü başlangıç, bitiş değerlerini de bu kavrama ilintilendirdik), ve fonksiyon değişken olarak şu anda bilinmeyen katsayıları alacak, optimizasyon rutini ise en optimal katsayı değerlerini bu bedel üzerinden bulacak.

LARGE_FLOAT = 1e6
pa0,pb0=(1.0,1.0)
pex,pey=(0.3,4.0)
ts = np.linspace(0,1,20)

def calcint_g1(pars):
    pa1,pa2,pa3,pb1,pb2,pb3=pars
    pa4 = pex - pa0 - (pa1+pa2+pa3)
    pb4 = pey - pb0 - (pb1+pb2+pb3)
    argsubs = {a1:pa1, a2:pa2, a3:pa3, a4:pa4, \
               b1:pb1, b2:pb2, b3:pb3, b4:pb4}
    ys = []

    dxdt_local = sympy.diff(xdef,t)
    dydt_local = sympy.diff(ydef,t)
    sqrdef_local = dxdt_local**2 + dydt_local**2

    for tcurr in ts:
       expr_after_subs = sqrdef_local.subs(argsubs).subs({t:tcurr})
       sqrval_numeric = float(expr_after_subs.evalf())

       if sqrval_numeric < 0:
           sqrval_numeric = 0

       xval = float(xdef.subs(argsubs).subs({a0: pa0, t:tcurr}).evalf())
       yval = float(ydef.subs(argsubs).subs({b0: pb0, t:tcurr}).evalf())

       prod1 = gfunc1(xval,yval)*sqrval_numeric
       ys.append(prod1)
    W = np.trapezoid(ys,x=ts)
    if W < 0: return LARGE_FLOAT
    return W

LIM = 5.0
pa1_init,pa2_init,pa3_init = 0,0,0
pb1_init,pb2_init,pb3_init = 0,0,0
x0_g1 = pa1_init,pa2_init,pa3_init,pb1_init,pb2_init,pb3_init
opts = {'maxiter': 40}

res_g1 = minimize (fun=calcint_g1,x0=x0_g1,
                method='Nelder-Mead',
                bounds=Bounds([-LIM, -LIM, -LIM, -LIM, -LIM, -LIM],
                              [LIM, LIM, LIM, LIM, LIM, LIM]),
                options=opts)
print (res_g1['x'])

a1_opt,a2_opt,a3_opt,b1_opt,b2_opt,b3_opt = list(res_g1['x'])
a4_opt = pex - pa0 - (a1_opt+a2_opt+a3_opt)
b4_opt = pey - pb0 - (b1_opt+b2_opt+b3_opt)
test_coefs1_opt = (pa0,a1_opt,a2_opt,a3_opt,a4_opt,pb0,b1_opt,b2_opt,b3_opt,b4_opt)
plot_surf_path(gfunc1,*test_coefs1_opt)
plt.savefig('calc_multi_40_elev_07.jpg')

Fena değil, optimal bir yola benziyor, tepelerden kaçınıldı mümkün olduğu kadar düşük yükseklikli ve kısa yoldan gidildi.

Üstteki optimizasyon kodunda dikkat edilirse bazı püf noktalar var, mesela eğer W değeri sıfırdan küçük ise çok büyük bir değer döndürüyoruz böylece o tür parametrelerden kaçınmış oluyoruz, optimizasyonu diğer yönlere kanalize ediyoruz. Bu basit bir sağlama işlemi, çünkü üstte tarif edilen türden entegral hesabı sıfırdan küçük olamaz, eğer öyle ise o tür sonucu veren parametrelerle ilgilenmiyoruz.

Başka bir yükseklik fonksiyonunu kullanalım, iki tepe var şimdi, ve bitiş noktası farklı,

def gfunc2(x, y):
    s1 = 2.2; x1 = 2.0; y1 = 2.0
    g1 = np.exp( -4 *np.log(2) * ((x-x1)**2+(y-y1)**2) / s1**2)
    s2 = 1.2; x2 = 4.0; y2 = 1.0
    g2 = np.exp( -4 *np.log(2) * ((x-x2)**2+(y-y2)**2) / s2**2) 
    return g1*10.0 + g2*10.0

pa0,pb0=(1.0,1.0)
pex,pey=(4.0,2.0)

ts = np.linspace(0,1,50)

def calcint_g2(pars):
    pa1,pa2,pa3,pb1,pb2,pb3=pars
    pa4 = pex - pa0 - (pa1+pa2+pa3)
    pb4 = pey - pb0 - (pb1+pb2+pb3)
    argsubs = {a1:pa1, a2:pa2, a3:pa3, a4:pa4, \
               b1:pb1, b2:pb2, b3:pb3, b4:pb4}
    ys = []

    dxdt_local = sympy.diff(xdef,t)
    dydt_local = sympy.diff(ydef,t)
    sqrdef_local = dxdt_local**2 + dydt_local**2

    for tcurr in ts:
       expr_after_subs = sqrdef_local.subs(argsubs).subs({t:tcurr})
       try:
           sqrval_numeric = float(expr_after_subs.evalf())
       except TypeError as e:
           print(f"Error converting to float: {e}")
           print(f"Problematic expression: {expr_after_subs}")
           print(f"Type of problematic expression: {type(expr_after_subs)}")
           return LARGE_FLOAT 

       if sqrval_numeric < 0: sqrval_numeric = 0

       xval = float(xdef.subs(argsubs).subs({a0: pa0, t:tcurr}).evalf())
       yval = float(ydef.subs(argsubs).subs({b0: pb0, t:tcurr}).evalf())

       prod2 = gfunc2(xval,yval)*sqrval_numeric
       ys.append(prod2)
    W = np.trapezoid(ys,x=ts)
    if W < 0: return LARGE_FLOAT
    return W

LIM = 5.0
pa1_init_g2,pa2_init_g2,pa3_init_g2 = 1,1,1
pb1_init_g2,pb2_init_g2,pb3_init_g2 = 1,1,1
x0_g2 = pa1_init_g2,pa2_init_g2,pa3_init_g2,pb1_init_g2,pb2_init_g2,pb3_init_g2

opts = {'maxiter': 40}

res_g2 = minimize (fun=calcint_g2,x0=x0_g2,
                method='Nelder-Mead',
                bounds=Bounds([-LIM, -LIM, -LIM, -LIM, -LIM, -LIM],
                              [LIM, LIM, LIM, LIM, LIM, LIM]),
                options=opts)

print(res_g2['x'])

a1_opt_g2, a2_opt_g2, a3_opt_g2, b1_opt_g2, b2_opt_g2, b3_opt_g2 = list(res_g2['x'])
a4_opt_g2 = pex - pa0 - (a1_opt_g2 + a2_opt_g2 + a3_opt_g2)
b4_opt_g2 = pey - pb0 - (b1_opt_g2 + b2_opt_g2 + b3_opt_g2)
test_coefs_g2_opt = (pa0, a1_opt_g2, a2_opt_g2, a3_opt_g2, a4_opt_g2,
                      pb0, b1_opt_g2, b2_opt_g2, b3_opt_g2, b4_opt_g2)
plot_surf_path(gfunc2, *test_coefs_g2_opt)
plt.savefig('calc_multi_40_elev_08.jpg')

Bu yol da iyi oldu, iki tepe ortasındaki yüksekliği düşük olan yerden geçildi.

Alternatif bir bedel ölçütü şöyle olabilir, eğri altına düşen yüksekliklerin toplamını bir çizgi entegrali ile hesaplayınca bu yaklaşım yüksekliklerden genel olarak uzak durabilir, çok inişli çıkışlı yolları hala tercih eder, ama bu tür yolların yürüyüş olarak yorucu olacağını biliyoruz. 1000 metrelik bir tepeye çıkıp onun üzerinde düz yürümek habire 1000 metreyi inmek çıkmaktan çok daha rahat.

Alternatif bir ölçüt şöyle olabilir; Bir eğriyi düşünelim, onun \(z\) eksenindeki yansıması da bir eğridir, \(x,y\) düzlemindeki yansıması bir başka eğri. Bu eğrilerin uzunluğunu hesaplarsak [2] ve dikey yöndeki uzunluğu yatay olan uzunluğu farklı ağırlıklarla çarpıp toplarsak bu bir bedeli temsil eder. Ağırlık dikey/yatay uzunluklar için 5/1 oranında olabilir, o zaman yatay yöndeki bir uzunluk / katedilen yol dikeye göre 5 kat daha tercih edilir olur.

Optimallik için gereken uzunluk hesabına gelelim. Bu hesap için formül, dikey için \(I_v\) yatay için \(I_h\)

\[ I_v = \int_{t=0}^{t=1} \sqrt{1 + \left(\frac{\mathrm{d} z}{\mathrm{d} t} \right)^2 } \mathrm{d} t \]

\[ I_h = \int_{t=0}^{t=1} \sqrt{ \left(\frac{\mathrm{d} x}{\mathrm{d} t} \right)^2 + \left(\frac{\mathrm{d} y}{\mathrm{d} t} \right)^2 } \mathrm{d} t \]

Formülde görülen \(\mathrm{d} z/\mathrm{d} t\), \(\mathrm{d} x/\mathrm{d} t\) ve \(\mathrm{d} y/\mathrm{d} t\), parametrik eğri üzerinden alınacak tabii ki. Problem çözümü açısından \(\mathrm{d} z/\mathrm{d} t\) hesabı külfetli olabilir, çünkü \(z = f(x,y)\) yükseklik fonksiyonundur.

Mesela ilk örnekteki gidiş yoluna kuşbakışı, iki boyutlu ortamda bakmak istersek,

a1,a2,a3 = 1.5, 8.1, 4.0
b1,b2,b3 = 0.3, 0.4, 23.3
a0,b0=(1.0,1.0)
ex,ey=(0.3,4.0)
a4 = ex - a0 - (a1+a2+a3)
b4 = ey - b0 - (b1+b2+b3)
  
t = np.linspace(0,1.0,100)
x = a0 + a1*t + a2*t**2 + a3*t**3 + a4*t**4 
y = b0 + b1*t + b2*t**2 + b3*t**3 + b4*t**4
plt.xlim(0,5.0)
plt.ylim(0,5.0)
plt.plot(x,y)
plt.savefig('calc_multi_40_elev_02.png')

[3]’te alternatif bir eğri şekli daha gördük, lineer parçalı ya da sigmoid bazlı parametrize eğriler. Bir parametrize eğriyi

modelleyebilirdik, \(u_1,u_2,..\) eksen \(x\) için ilmik noktaları, \(v_1,v_2,..\) eksen \(y\) için ilmik noktaları olabilirdi ve biraz değiştirilmiş sigmoid \(\sigma\) ifadesi

Bu şekilde parametrize edilmiş eğri ile pek çok farklı şekil ortaya çıkartılabilir. Bitiş noktasını da farklı bir şekilde optimizasyon kısıtlaması üzerinden zorlanabilir [3]

Bitiş noktalarını cebirsel değil conx ve cony adlı iki sınırlama tabiri ile zorladık.

Polinom bazlı eğride bazı türevleri sembolik olarak almıştık, burada tüm türevler sayısal bazlı fakat sigmoid bazlı parametrik eğrilerin de sembolik türevini kullanmak zor değil. Burada hızlı kodlama amaçlı bunu yapmadık.

[3] Bayramlı, Çok Boyutlu Calculus, Ders 5, İki Nokta Arasında Parametrize Edilmiş Eğri

[5] Bayramlı, Fonksiyonel Analiz ve Optimizasyon, Newton-umsu Metotlar, DFP, BFGS