Üstdüşümlü Matris Sistemini Çözmek

[1] yazısında anlatılan sistemi seyrek matrisler ve eşlenik gradyan tekniklerini kullanarak çözmenin iki yolu alttadır.

Önce [1]'deki üç matrisi tekrar oluşturalım,

from sympy import symbols, latex, simplify
from sympy.matrices import Matrix
from scipy.sparse import csr_matrix
import pandas as pd, numpy as np
import pickle, json

C,S,C1,C2,L,A,E,I = symbols("C,S,C1,C2,L,A,E,I")
kprime = Matrix([ [C1, 0, 0, -C1, 0, 0],
                  [0, 12*C2, 6*C2*L, 0, -12*C2, 6*C2*L],
                  [0, 6*C2*L, 4*C2*L**2, 0, -6*C2*L, 2*C2*L**2],
                  [-C1, 0, 0, C1, 0, 0],
                  [0, -12*C2, -6*C2*L, 0, 12*C2, -6*C2*L],
                  [0, 6*C2*L, 2*C2*L**2, 0, -6*C2*L, 4*C2*L**2]])

T = Matrix([[C,S,0,0,0,0],[-S,C,0,0,0,0],[0,0,1,0,0,0],
            [0,0,0,C,S,0],[0,0,0,-S,C,0],[0,0,0,0,0,1]])

res = T.transpose()*kprime*T
res = res.subs(C1,A*E/L) 
frame = res.subs(C2,E*I/L**3)

res = res / (E/L) 

from sympy import symbols, latex, simplify
from sympy.matrices import Matrix
import pickle, pandas as pd
pd.set_option('display.max_columns', None)
pd.set_option("display.precision", 4)
C,S,L,A,E,I = symbols("C,S,L,A,E,I")

d = {L:3000.0, C:0.0, S:1.0, E:200.0*1e3, A:6500.0, I:80.0*1e6}
res = frame.subs(d) / (1e3*d[E]/d[L])
df1 = pd.DataFrame(np.array(res).astype(np.float64))
vars1 = ['u1','v1','phi1','u2','v2','phi2']
df1.columns = vars1; df1.index = vars1 

d = {L:3000.0, C:1.0, S:0.0, E:200.0*1e3, A:6500.0, I:40.0*1e6}
res = frame.subs(d) / (1e3*d[E]/d[L])
vars2 = ['u2','v2','phi2','u3','v3','phi3']
df2 = pd.DataFrame(np.array(res).astype(np.float64))
df2.columns = vars2; df2.index = vars2

d = {L:3000.0, C:0.0, S:-1, E:200.0*1e3, A:6500.0, I:80.0*1e6}
res = frame.subs(d) / (1e3*d[E]/d[L])
vars3 = ['u3','v3','phi3','u4','v4','phi4']
df3 = pd.DataFrame(np.array(res).astype(np.float64))
df3.columns = vars2; df3.index = vars2

Bu matrisleri üstdüşüm ile birleştirmek istiyoruz, her matriste diğer matristekilere uyan değişkenleri toplamak gerekiyor. [1] yazısında gösterim amaçlı her matrisi nihai boyutlara büyütmüştük, ve aynı boyutta olan üç matrisi üstdüşüm için toplamıştık.

Fakat bu işlem bellekte tutulan yer, performans için ideal olmayabilir. Bir yoğun matrisi büyütünce sıfır olan değerlerin bile bellekte depolanması gerekiyor. Bu durum aynı şekilde üstdüşüm matrisi sonucu için de geçerli.

Alttaki yöntemler alternatif yaklaşımlar, ilki matrisleri Python sözlüğü olarak muhafaza eder. Her alt matris gezilir, ve nihai matris bir sözlük olarak oluşturulur. Matrisler bir sözlük içinde sözlük olarak temsil edilir, her satır ayrı bir anahtardır, ilk satır anahtarı u1, ikinci v1, böyle gider, ve ilk kolonun anahtarı aynı şekilde. Sözlük yapısını kullanmanın bir faydası bildik bir yapı olması ve aynen diğer seyrek yaklaşımlarda olduğu gibi kullanıcı kod olmayan değerin sıfır kabul edebilir.

Üstdüşüm matrisi, çakışan değerlerin birbiriyle toplanması aynı kod içinde yapılır, hatta değişken çıkartma işlemi bile aynı döngülerle hallediliyor.

import pandas as pd, pickle

pd.set_option("display.precision", 4)
pd.set_option('display.max_columns', None)

def mult_A_b(A,b):
    return dict((k, sum(b[key]*row.get(key, 0) for key in b)) for k,row in A.items()  )

def dot(a,b):
    return sum(b[key]*a.get(key, 0) for key in b)

def vec_sum(a,b):
    return {k: a.get(k, 0) + b.get(k, 0) for k in set(a) | set(b)}

def vec_subt(a,b):
    return {k: a.get(k, 0) - b.get(k, 0) for k in set(a) | set(b)}

def vec_scalar_times (vec,a):
    return dict((k,v*a) for k,v in vec.items())

def vec_scalar_sum (vec,a):
    return dict((k,v+a) for k,v in vec.items())

def vec_scalar_subt (vec,a):
    return dict((k,v-a) for k,v in vec.items())

df_super = {}

for v in df1.index: df_super[v] = {}
for v in df2.index: df_super[v] = {}
for v in df3.index: df_super[v] = {}

drop_vars = ['u1','v1','phi1','u4','v4','phi4']

def add_to_super(df):

    for rowid,row in df.to_dict().items():
        if rowid in drop_vars: continue
        for k,v in row.items():
            if v != 0 and k not in drop_vars:
                df_super[rowid][k] = df_super[rowid].get(k,0) + v

add_to_super(df1)
add_to_super(df2)
add_to_super(df3)

Çözmek için [3]'te anlatılan eşlenik gradyan (conjugate gradient) yöntemi kodlandı. CG kodu altta A matrisini sözlük içinde sözlük olarak alıyor.

A = df_super.copy()

for id,row in A.items():
    row.update( (key, value * 66.67*1e3) for key, value in row.items() )

b = {'u2': 4*1e4, 'phi3': 5*1e5}

p = b; r = b; x = {}

r2 = dot(r,r)

for i in range(40):

    Ap = mult_A_b(A,p)

    alpha = r2 / dot(Ap, p)

    x = vec_sum(x,vec_scalar_times(p,alpha))

    r = vec_subt(r,vec_scalar_times(Ap,alpha))

    r2old = r2

    r2 = dot(r,r)

    beta = r2 / r2old

    p = vec_sum(r,vec_scalar_times(p,beta))

print (x)

{'v1': 0.0, 'u1': 0.0, 'u3': 8.689191625966664, 'phi2':
-0.0020595226448240213, 'v2': -3.3229233662294724e-17, 'v3':
-0.01250651341977623, 'phi3': 0.001035030753854022, 'u2':
8.714002731297926, 'phi1': 0.0}

İkinci yaklaşım scipy.sparse içindeki lil_matrix seyrek matris tipini kullanıyor. Bildiğimiz gibi scipy.sparse matrislerinin isim bazlı erişim yöntemi yoktur, indis, yani tam sayı kullanarak erişim yapmak gerekir. Bu yüzden alttaki çözümde değişken listesini kullanarak her değişken için bir indis değeri üretiyoruz, onu seyrek matriste erişim için kullanıyoruz. Eğer satır v1 kolon u1 ise bu bize indisler (1,0) değerlerini verir, erişimi bunlarla yaparız.

Üstdüşümü nihai matrisi oluştururken aynı kod içinde yapıyoruz. Değişken çıkartmak için basit bir dilimleme (slicing) işlemi uygulandı.

from scipy.sparse.linalg import cg
import numpy as np, scipy.sparse as sps, pickle

pd.set_option("display.precision", 4)
pd.set_option('display.max_columns', None)


all_vars = ['u1','v1','phi1','u2','v2','phi2','u3','v3','phi3','u4','v4','phi4']

drop_vars = ['u1','v1','phi1','u4','v4','phi4']

A = sps.lil_matrix((12,12))

def add_to_super2(df):

    for id,row in df.iterrows():
        for c in df.columns:
            A[all_vars.index(id),all_vars.index(c)] += row[c]

add_to_super2(df1)
add_to_super2(df2)
add_to_super2(df3)

index_to_drop = [all_vars.index(x) for x in drop_vars]

to_keep = list(set(range(A.shape[1]))-set(index_to_drop))    
A2 = A[:,to_keep]
to_keep = list(set(range(A.shape[0]))-set(index_to_drop))    
A3 = A2[to_keep,:]

b = np.array([4*1e4, 0, 0, 0, 0, 5*1e5])

x, exit_code = cg(66.67*1e3*A3, b)

print (x)

[ 8.71400273e+00  2.09901541e-16 -2.05952264e-03  8.68919163e+00
 -1.25065134e-02  1.03503075e-03]

Kaynaklar

[1] Fizik - Materyel Mekaniği - 8

[2] scipy.sparse.linalg.cg

[3] Hesapsal Bilim Ders 2.19

Yukarı