/* solveupdH.c */
#include "../SubMtx.h"
/*--------------------------------------------------------------------*/
static void
complex_updDenseColumns ( SubMtx *mtxY, SubMtx *mtxA, SubMtx *mtxX ) ;
static void
complex_updDenseRows ( SubMtx *mtxY, SubMtx *mtxA, SubMtx *mtxX ) ;
static void
complex_updSparseRows ( SubMtx *mtxY, SubMtx *mtxA, SubMtx *mtxX ) ;
static void
complex_updSparseColumns ( SubMtx *mtxY, SubMtx *mtxA, SubMtx *mtxX ) ;
/*--------------------------------------------------------------------*/
/*
------------------------------------------------------
purpose -- perform the matrix-matrix multiply
Y := Y - A^H * X used in the forward and backsolves
where
(1) rows(A) \subseteq rows(Y)
(2) rows(A) are local w.r.t. rows(Y)
(3) cols(A) \subseteq rows(X)
(4) cols(A) are local w.r.t. rows(X)
(5) cols(Y) = cols(X)
(6) Y and X have mode SUBMTX_DENSE_COLUMNS
created -- 98may02, cca
-----------------------------------------------------
*/
void
SubMtx_solveupdH (
SubMtx *mtxY,
SubMtx *mtxA,
SubMtx *mtxX
) {
/*
---------------
check the input
---------------
*/
if ( mtxY == NULL || mtxA == NULL || mtxX == NULL ) {
fprintf(stderr, "\n fatal error in SubMtx_solveupdH(%p,%p,%p)"
"\n bad input\n", mtxY, mtxA, mtxX) ;
exit(-1) ;
}
if ( mtxA->type != SPOOLES_COMPLEX ) {
fprintf(stderr, "\n fatal error in SubMtx_solveupdH(%p,%p,%p)"
"\n Y has type %d, must be SPOOLES_COMPLEX\n",
mtxY, mtxA, mtxX, mtxA->type) ;
exit(-1) ;
}
if ( ! SUBMTX_IS_DENSE_COLUMNS(mtxY) ) {
fprintf(stderr, "\n fatal error in SubMtx_solveupdH(%p,%p,%p)"
"\n Y must have mode SUBMTX_DENSE_COLUMNS\n",
mtxY, mtxA, mtxX) ;
exit(-1) ;
}
if ( ! SUBMTX_IS_DENSE_COLUMNS(mtxX) ) {
fprintf(stderr, "\n fatal error in SubMtx_solveupdH(%p,%p,%p)"
"\n X must have mode SUBMTX_DENSE_COLUMNS\n",
mtxY, mtxA, mtxX) ;
exit(-1) ;
}
switch ( mtxA->mode ) {
case SUBMTX_DENSE_COLUMNS :
complex_updDenseColumns(mtxY, mtxA, mtxX) ;
break ;
case SUBMTX_DENSE_ROWS :
complex_updDenseRows(mtxY, mtxA, mtxX) ;
break ;
case SUBMTX_SPARSE_ROWS :
complex_updSparseRows(mtxY, mtxA, mtxX) ;
break ;
case SUBMTX_SPARSE_COLUMNS :
complex_updSparseColumns(mtxY, mtxA, mtxX) ;
break ;
default :
fprintf(stderr, "\n fatal error in SubMtx_solveupdH(%p,%p,%p)"
"\n unsupported mode %d for A\n",
mtxY, mtxA, mtxX, mtxA->mode) ;
SubMtx_writeForHumanEye(mtxA, stderr) ;
exit(-1) ;
break ;
}
return ; }
/*--------------------------------------------------------------------*/
/*
----------------
A has dense rows
----------------
*/
static void
complex_updDenseRows (
SubMtx *mtxY,
SubMtx *mtxA,
SubMtx *mtxX
) {
double ai0, ai1, ai2, ar0, ar1, ar2,
xi00, xi01, xi02, xi10, xi11, xi12, xi20, xi21, xi22,
xr00, xr01, xr02, xr10, xr11, xr12, xr20, xr21, xr22 ;
double *colAT0, *colAT1, *colAT2, *colX0, *colX1, *colX2,
*colY0, *colY1, *colY2, *entA, *entX, *entY ;
int icolAT, ialoc, iloc, inc1, inc2, jcolX, krowAT,
ncolAT, ncolX, ncolY, nrowAT, nrowX, nrowY, raloc, rloc ;
int *colindAT, *rowindAT ;
SubMtx_denseInfo(mtxY, &nrowY, &ncolY, &inc1, &inc2, &entY) ;
SubMtx_denseInfo(mtxX, &nrowX, &ncolX, &inc1, &inc2, &entX) ;
SubMtx_denseInfo(mtxA, &ncolAT, &nrowAT, &inc1, &inc2, &entA) ;
colX0 = entX ;
colY0 = entY ;
if ( ncolAT != nrowX ) {
SubMtx_rowIndices(mtxA, &ncolAT, &colindAT) ;
} else {
colindAT = NULL ;
}
if ( nrowAT != nrowY ) {
SubMtx_columnIndices(mtxA, &nrowAT, &rowindAT) ;
} else {
rowindAT = NULL ;
}
for ( jcolX = 0 ; jcolX < ncolX - 2 ; jcolX += 3 ) {
colX1 = colX0 + 2*nrowX ;
colX2 = colX1 + 2*nrowX ;
colY1 = colY0 + 2*nrowY ;
colY2 = colY1 + 2*nrowY ;
colAT0 = entA ;
for ( icolAT = 0 ; icolAT < ncolAT - 2 ; icolAT += 3 ) {
colAT1 = colAT0 + 2*nrowAT ;
colAT2 = colAT1 + 2*nrowAT ;
if ( ncolAT == nrowX ) {
rloc = 2*icolAT ; iloc = rloc + 1 ;
xr00 = colX0[rloc] ; xi00 = colX0[iloc] ;
xr01 = colX1[rloc] ; xi01 = colX1[iloc] ;
xr02 = colX2[rloc] ; xi02 = colX2[iloc] ;
rloc += 2 ; iloc += 2 ;
xr10 = colX0[rloc] ; xi10 = colX0[iloc] ;
xr11 = colX1[rloc] ; xi11 = colX1[iloc] ;
xr12 = colX2[rloc] ; xi12 = colX2[iloc] ;
rloc += 2 ; iloc += 2 ;
xr20 = colX0[rloc] ; xi20 = colX0[iloc] ;
xr21 = colX1[rloc] ; xi21 = colX1[iloc] ;
xr22 = colX2[rloc] ; xi22 = colX2[iloc] ;
} else {
rloc = 2*colindAT[icolAT] ; iloc = rloc + 1 ;
xr00 = colX0[rloc] ; xi00 = colX0[iloc] ;
xr01 = colX1[rloc] ; xi01 = colX1[iloc] ;
xr02 = colX2[rloc] ; xi02 = colX2[iloc] ;
rloc = 2*colindAT[icolAT+1] ; iloc = rloc + 1 ;
xr10 = colX0[rloc] ; xi10 = colX0[iloc] ;
xr11 = colX1[rloc] ; xi11 = colX1[iloc] ;
xr12 = colX2[rloc] ; xi12 = colX2[iloc] ;
rloc = 2*colindAT[icolAT+2] ; iloc = rloc + 1 ;
xr20 = colX0[rloc] ; xi20 = colX0[iloc] ;
xr21 = colX1[rloc] ; xi21 = colX1[iloc] ;
xr22 = colX2[rloc] ; xi22 = colX2[iloc] ;
}
if ( nrowY == nrowAT ) {
for ( krowAT = 0 ; krowAT < nrowAT ; krowAT++ ) {
rloc = 2*krowAT ; iloc = rloc + 1 ;
ar0 = colAT0[rloc] ; ai0 = colAT0[iloc] ;
ar1 = colAT1[rloc] ; ai1 = colAT1[iloc] ;
ar2 = colAT2[rloc] ; ai2 = colAT2[iloc] ;
colY0[rloc] -= ar0*xr00 + ai0*xi00
+ ar1*xr10 + ai1*xi10
+ ar2*xr20 + ai2*xi20 ;
colY0[iloc] -= ar0*xi00 - ai0*xr00
+ ar1*xi10 - ai1*xr10
+ ar2*xi20 - ai2*xr20 ;
colY1[rloc] -= ar0*xr01 + ai0*xi01
+ ar1*xr11 + ai1*xi11
+ ar2*xr21 + ai2*xi21 ;
colY1[iloc] -= ar0*xi01 - ai0*xr01
+ ar1*xi11 - ai1*xr11
+ ar2*xi21 - ai2*xr21 ;
colY2[rloc] -= ar0*xr02 + ai0*xi02
+ ar1*xr12 + ai1*xi12
+ ar2*xr22 + ai2*xi22 ;
colY2[iloc] -= ar0*xi02 - ai0*xr02
+ ar1*xi12 - ai1*xr12
+ ar2*xi22 - ai2*xr22 ;
}
} else {
for ( krowAT = 0 ; krowAT < nrowAT ; krowAT++ ) {
raloc = 2*krowAT ; ialoc = raloc + 1 ;
ar0 = colAT0[raloc] ; ai0 = colAT0[ialoc] ;
ar1 = colAT1[raloc] ; ai1 = colAT1[ialoc] ;
ar2 = colAT2[raloc] ; ai2 = colAT2[ialoc] ;
rloc = 2*rowindAT[krowAT] ; iloc = rloc + 1 ;
colY0[rloc] -= ar0*xr00 + ai0*xi00
+ ar1*xr10 + ai1*xi10
+ ar2*xr20 + ai2*xi20 ;
colY0[iloc] -= ar0*xi00 - ai0*xr00
+ ar1*xi10 - ai1*xr10
+ ar2*xi20 - ai2*xr20 ;
colY1[rloc] -= ar0*xr01 + ai0*xi01
+ ar1*xr11 + ai1*xi11
+ ar2*xr21 + ai2*xi21 ;
colY1[iloc] -= ar0*xi01 - ai0*xr01
+ ar1*xi11 - ai1*xr11
+ ar2*xi21 - ai2*xr21 ;
colY2[rloc] -= ar0*xr02 + ai0*xi02
+ ar1*xr12 + ai1*xi12
+ ar2*xr22 + ai2*xi22 ;
colY2[iloc] -= ar0*xi02 - ai0*xr02
+ ar1*xi12 - ai1*xr12
+ ar2*xi22 - ai2*xr22 ;
}
}
colAT0 = colAT2 + 2*nrowAT ;
}
if ( icolAT == ncolAT - 2 ) {
colAT1 = colAT0 + 2*nrowAT ;
if ( ncolAT == nrowX ) {
rloc = 2*icolAT ; iloc = rloc + 1 ;
xr00 = colX0[rloc] ; xi00 = colX0[iloc] ;
xr01 = colX1[rloc] ; xi01 = colX1[iloc] ;
xr02 = colX2[rloc] ; xi02 = colX2[iloc] ;
rloc += 2 ; iloc += 2 ;
xr10 = colX0[rloc] ; xi10 = colX0[iloc] ;
xr11 = colX1[rloc] ; xi11 = colX1[iloc] ;
xr12 = colX2[rloc] ; xi12 = colX2[iloc] ;
rloc += 2 ; iloc += 2 ;
xr20 = colX0[rloc] ; xi20 = colX0[iloc] ;
xr21 = colX1[rloc] ; xi21 = colX1[iloc] ;
xr22 = colX2[rloc] ; xi22 = colX2[iloc] ;
} else {
rloc = 2*colindAT[icolAT] ; iloc = rloc + 1 ;
xr00 = colX0[rloc] ; xi00 = colX0[iloc] ;
xr01 = colX1[rloc] ; xi01 = colX1[iloc] ;
xr02 = colX2[rloc] ; xi02 = colX2[iloc] ;
rloc = 2*colindAT[icolAT+1] ; iloc = rloc + 1 ;
xr10 = colX0[rloc] ; xi10 = colX0[iloc] ;
xr11 = colX1[rloc] ; xi11 = colX1[iloc] ;
xr12 = colX2[rloc] ; xi12 = colX2[iloc] ;
rloc = 2*colindAT[icolAT+2] ; iloc = rloc + 1 ;
xr20 = colX0[rloc] ; xi20 = colX0[iloc] ;
xr21 = colX1[rloc] ; xi21 = colX1[iloc] ;
xr22 = colX2[rloc] ; xi22 = colX2[iloc] ;
}
if ( nrowY == nrowAT ) {
for ( krowAT = 0 ; krowAT < nrowAT ; krowAT++ ) {
rloc = 2*krowAT ; iloc = rloc + 1 ;
ar0 = colAT0[rloc] ; ai0 = colAT0[iloc] ;
ar1 = colAT1[rloc] ; ai1 = colAT1[iloc] ;
colY0[rloc] -= ar0*xr00 + ai0*xi00 + ar1*xr10 + ai1*xi10 ;
colY0[iloc] -= ar0*xi00 - ai0*xr00 + ar1*xi10 - ai1*xr10 ;
colY1[rloc] -= ar0*xr01 + ai0*xi01 + ar1*xr11 + ai1*xi11 ;
colY1[iloc] -= ar0*xi01 - ai0*xr01 + ar1*xi11 - ai1*xr11 ;
colY2[rloc] -= ar0*xr02 + ai0*xi02 + ar1*xr12 + ai1*xi12 ;
colY2[iloc] -= ar0*xi02 - ai0*xr02 + ar1*xi12 - ai1*xr12 ;
}
} else {
for ( krowAT = 0 ; krowAT < nrowAT ; krowAT++ ) {
raloc = 2*krowAT ; ialoc = raloc + 1 ;
ar0 = colAT0[raloc] ; ai0 = colAT0[ialoc] ;
ar1 = colAT1[raloc] ; ai1 = colAT1[ialoc] ;
rloc = 2*rowindAT[krowAT] ; iloc = rloc + 1 ;
colY0[rloc] -= ar0*xr00 + ai0*xi00 + ar1*xr10 + ai1*xi10 ;
colY0[iloc] -= ar0*xi00 - ai0*xr00 + ar1*xi10 - ai1*xr10 ;
colY1[rloc] -= ar0*xr01 + ai0*xi01 + ar1*xr11 + ai1*xi11 ;
colY1[iloc] -= ar0*xi01 - ai0*xr01 + ar1*xi11 - ai1*xr11 ;
colY2[rloc] -= ar0*xr02 + ai0*xi02 + ar1*xr12 + ai1*xi12 ;
colY2[iloc] -= ar0*xi02 - ai0*xr02 + ar1*xi12 - ai1*xr12 ;
}
}
} else if ( icolAT == ncolAT - 1 ) {
if ( ncolAT == nrowX ) {
rloc = 2*icolAT ; iloc = rloc + 1 ;
xr00 = colX0[rloc] ; xi00 = colX0[iloc] ;
xr01 = colX1[rloc] ; xi01 = colX1[iloc] ;
xr02 = colX2[rloc] ; xi02 = colX2[iloc] ;
rloc += 2 ; iloc += 2 ;
xr10 = colX0[rloc] ; xi10 = colX0[iloc] ;
xr11 = colX1[rloc] ; xi11 = colX1[iloc] ;
xr12 = colX2[rloc] ; xi12 = colX2[iloc] ;
rloc += 2 ; iloc += 2 ;
xr20 = colX0[rloc] ; xi20 = colX0[iloc] ;
xr21 = colX1[rloc] ; xi21 = colX1[iloc] ;
xr22 = colX2[rloc] ; xi22 = colX2[iloc] ;
} else {
rloc = 2*colindAT[icolAT] ; iloc = rloc + 1 ;
xr00 = colX0[rloc] ; xi00 = colX0[iloc] ;
xr01 = colX1[rloc] ; xi01 = colX1[iloc] ;
xr02 = colX2[rloc] ; xi02 = colX2[iloc] ;
rloc = 2*colindAT[icolAT+1] ; iloc = rloc + 1 ;
xr10 = colX0[rloc] ; xi10 = colX0[iloc] ;
xr11 = colX1[rloc] ; xi11 = colX1[iloc] ;
xr12 = colX2[rloc] ; xi12 = colX2[iloc] ;
rloc = 2*colindAT[icolAT+2] ; iloc = rloc + 1 ;
xr20 = colX0[rloc] ; xi20 = colX0[iloc] ;
xr21 = colX1[rloc] ; xi21 = colX1[iloc] ;
xr22 = colX2[rloc] ; xi22 = colX2[iloc] ;
}
if ( nrowY == nrowAT ) {
for ( krowAT = 0 ; krowAT < nrowAT ; krowAT++ ) {
rloc = 2*krowAT ; iloc = rloc + 1 ;
ar0 = colAT0[rloc] ; ai0 = colAT0[iloc] ;
colY0[rloc] -= ar0*xr00 + ai0*xi00 ;
colY0[iloc] -= ar0*xi00 - ai0*xr00 ;
colY1[rloc] -= ar0*xr01 + ai0*xi01 ;
colY1[iloc] -= ar0*xi01 - ai0*xr01 ;
colY2[rloc] -= ar0*xr02 + ai0*xi02 ;
colY2[iloc] -= ar0*xi02 - ai0*xr02 ;
}
} else {
for ( krowAT = 0 ; krowAT < nrowAT ; krowAT++ ) {
raloc = 2*krowAT ; ialoc = raloc + 1 ;
ar0 = colAT0[raloc] ; ai0 = colAT0[ialoc] ;
rloc = 2*rowindAT[krowAT] ; iloc = rloc + 1 ;
colY0[rloc] -= ar0*xr00 + ai0*xi00 ;
colY0[iloc] -= ar0*xi00 - ai0*xr00 ;
colY1[rloc] -= ar0*xr01 + ai0*xi01 ;
colY1[iloc] -= ar0*xi01 - ai0*xr01 ;
colY2[rloc] -= ar0*xr02 + ai0*xi02 ;
colY2[iloc] -= ar0*xi02 - ai0*xr02 ;
}
}
}
colX0 = colX2 + 2*nrowX ;
colY0 = colY2 + 2*nrowY ;
}
/*
fprintf(stdout, "\n %% jcolX = %d", jcolX) ;
*/
if ( jcolX == ncolX - 2 ) {
colX1 = colX0 + 2*nrowX ;
colY1 = colY0 + 2*nrowY ;
colAT0 = entA ;
for ( icolAT = 0 ; icolAT < ncolAT - 2 ; icolAT += 3 ) {
colAT1 = colAT0 + 2*nrowAT ;
colAT2 = colAT1 + 2*nrowAT ;
if ( ncolAT == nrowX ) {
rloc = 2*icolAT ; iloc = rloc + 1 ;
xr00 = colX0[rloc] ; xi00 = colX0[iloc] ;
xr01 = colX1[rloc] ; xi01 = colX1[iloc] ;
rloc += 2 ; iloc += 2 ;
xr10 = colX0[rloc] ; xi10 = colX0[iloc] ;
xr11 = colX1[rloc] ; xi11 = colX1[iloc] ;
rloc += 2 ; iloc += 2 ;
xr20 = colX0[rloc] ; xi20 = colX0[iloc] ;
xr21 = colX1[rloc] ; xi21 = colX1[iloc] ;
} else {
rloc = 2*colindAT[icolAT] ; iloc = rloc + 1 ;
xr00 = colX0[rloc] ; xi00 = colX0[iloc] ;
xr01 = colX1[rloc] ; xi01 = colX1[iloc] ;
rloc = 2*colindAT[icolAT+1] ; iloc = rloc + 1 ;
xr10 = colX0[rloc] ; xi10 = colX0[iloc] ;
xr11 = colX1[rloc] ; xi11 = colX1[iloc] ;
rloc = 2*colindAT[icolAT+2] ; iloc = rloc + 1 ;
xr20 = colX0[rloc] ; xi20 = colX0[iloc] ;
xr21 = colX1[rloc] ; xi21 = colX1[iloc] ;
}
if ( nrowY == nrowAT ) {
for ( krowAT = 0 ; krowAT < nrowAT ; krowAT++ ) {
rloc = 2*krowAT ; iloc = rloc + 1 ;
ar0 = colAT0[rloc] ; ai0 = colAT0[iloc] ;
ar1 = colAT1[rloc] ; ai1 = colAT1[iloc] ;
ar2 = colAT2[rloc] ; ai2 = colAT2[iloc] ;
colY0[rloc] -= ar0*xr00 + ai0*xi00
+ ar1*xr10 + ai1*xi10
+ ar2*xr20 + ai2*xi20 ;
colY0[iloc] -= ar0*xi00 - ai0*xr00
+ ar1*xi10 - ai1*xr10
+ ar2*xi20 - ai2*xr20 ;
colY1[rloc] -= ar0*xr01 + ai0*xi01
+ ar1*xr11 + ai1*xi11
+ ar2*xr21 + ai2*xi21 ;
colY1[iloc] -= ar0*xi01 - ai0*xr01
+ ar1*xi11 - ai1*xr11
+ ar2*xi21 - ai2*xr21 ;
}
} else {
for ( krowAT = 0 ; krowAT < nrowAT ; krowAT++ ) {
raloc = 2*krowAT ; ialoc = raloc + 1 ;
ar0 = colAT0[raloc] ; ai0 = colAT0[ialoc] ;
ar1 = colAT1[raloc] ; ai1 = colAT1[ialoc] ;
ar2 = colAT2[raloc] ; ai2 = colAT2[ialoc] ;
rloc = 2*rowindAT[krowAT] ; iloc = rloc + 1 ;
colY0[rloc] -= ar0*xr00 + ai0*xi00
+ ar1*xr10 + ai1*xi10
+ ar2*xr20 + ai2*xi20 ;
colY0[iloc] -= ar0*xi00 - ai0*xr00
+ ar1*xi10 - ai1*xr10
+ ar2*xi20 - ai2*xr20 ;
colY1[rloc] -= ar0*xr01 + ai0*xi01
+ ar1*xr11 + ai1*xi11
+ ar2*xr21 + ai2*xi21 ;
colY1[iloc] -= ar0*xi01 - ai0*xr01
+ ar1*xi11 - ai1*xr11
+ ar2*xi21 - ai2*xr21 ;
}
}
colAT0 = colAT2 + 2*nrowAT ;
}
if ( icolAT == ncolAT - 2 ) {
colAT1 = colAT0 + 2*nrowAT ;
if ( ncolAT == nrowX ) {
rloc = 2*icolAT ; iloc = rloc + 1 ;
xr00 = colX0[rloc] ; xi00 = colX0[iloc] ;
xr01 = colX1[rloc] ; xi01 = colX1[iloc] ;
rloc += 2 ; iloc += 2 ;
xr10 = colX0[rloc] ; xi10 = colX0[iloc] ;
xr11 = colX1[rloc] ; xi11 = colX1[iloc] ;
rloc += 2 ; iloc += 2 ;
xr20 = colX0[rloc] ; xi20 = colX0[iloc] ;
xr21 = colX1[rloc] ; xi21 = colX1[iloc] ;
} else {
rloc = 2*colindAT[icolAT] ; iloc = rloc + 1 ;
xr00 = colX0[rloc] ; xi00 = colX0[iloc] ;
xr01 = colX1[rloc] ; xi01 = colX1[iloc] ;
rloc = 2*colindAT[icolAT+1] ; iloc = rloc + 1 ;
xr10 = colX0[rloc] ; xi10 = colX0[iloc] ;
xr11 = colX1[rloc] ; xi11 = colX1[iloc] ;
rloc = 2*colindAT[icolAT+2] ; iloc = rloc + 1 ;
xr20 = colX0[rloc] ; xi20 = colX0[iloc] ;
xr21 = colX1[rloc] ; xi21 = colX1[iloc] ;
}
if ( nrowY == nrowAT ) {
for ( krowAT = 0 ; krowAT < nrowAT ; krowAT++ ) {
rloc = 2*krowAT ; iloc = rloc + 1 ;
ar0 = colAT0[rloc] ; ai0 = colAT0[iloc] ;
ar1 = colAT1[rloc] ; ai1 = colAT1[iloc] ;
colY0[rloc] -= ar0*xr00 + ai0*xi00 + ar1*xr10 + ai1*xi10 ;
colY0[iloc] -= ar0*xi00 - ai0*xr00 + ar1*xi10 - ai1*xr10 ;
colY1[rloc] -= ar0*xr01 + ai0*xi01 + ar1*xr11 + ai1*xi11 ;
colY1[iloc] -= ar0*xi01 - ai0*xr01 + ar1*xi11 - ai1*xr11 ;
}
} else {
for ( krowAT = 0 ; krowAT < nrowAT ; krowAT++ ) {
raloc = 2*krowAT ; ialoc = raloc + 1 ;
ar0 = colAT0[raloc] ; ai0 = colAT0[ialoc] ;
ar1 = colAT1[raloc] ; ai1 = colAT1[ialoc] ;
rloc = 2*rowindAT[krowAT] ; iloc = rloc + 1 ;
colY0[rloc] -= ar0*xr00 + ai0*xi00 + ar1*xr10 + ai1*xi10 ;
colY0[iloc] -= ar0*xi00 - ai0*xr00 + ar1*xi10 - ai1*xr10 ;
colY1[rloc] -= ar0*xr01 + ai0*xi01 + ar1*xr11 + ai1*xi11 ;
colY1[iloc] -= ar0*xi01 - ai0*xr01 + ar1*xi11 - ai1*xr11 ;
}
}
} else if ( icolAT == ncolAT - 1 ) {
if ( ncolAT == nrowX ) {
rloc = 2*icolAT ; iloc = rloc + 1 ;
xr00 = colX0[rloc] ; xi00 = colX0[iloc] ;
xr01 = colX1[rloc] ; xi01 = colX1[iloc] ;
rloc += 2 ; iloc += 2 ;
xr10 = colX0[rloc] ; xi10 = colX0[iloc] ;
xr11 = colX1[rloc] ; xi11 = colX1[iloc] ;
rloc += 2 ; iloc += 2 ;
xr20 = colX0[rloc] ; xi20 = colX0[iloc] ;
xr21 = colX1[rloc] ; xi21 = colX1[iloc] ;
} else {
rloc = 2*colindAT[icolAT] ; iloc = rloc + 1 ;
xr00 = colX0[rloc] ; xi00 = colX0[iloc] ;
xr01 = colX1[rloc] ; xi01 = colX1[iloc] ;
rloc = 2*colindAT[icolAT+1] ; iloc = rloc + 1 ;
xr10 = colX0[rloc] ; xi10 = colX0[iloc] ;
xr11 = colX1[rloc] ; xi11 = colX1[iloc] ;
rloc = 2*colindAT[icolAT+2] ; iloc = rloc + 1 ;
xr20 = colX0[rloc] ; xi20 = colX0[iloc] ;
xr21 = colX1[rloc] ; xi21 = colX1[iloc] ;
}
if ( nrowY == nrowAT ) {
for ( krowAT = 0 ; krowAT < nrowAT ; krowAT++ ) {
rloc = 2*krowAT ; iloc = rloc + 1 ;
ar0 = colAT0[rloc] ; ai0 = colAT0[iloc] ;
colY0[rloc] -= ar0*xr00 + ai0*xi00 ;
colY0[iloc] -= ar0*xi00 - ai0*xr00 ;
colY1[rloc] -= ar0*xr01 + ai0*xi01 ;
colY1[iloc] -= ar0*xi01 - ai0*xr01 ;
}
} else {
for ( krowAT = 0 ; krowAT < nrowAT ; krowAT++ ) {
raloc = 2*krowAT ; ialoc = raloc + 1 ;
ar0 = colAT0[raloc] ; ai0 = colAT0[ialoc] ;
rloc = 2*rowindAT[krowAT] ; iloc = rloc + 1 ;
colY0[rloc] -= ar0*xr00 + ai0*xi00 ;
colY0[iloc] -= ar0*xi00 - ai0*xr00 ;
colY1[rloc] -= ar0*xr01 + ai0*xi01 ;
colY1[iloc] -= ar0*xi01 - ai0*xr01 ;
}
}
}
} else if ( jcolX == ncolX - 1 ) {
colAT0 = entA ;
for ( icolAT = 0 ; icolAT < ncolAT - 2 ; icolAT += 3 ) {
/*
fprintf(stdout, "\n %% icolAT = %d", icolAT) ;
*/
colAT1 = colAT0 + 2*nrowAT ;
colAT2 = colAT1 + 2*nrowAT ;
if ( ncolAT == nrowX ) {
rloc = 2*icolAT ; iloc = rloc + 1 ;
xr00 = colX0[rloc] ; xi00 = colX0[iloc] ;
rloc += 2 ; iloc += 2 ;
xr10 = colX0[rloc] ; xi10 = colX0[iloc] ;
rloc += 2 ; iloc += 2 ;
xr20 = colX0[rloc] ; xi20 = colX0[iloc] ;
} else {
rloc = 2*colindAT[icolAT] ; iloc = rloc + 1 ;
xr00 = colX0[rloc] ; xi00 = colX0[iloc] ;
rloc = 2*colindAT[icolAT+1] ; iloc = rloc + 1 ;
xr10 = colX0[rloc] ; xi10 = colX0[iloc] ;
rloc = 2*colindAT[icolAT+2] ; iloc = rloc + 1 ;
xr20 = colX0[rloc] ; xi20 = colX0[iloc] ;
}
/*
fprintf(stdout, "\n %% x00 = (%12.4e,%12.4e)", xr00, xi00) ;
fprintf(stdout, "\n %% x10 = (%12.4e,%12.4e)", xr10, xi10) ;
fprintf(stdout, "\n %% x20 = (%12.4e,%12.4e)", xr20, xi20) ;
*/
if ( nrowY == nrowAT ) {
for ( krowAT = 0 ; krowAT < nrowAT ; krowAT++ ) {
rloc = 2*krowAT ; iloc = rloc + 1 ;
ar0 = colAT0[rloc] ; ai0 = colAT0[iloc] ;
ar1 = colAT1[rloc] ; ai1 = colAT1[iloc] ;
ar2 = colAT2[rloc] ; ai2 = colAT2[iloc] ;
/*
fprintf(stdout, "\n %% rloc = %d, iloc = %d", rloc, iloc) ;
fprintf(stdout, "\n %% a0 = (%12.4e,%12.4e)", ar0, ai0) ;
fprintf(stdout, "\n %% a1 = (%12.4e,%12.4e)", ar1, ai1) ;
fprintf(stdout, "\n %% a2 = (%12.4e,%12.4e)", ar2, ai2) ;
*/
colY0[rloc] -= ar0*xr00 + ai0*xi00
+ ar1*xr10 + ai1*xi10
+ ar2*xr20 + ai2*xi20 ;
colY0[iloc] -= ar0*xi00 - ai0*xr00
+ ar1*xi10 - ai1*xr10
+ ar2*xi20 - ai2*xr20 ;
}
} else {
for ( krowAT = 0 ; krowAT < nrowAT ; krowAT++ ) {
raloc = 2*krowAT ; ialoc = raloc + 1 ;
ar0 = colAT0[raloc] ; ai0 = colAT0[ialoc] ;
ar1 = colAT1[raloc] ; ai1 = colAT1[ialoc] ;
ar2 = colAT2[raloc] ; ai2 = colAT2[ialoc] ;
/*
fprintf(stdout, "\n %% raloc = %d, ialoc = %d", raloc, ialoc) ;
fprintf(stdout, "\n %% a0 = (%12.4e,%12.4e)", ar0, ai0) ;
fprintf(stdout, "\n %% a1 = (%12.4e,%12.4e)", ar1, ai1) ;
fprintf(stdout, "\n %% a2 = (%12.4e,%12.4e)", ar2, ai2) ;
*/
rloc = 2*rowindAT[krowAT] ; iloc = rloc + 1 ;
/*
fprintf(stdout, "\n %% rloc = %d, iloc = %d", rloc, iloc) ;
*/
colY0[rloc] -= ar0*xr00 + ai0*xi00
+ ar1*xr10 + ai1*xi10
+ ar2*xr20 + ai2*xi20 ;
colY0[iloc] -= ar0*xi00 - ai0*xr00
+ ar1*xi10 - ai1*xr10
+ ar2*xi20 - ai2*xr20 ;
}
}
colAT0 = colAT2 + 2*nrowAT ;
}
if ( icolAT == ncolAT - 2 ) {
colAT1 = colAT0 + 2*nrowAT ;
if ( ncolAT == nrowX ) {
rloc = 2*icolAT ; iloc = rloc + 1 ;
xr00 = colX0[rloc] ; xi00 = colX0[iloc] ;
rloc += 2 ; iloc += 2 ;
xr10 = colX0[rloc] ; xi10 = colX0[iloc] ;
rloc += 2 ; iloc += 2 ;
xr20 = colX0[rloc] ; xi20 = colX0[iloc] ;
} else {
rloc = 2*colindAT[icolAT] ; iloc = rloc + 1 ;
xr00 = colX0[rloc] ; xi00 = colX0[iloc] ;
rloc = 2*colindAT[icolAT+1] ; iloc = rloc + 1 ;
xr10 = colX0[rloc] ; xi10 = colX0[iloc] ;
rloc = 2*colindAT[icolAT+2] ; iloc = rloc + 1 ;
xr20 = colX0[rloc] ; xi20 = colX0[iloc] ;
}
if ( nrowY == nrowAT ) {
for ( krowAT = 0 ; krowAT < nrowAT ; krowAT++ ) {
rloc = 2*krowAT ; iloc = rloc + 1 ;
ar0 = colAT0[rloc] ; ai0 = colAT0[iloc] ;
ar1 = colAT1[rloc] ; ai1 = colAT1[iloc] ;
colY0[rloc] -= ar0*xr00 + ai0*xi00 + ar1*xr10 + ai1*xi10 ;
colY0[iloc] -= ar0*xi00 - ai0*xr00 + ar1*xi10 - ai1*xr10 ;
}
} else {
for ( krowAT = 0 ; krowAT < nrowAT ; krowAT++ ) {
raloc = 2*krowAT ; ialoc = raloc + 1 ;
ar0 = colAT0[raloc] ; ai0 = colAT0[ialoc] ;
ar1 = colAT1[raloc] ; ai1 = colAT1[ialoc] ;
rloc = 2*rowindAT[krowAT] ; iloc = rloc + 1 ;
colY0[rloc] -= ar0*xr00 + ai0*xi00 + ar1*xr10 + ai1*xi10 ;
colY0[iloc] -= ar0*xi00 - ai0*xr00 + ar1*xi10 - ai1*xr10 ;
}
}
} else if ( icolAT == ncolAT - 1 ) {
if ( ncolAT == nrowX ) {
rloc = 2*icolAT ; iloc = rloc + 1 ;
xr00 = colX0[rloc] ; xi00 = colX0[iloc] ;
rloc += 2 ; iloc += 2 ;
xr10 = colX0[rloc] ; xi10 = colX0[iloc] ;
rloc += 2 ; iloc += 2 ;
xr20 = colX0[rloc] ; xi20 = colX0[iloc] ;
} else {
rloc = 2*colindAT[icolAT] ; iloc = rloc + 1 ;
xr00 = colX0[rloc] ; xi00 = colX0[iloc] ;
rloc = 2*colindAT[icolAT+1] ; iloc = rloc + 1 ;
xr10 = colX0[rloc] ; xi10 = colX0[iloc] ;
rloc = 2*colindAT[icolAT+2] ; iloc = rloc + 1 ;
xr20 = colX0[rloc] ; xi20 = colX0[iloc] ;
}
if ( nrowY == nrowAT ) {
for ( krowAT = 0 ; krowAT < nrowAT ; krowAT++ ) {
rloc = 2*krowAT ; iloc = rloc + 1 ;
ar0 = colAT0[rloc] ; ai0 = colAT0[iloc] ;
colY0[rloc] -= ar0*xr00 + ai0*xi00 ;
colY0[iloc] -= ar0*xi00 - ai0*xr00 ;
}
} else {
for ( krowAT = 0 ; krowAT < nrowAT ; krowAT++ ) {
raloc = 2*krowAT ; ialoc = raloc + 1 ;
ar0 = colAT0[raloc] ; ai0 = colAT0[ialoc] ;
rloc = 2*rowindAT[krowAT] ; iloc = rloc + 1 ;
colY0[rloc] -= ar0*xr00 + ai0*xi00 ;
colY0[iloc] -= ar0*xi00 - ai0*xr00 ;
}
}
}
}
return ; }
/*--------------------------------------------------------------------*/
/*
-------------------
A has dense columns
-------------------
*/
static void
complex_updDenseColumns (
SubMtx *mtxY,
SubMtx *mtxA,
SubMtx *mtxX
) {
double *colX0, *colX1, *colX2, *colY0, *colY1, *colY2,
*rowAT0, *rowAT1, *rowAT2, *entA, *entX, *entY ;
int inc1, inc2, irowAT, jcolX, kcolAT,
ncolAT, ncolX, ncolY, nrowAT, nrowX, nrowY ;
int *colindAT, *rowindAT ;
SubMtx_denseInfo(mtxY, &nrowY, &ncolY, &inc1, &inc2, &entY) ;
SubMtx_denseInfo(mtxX, &nrowX, &ncolX, &inc1, &inc2, &entX) ;
SubMtx_denseInfo(mtxA, &ncolAT, &nrowAT, &inc1, &inc2, &entA) ;
if ( ncolAT != nrowX ) {
SubMtx_rowIndices(mtxA, &ncolAT, &colindAT) ;
} else {
colindAT = NULL ;
}
if ( nrowAT != nrowY ) {
SubMtx_columnIndices(mtxA, &nrowAT, &rowindAT) ;
} else {
rowindAT = NULL ;
}
colX0 = entX ;
colY0 = entY ;
for ( jcolX = 0 ; jcolX < ncolX - 2 ; jcolX += 3 ) {
colX1 = colX0 + 2*nrowX ;
colX2 = colX1 + 2*nrowX ;
colY1 = colY0 + 2*nrowY ;
colY2 = colY1 + 2*nrowY ;
rowAT0 = entA ;
for ( irowAT = 0 ; irowAT < nrowAT - 2 ; irowAT += 3 ) {
double ai0, ai1, ai2, ar0, ar1, ar2, isum00, isum01, isum02,
isum10, isum11, isum12, isum20, isum21, isum22,
rsum00, rsum01, rsum02, rsum10, rsum11, rsum12,
rsum20, rsum21, rsum22, xi0, xi1, xi2, xr0, xr1, xr2 ;
int ialoc, iloc, ixloc, raloc, rloc, rxloc ;
isum00 = isum01 = isum02 = isum10 = isum11 = isum12
= isum20 = isum21 = isum22 = 0.0 ;
rsum00 = rsum01 = rsum02 = rsum10 = rsum11 = rsum12
= rsum20 = rsum21 = rsum22 = 0.0 ;
rowAT1 = rowAT0 + 2*ncolAT ;
rowAT2 = rowAT1 + 2*ncolAT ;
if ( ncolAT == nrowX ) {
for ( kcolAT = 0 ; kcolAT < ncolAT ; kcolAT++ ) {
rloc = 2*kcolAT ; iloc = rloc + 1 ;
ar0 = rowAT0[rloc] ; ai0 = rowAT0[iloc] ;
ar1 = rowAT1[rloc] ; ai1 = rowAT1[iloc] ;
ar2 = rowAT2[rloc] ; ai2 = rowAT2[iloc] ;
xr0 = colX0[rloc] ; xi0 = colX0[iloc] ;
xr1 = colX1[rloc] ; xi1 = colX1[iloc] ;
xr2 = colX2[rloc] ; xi2 = colX2[iloc] ;
rsum00 += ar0*xr0 + ai0*xi0 ; isum00 += ar0*xi0 - ai0*xr0 ;
rsum01 += ar0*xr1 + ai0*xi1 ; isum01 += ar0*xi1 - ai0*xr1 ;
rsum02 += ar0*xr2 + ai0*xi2 ; isum02 += ar0*xi2 - ai0*xr2 ;
rsum10 += ar1*xr0 + ai1*xi0 ; isum10 += ar1*xi0 - ai1*xr0 ;
rsum11 += ar1*xr1 + ai1*xi1 ; isum11 += ar1*xi1 - ai1*xr1 ;
rsum12 += ar1*xr2 + ai1*xi2 ; isum12 += ar1*xi2 - ai1*xr2 ;
rsum20 += ar2*xr0 + ai2*xi0 ; isum20 += ar2*xi0 - ai2*xr0 ;
rsum21 += ar2*xr1 + ai2*xi1 ; isum21 += ar2*xi1 - ai2*xr1 ;
rsum22 += ar2*xr2 + ai2*xi2 ; isum22 += ar2*xi2 - ai2*xr2 ;
}
} else {
for ( kcolAT = 0 ; kcolAT < ncolAT ; kcolAT++ ) {
raloc = 2*kcolAT ; ialoc = raloc + 1 ;
ar0 = rowAT0[raloc] ; ai0 = rowAT0[ialoc] ;
ar1 = rowAT1[raloc] ; ai1 = rowAT1[ialoc] ;
ar2 = rowAT2[raloc] ; ai2 = rowAT2[ialoc] ;
rxloc = 2*colindAT[kcolAT] ; ixloc = rxloc + 1 ;
xr0 = colX0[rxloc] ; xi0 = colX0[ixloc] ;
xr1 = colX1[rxloc] ; xi1 = colX1[ixloc] ;
xr2 = colX2[rxloc] ; xi2 = colX2[ixloc] ;
rsum00 += ar0*xr0 + ai0*xi0 ; isum00 += ar0*xi0 - ai0*xr0 ;
rsum01 += ar0*xr1 + ai0*xi1 ; isum01 += ar0*xi1 - ai0*xr1 ;
rsum02 += ar0*xr2 + ai0*xi2 ; isum02 += ar0*xi2 - ai0*xr2 ;
rsum10 += ar1*xr0 + ai1*xi0 ; isum10 += ar1*xi0 - ai1*xr0 ;
rsum11 += ar1*xr1 + ai1*xi1 ; isum11 += ar1*xi1 - ai1*xr1 ;
rsum12 += ar1*xr2 + ai1*xi2 ; isum12 += ar1*xi2 - ai1*xr2 ;
rsum20 += ar2*xr0 + ai2*xi0 ; isum20 += ar2*xi0 - ai2*xr0 ;
rsum21 += ar2*xr1 + ai2*xi1 ; isum21 += ar2*xi1 - ai2*xr1 ;
rsum22 += ar2*xr2 + ai2*xi2 ; isum22 += ar2*xi2 - ai2*xr2 ;
}
}
if ( nrowY == nrowAT ) {
rloc = 2*irowAT ; iloc = rloc + 1 ;
colY0[rloc] -= rsum00 ; colY0[iloc] -= isum00 ;
colY1[rloc] -= rsum01 ; colY1[iloc] -= isum01 ;
colY2[rloc] -= rsum02 ; colY2[iloc] -= isum02 ;
rloc+= 2 ; iloc += 2 ;
colY0[rloc] -= rsum10 ; colY0[iloc] -= isum10 ;
colY1[rloc] -= rsum11 ; colY1[iloc] -= isum11 ;
colY2[rloc] -= rsum12 ; colY2[iloc] -= isum12 ;
rloc+= 2 ; iloc += 2 ;
colY0[rloc] -= rsum20 ; colY0[iloc] -= isum20 ;
colY1[rloc] -= rsum21 ; colY1[iloc] -= isum21 ;
colY2[rloc] -= rsum22 ; colY2[iloc] -= isum22 ;
} else {
rloc = 2*rowindAT[irowAT] ; iloc = rloc + 1 ;
colY0[rloc] -= rsum00 ; colY0[iloc] -= isum00 ;
colY1[rloc] -= rsum01 ; colY1[iloc] -= isum01 ;
colY2[rloc] -= rsum02 ; colY2[iloc] -= isum02 ;
rloc = 2*rowindAT[irowAT+1] ; iloc = rloc + 1 ;
colY0[rloc] -= rsum10 ; colY0[iloc] -= isum10 ;
colY1[rloc] -= rsum11 ; colY1[iloc] -= isum11 ;
colY2[rloc] -= rsum12 ; colY2[iloc] -= isum12 ;
rloc = 2*rowindAT[irowAT+2] ; iloc = rloc + 1 ;
colY0[rloc] -= rsum20 ; colY0[iloc] -= isum20 ;
colY1[rloc] -= rsum21 ; colY1[iloc] -= isum21 ;
colY2[rloc] -= rsum22 ; colY2[iloc] -= isum22 ;
}
rowAT0 = rowAT2 + 2*ncolAT ;
}
if ( irowAT == nrowAT - 2 ) {
double ai0, ai1, ar0, ar1, isum00, isum01, isum02,
isum10, isum11, isum12, rsum00, rsum01, rsum02,
rsum10, rsum11, rsum12, xi0, xi1, xi2, xr0, xr1, xr2 ;
int ialoc, iloc, ixloc, raloc, rloc, rxloc ;
isum00 = isum01 = isum02 = isum10 = isum11 = isum12 = 0.0 ;
rsum00 = rsum01 = rsum02 = rsum10 = rsum11 = rsum12 = 0.0 ;
rowAT1 = rowAT0 + 2*ncolAT ;
if ( ncolAT == nrowX ) {
for ( kcolAT = 0 ; kcolAT < ncolAT ; kcolAT++ ) {
rloc = 2*kcolAT ; iloc = rloc + 1 ;
ar0 = rowAT0[rloc] ; ai0 = rowAT0[iloc] ;
ar1 = rowAT1[rloc] ; ai1 = rowAT1[iloc] ;
xr0 = colX0[rloc] ; xi0 = colX0[iloc] ;
xr1 = colX1[rloc] ; xi1 = colX1[iloc] ;
xr2 = colX2[rloc] ; xi2 = colX2[iloc] ;
rsum00 += ar0*xr0 + ai0*xi0 ; isum00 += ar0*xi0 - ai0*xr0 ;
rsum01 += ar0*xr1 + ai0*xi1 ; isum01 += ar0*xi1 - ai0*xr1 ;
rsum02 += ar0*xr2 + ai0*xi2 ; isum02 += ar0*xi2 - ai0*xr2 ;
rsum10 += ar1*xr0 + ai1*xi0 ; isum10 += ar1*xi0 - ai1*xr0 ;
rsum11 += ar1*xr1 + ai1*xi1 ; isum11 += ar1*xi1 - ai1*xr1 ;
rsum12 += ar1*xr2 + ai1*xi2 ; isum12 += ar1*xi2 - ai1*xr2 ;
}
} else {
for ( kcolAT = 0 ; kcolAT < ncolAT ; kcolAT++ ) {
raloc = 2*kcolAT ; ialoc = raloc + 1 ;
ar0 = rowAT0[raloc] ; ai0 = rowAT0[ialoc] ;
ar1 = rowAT1[raloc] ; ai1 = rowAT1[ialoc] ;
rxloc = 2*colindAT[kcolAT] ; ixloc = rxloc + 1 ;
xr0 = colX0[rxloc] ; xi0 = colX0[ixloc] ;
xr1 = colX1[rxloc] ; xi1 = colX1[ixloc] ;
xr2 = colX2[rxloc] ; xi2 = colX2[ixloc] ;
rsum00 += ar0*xr0 + ai0*xi0 ; isum00 += ar0*xi0 - ai0*xr0 ;
rsum01 += ar0*xr1 + ai0*xi1 ; isum01 += ar0*xi1 - ai0*xr1 ;
rsum02 += ar0*xr2 + ai0*xi2 ; isum02 += ar0*xi2 - ai0*xr2 ;
rsum10 += ar1*xr0 + ai1*xi0 ; isum10 += ar1*xi0 - ai1*xr0 ;
rsum11 += ar1*xr1 + ai1*xi1 ; isum11 += ar1*xi1 - ai1*xr1 ;
rsum12 += ar1*xr2 + ai1*xi2 ; isum12 += ar1*xi2 - ai1*xr2 ;
}
}
if ( nrowY == nrowAT ) {
rloc = 2*irowAT ; iloc = rloc + 1 ;
colY0[rloc] -= rsum00 ; colY0[iloc] -= isum00 ;
colY1[rloc] -= rsum01 ; colY1[iloc] -= isum01 ;
colY2[rloc] -= rsum02 ; colY2[iloc] -= isum02 ;
rloc+= 2 ; iloc += 2 ;
colY0[rloc] -= rsum10 ; colY0[iloc] -= isum10 ;
colY1[rloc] -= rsum11 ; colY1[iloc] -= isum11 ;
colY2[rloc] -= rsum12 ; colY2[iloc] -= isum12 ;
} else {
rloc = 2*rowindAT[irowAT] ; iloc = rloc + 1 ;
colY0[rloc] -= rsum00 ; colY0[iloc] -= isum00 ;
colY1[rloc] -= rsum01 ; colY1[iloc] -= isum01 ;
colY2[rloc] -= rsum02 ; colY2[iloc] -= isum02 ;
rloc = 2*rowindAT[irowAT+1] ; iloc = rloc + 1 ;
colY0[rloc] -= rsum10 ; colY0[iloc] -= isum10 ;
colY1[rloc] -= rsum11 ; colY1[iloc] -= isum11 ;
colY2[rloc] -= rsum12 ; colY2[iloc] -= isum12 ;
}
} else if ( irowAT == nrowAT - 1 ) {
double ai0, ar0, isum00, isum01, isum02,
rsum00, rsum01, rsum02, xi0, xi1, xi2, xr0, xr1, xr2 ;
int ialoc, iloc, ixloc, raloc, rloc, rxloc ;
isum00 = isum01 = isum02 = 0.0 ;
rsum00 = rsum01 = rsum02 = 0.0 ;
if ( ncolAT == nrowX ) {
for ( kcolAT = 0 ; kcolAT < ncolAT ; kcolAT++ ) {
rloc = 2*kcolAT ; iloc = rloc + 1 ;
ar0 = rowAT0[rloc] ; ai0 = rowAT0[iloc] ;
xr0 = colX0[rloc] ; xi0 = colX0[iloc] ;
xr1 = colX1[rloc] ; xi1 = colX1[iloc] ;
xr2 = colX2[rloc] ; xi2 = colX2[iloc] ;
rsum00 += ar0*xr0 + ai0*xi0 ; isum00 += ar0*xi0 - ai0*xr0 ;
rsum01 += ar0*xr1 + ai0*xi1 ; isum01 += ar0*xi1 - ai0*xr1 ;
rsum02 += ar0*xr2 + ai0*xi2 ; isum02 += ar0*xi2 - ai0*xr2 ;
}
} else {
for ( kcolAT = 0 ; kcolAT < ncolAT ; kcolAT++ ) {
raloc = 2*kcolAT ; ialoc = raloc + 1 ;
ar0 = rowAT0[raloc] ; ai0 = rowAT0[ialoc] ;
rxloc = 2*colindAT[kcolAT] ; ixloc = rxloc + 1 ;
xr0 = colX0[rxloc] ; xi0 = colX0[ixloc] ;
xr1 = colX1[rxloc] ; xi1 = colX1[ixloc] ;
xr2 = colX2[rxloc] ; xi2 = colX2[ixloc] ;
rsum00 += ar0*xr0 + ai0*xi0 ; isum00 += ar0*xi0 - ai0*xr0 ;
rsum01 += ar0*xr1 + ai0*xi1 ; isum01 += ar0*xi1 - ai0*xr1 ;
rsum02 += ar0*xr2 + ai0*xi2 ; isum02 += ar0*xi2 - ai0*xr2 ;
}
}
if ( nrowY == nrowAT ) {
rloc = 2*irowAT ; iloc = rloc + 1 ;
colY0[rloc] -= rsum00 ; colY0[iloc] -= isum00 ;
colY1[rloc] -= rsum01 ; colY1[iloc] -= isum01 ;
colY2[rloc] -= rsum02 ; colY2[iloc] -= isum02 ;
} else {
rloc = 2*rowindAT[irowAT] ; iloc = rloc + 1 ;
colY0[rloc] -= rsum00 ; colY0[iloc] -= isum00 ;
colY1[rloc] -= rsum01 ; colY1[iloc] -= isum01 ;
colY2[rloc] -= rsum02 ; colY2[iloc] -= isum02 ;
}
}
colX0 = colX2 + 2*nrowX ;
colY0 = colY2 + 2*nrowY ;
}
if ( jcolX == ncolX - 2 ) {
colX1 = colX0 + 2*nrowX ;
colY1 = colY0 + 2*nrowY ;
rowAT0 = entA ;
for ( irowAT = 0 ; irowAT < nrowAT - 2 ; irowAT += 3 ) {
double ai0, ai1, ai2, ar0, ar1, ar2, isum00, isum01,
isum10, isum11, isum20, isum21, rsum00, rsum01, rsum10,
rsum11, rsum20, rsum21, xi0, xi1, xr0, xr1 ;
int ialoc, iloc, ixloc, raloc, rloc, rxloc ;
isum00 = isum01 = isum10 = isum11 = isum20 = isum21 = 0.0 ;
rsum00 = rsum01 = rsum10 = rsum11 = rsum20 = rsum21 = 0.0 ;
rowAT1 = rowAT0 + 2*ncolAT ;
rowAT2 = rowAT1 + 2*ncolAT ;
if ( ncolAT == nrowX ) {
for ( kcolAT = 0 ; kcolAT < ncolAT ; kcolAT++ ) {
rloc = 2*kcolAT ; iloc = rloc + 1 ;
ar0 = rowAT0[rloc] ; ai0 = rowAT0[iloc] ;
ar1 = rowAT1[rloc] ; ai1 = rowAT1[iloc] ;
ar2 = rowAT2[rloc] ; ai2 = rowAT2[iloc] ;
xr0 = colX0[rloc] ; xi0 = colX0[iloc] ;
xr1 = colX1[rloc] ; xi1 = colX1[iloc] ;
rsum00 += ar0*xr0 + ai0*xi0 ; isum00 += ar0*xi0 - ai0*xr0 ;
rsum01 += ar0*xr1 + ai0*xi1 ; isum01 += ar0*xi1 - ai0*xr1 ;
rsum10 += ar1*xr0 + ai1*xi0 ; isum10 += ar1*xi0 - ai1*xr0 ;
rsum11 += ar1*xr1 + ai1*xi1 ; isum11 += ar1*xi1 - ai1*xr1 ;
rsum20 += ar2*xr0 + ai2*xi0 ; isum20 += ar2*xi0 - ai2*xr0 ;
rsum21 += ar2*xr1 + ai2*xi1 ; isum21 += ar2*xi1 - ai2*xr1 ;
}
} else {
for ( kcolAT = 0 ; kcolAT < ncolAT ; kcolAT++ ) {
raloc = 2*kcolAT ; ialoc = raloc + 1 ;
ar0 = rowAT0[raloc] ; ai0 = rowAT0[ialoc] ;
ar1 = rowAT1[raloc] ; ai1 = rowAT1[ialoc] ;
ar2 = rowAT2[raloc] ; ai2 = rowAT2[ialoc] ;
rxloc = 2*colindAT[kcolAT] ; ixloc = rxloc + 1 ;
xr0 = colX0[rxloc] ; xi0 = colX0[ixloc] ;
xr1 = colX1[rxloc] ; xi1 = colX1[ixloc] ;
rsum00 += ar0*xr0 + ai0*xi0 ; isum00 += ar0*xi0 - ai0*xr0 ;
rsum01 += ar0*xr1 + ai0*xi1 ; isum01 += ar0*xi1 - ai0*xr1 ;
rsum10 += ar1*xr0 + ai1*xi0 ; isum10 += ar1*xi0 - ai1*xr0 ;
rsum11 += ar1*xr1 + ai1*xi1 ; isum11 += ar1*xi1 - ai1*xr1 ;
rsum20 += ar2*xr0 + ai2*xi0 ; isum20 += ar2*xi0 - ai2*xr0 ;
rsum21 += ar2*xr1 + ai2*xi1 ; isum21 += ar2*xi1 - ai2*xr1 ;
}
}
if ( nrowY == nrowAT ) {
rloc = 2*irowAT ; iloc = rloc + 1 ;
colY0[rloc] -= rsum00 ; colY0[iloc] -= isum00 ;
colY1[rloc] -= rsum01 ; colY1[iloc] -= isum01 ;
rloc+= 2 ; iloc += 2 ;
colY0[rloc] -= rsum10 ; colY0[iloc] -= isum10 ;
colY1[rloc] -= rsum11 ; colY1[iloc] -= isum11 ;
rloc+= 2 ; iloc += 2 ;
colY0[rloc] -= rsum20 ; colY0[iloc] -= isum20 ;
colY1[rloc] -= rsum21 ; colY1[iloc] -= isum21 ;
} else {
rloc = 2*rowindAT[irowAT] ; iloc = rloc + 1 ;
colY0[rloc] -= rsum00 ; colY0[iloc] -= isum00 ;
colY1[rloc] -= rsum01 ; colY1[iloc] -= isum01 ;
rloc = 2*rowindAT[irowAT+1] ; iloc = rloc + 1 ;
colY0[rloc] -= rsum10 ; colY0[iloc] -= isum10 ;
colY1[rloc] -= rsum11 ; colY1[iloc] -= isum11 ;
rloc = 2*rowindAT[irowAT+2] ; iloc = rloc + 1 ;
colY0[rloc] -= rsum20 ; colY0[iloc] -= isum20 ;
colY1[rloc] -= rsum21 ; colY1[iloc] -= isum21 ;
}
rowAT0 = rowAT2 + 2*ncolAT ;
}
if ( irowAT == nrowAT - 2 ) {
double ai0, ai1, ar0, ar1, isum00, isum01, isum10, isum11,
rsum00, rsum01, rsum10, rsum11, xi0, xi1, xr0, xr1 ;
int ialoc, iloc, ixloc, raloc, rloc, rxloc ;
isum00 = isum01 = isum10 = isum11 = 0.0 ;
rsum00 = rsum01 = rsum10 = rsum11 = 0.0 ;
rowAT1 = rowAT0 + 2*ncolAT ;
if ( ncolAT == nrowX ) {
for ( kcolAT = 0 ; kcolAT < ncolAT ; kcolAT++ ) {
rloc = 2*kcolAT ; iloc = rloc + 1 ;
ar0 = rowAT0[rloc] ; ai0 = rowAT0[iloc] ;
ar1 = rowAT1[rloc] ; ai1 = rowAT1[iloc] ;
xr0 = colX0[rloc] ; xi0 = colX0[iloc] ;
xr1 = colX1[rloc] ; xi1 = colX1[iloc] ;
rsum00 += ar0*xr0 + ai0*xi0 ; isum00 += ar0*xi0 - ai0*xr0 ;
rsum01 += ar0*xr1 + ai0*xi1 ; isum01 += ar0*xi1 - ai0*xr1 ;
rsum10 += ar1*xr0 + ai1*xi0 ; isum10 += ar1*xi0 - ai1*xr0 ;
rsum11 += ar1*xr1 + ai1*xi1 ; isum11 += ar1*xi1 - ai1*xr1 ;
}
} else {
for ( kcolAT = 0 ; kcolAT < ncolAT ; kcolAT++ ) {
raloc = 2*kcolAT ; ialoc = raloc + 1 ;
ar0 = rowAT0[raloc] ; ai0 = rowAT0[ialoc] ;
ar1 = rowAT1[raloc] ; ai1 = rowAT1[ialoc] ;
rxloc = 2*colindAT[kcolAT] ; ixloc = rxloc + 1 ;
xr0 = colX0[rxloc] ; xi0 = colX0[ixloc] ;
xr1 = colX1[rxloc] ; xi1 = colX1[ixloc] ;
rsum00 += ar0*xr0 + ai0*xi0 ; isum00 += ar0*xi0 - ai0*xr0 ;
rsum01 += ar0*xr1 + ai0*xi1 ; isum01 += ar0*xi1 - ai0*xr1 ;
rsum10 += ar1*xr0 + ai1*xi0 ; isum10 += ar1*xi0 - ai1*xr0 ;
rsum11 += ar1*xr1 + ai1*xi1 ; isum11 += ar1*xi1 - ai1*xr1 ;
}
}
if ( nrowY == nrowAT ) {
rloc = 2*irowAT ; iloc = rloc + 1 ;
colY0[rloc] -= rsum00 ; colY0[iloc] -= isum00 ;
colY1[rloc] -= rsum01 ; colY1[iloc] -= isum01 ;
rloc+= 2 ; iloc += 2 ;
colY0[rloc] -= rsum10 ; colY0[iloc] -= isum10 ;
colY1[rloc] -= rsum11 ; colY1[iloc] -= isum11 ;
} else {
rloc = 2*rowindAT[irowAT] ; iloc = rloc + 1 ;
colY0[rloc] -= rsum00 ; colY0[iloc] -= isum00 ;
colY1[rloc] -= rsum01 ; colY1[iloc] -= isum01 ;
rloc = 2*rowindAT[irowAT+1] ; iloc = rloc + 1 ;
colY0[rloc] -= rsum10 ; colY0[iloc] -= isum10 ;
colY1[rloc] -= rsum11 ; colY1[iloc] -= isum11 ;
}
} else if ( irowAT == nrowAT - 1 ) {
double ai0, ar0, isum00, isum01,
rsum00, rsum01, xi0, xi1, xr0, xr1 ;
int ialoc, iloc, ixloc, raloc, rloc, rxloc ;
isum00 = isum01 = 0.0 ;
rsum00 = rsum01 = 0.0 ;
if ( ncolAT == nrowX ) {
for ( kcolAT = 0 ; kcolAT < ncolAT ; kcolAT++ ) {
rloc = 2*kcolAT ; iloc = rloc + 1 ;
ar0 = rowAT0[rloc] ; ai0 = rowAT0[iloc] ;
xr0 = colX0[rloc] ; xi0 = colX0[iloc] ;
xr1 = colX1[rloc] ; xi1 = colX1[iloc] ;
rsum00 += ar0*xr0 + ai0*xi0 ; isum00 += ar0*xi0 - ai0*xr0 ;
rsum01 += ar0*xr1 + ai0*xi1 ; isum01 += ar0*xi1 - ai0*xr1 ;
}
} else {
for ( kcolAT = 0 ; kcolAT < ncolAT ; kcolAT++ ) {
raloc = 2*kcolAT ; ialoc = raloc + 1 ;
ar0 = rowAT0[raloc] ; ai0 = rowAT0[ialoc] ;
rxloc = 2*colindAT[kcolAT] ; ixloc = rxloc + 1 ;
xr0 = colX0[rxloc] ; xi0 = colX0[ixloc] ;
xr1 = colX1[rxloc] ; xi1 = colX1[ixloc] ;
rsum00 += ar0*xr0 + ai0*xi0 ; isum00 += ar0*xi0 - ai0*xr0 ;
rsum01 += ar0*xr1 + ai0*xi1 ; isum01 += ar0*xi1 - ai0*xr1 ;
}
}
if ( nrowY == nrowAT ) {
rloc = 2*irowAT ; iloc = rloc + 1 ;
colY0[rloc] -= rsum00 ; colY0[iloc] -= isum00 ;
colY1[rloc] -= rsum01 ; colY1[iloc] -= isum01 ;
} else {
rloc = 2*rowindAT[irowAT] ; iloc = rloc + 1 ;
colY0[rloc] -= rsum00 ; colY0[iloc] -= isum00 ;
colY1[rloc] -= rsum01 ; colY1[iloc] -= isum01 ;
}
}
} else if ( jcolX == ncolX - 1 ) {
rowAT0 = entA ;
for ( irowAT = 0 ; irowAT < nrowAT - 2 ; irowAT += 3 ) {
double ai0, ai1, ai2, ar0, ar1, ar2, isum00, isum10, isum20,
rsum00, rsum10, rsum20, xi0, xr0 ;
int ialoc, iloc, ixloc, raloc, rloc, rxloc ;
isum00 = isum10 = isum20 = 0.0 ;
rsum00 = rsum10 = rsum20 = 0.0 ;
rowAT1 = rowAT0 + 2*ncolAT ;
rowAT2 = rowAT1 + 2*ncolAT ;
/*
fprintf(stdout, "\n %% irowAT %d", irowAT) ;
*/
if ( ncolAT == nrowX ) {
for ( kcolAT = 0 ; kcolAT < ncolAT ; kcolAT++ ) {
rloc = 2*kcolAT ; iloc = rloc + 1 ;
/*
fprintf(stdout, "\n %% rloc %d, iloc %d", rloc, iloc) ;
*/
ar0 = rowAT0[rloc] ; ai0 = rowAT0[iloc] ;
ar1 = rowAT1[rloc] ; ai1 = rowAT1[iloc] ;
ar2 = rowAT2[rloc] ; ai2 = rowAT2[iloc] ;
xr0 = colX0[rloc] ; xi0 = colX0[iloc] ;
/*
fprintf(stdout, "\n %% a0 = (%12.4e,%12.4e)", ar0, ai0) ;
fprintf(stdout, "\n %% a1 = (%12.4e,%12.4e)", ar1, ai1) ;
fprintf(stdout, "\n %% a2 = (%12.4e,%12.4e)", ar2, ai2) ;
fprintf(stdout, "\n %% x0 = (%12.4e,%12.4e)", xr0, xi0) ;
*/
rsum00 += ar0*xr0 + ai0*xi0 ; isum00 += ar0*xi0 - ai0*xr0 ;
rsum10 += ar1*xr0 + ai1*xi0 ; isum10 += ar1*xi0 - ai1*xr0 ;
rsum20 += ar2*xr0 + ai2*xi0 ; isum20 += ar2*xi0 - ai2*xr0 ;
}
} else {
for ( kcolAT = 0 ; kcolAT < ncolAT ; kcolAT++ ) {
raloc = 2*kcolAT ; ialoc = raloc + 1 ;
ar0 = rowAT0[raloc] ; ai0 = rowAT0[ialoc] ;
ar1 = rowAT1[raloc] ; ai1 = rowAT1[ialoc] ;
ar2 = rowAT2[raloc] ; ai2 = rowAT2[ialoc] ;
rxloc = 2*colindAT[kcolAT] ; ixloc = rxloc + 1 ;
xr0 = colX0[rxloc] ; xi0 = colX0[ixloc] ;
rsum00 += ar0*xr0 + ai0*xi0 ; isum00 += ar0*xi0 - ai0*xr0 ;
rsum10 += ar1*xr0 + ai1*xi0 ; isum10 += ar1*xi0 - ai1*xr0 ;
rsum20 += ar2*xr0 + ai2*xi0 ; isum20 += ar2*xi0 - ai2*xr0 ;
}
}
if ( nrowY == nrowAT ) {
rloc = 2*irowAT ; iloc = rloc + 1 ;
colY0[rloc] -= rsum00 ; colY0[iloc] -= isum00 ;
rloc+= 2 ; iloc += 2 ;
colY0[rloc] -= rsum10 ; colY0[iloc] -= isum10 ;
rloc+= 2 ; iloc += 2 ;
colY0[rloc] -= rsum20 ; colY0[iloc] -= isum20 ;
} else {
rloc = 2*rowindAT[irowAT] ; iloc = rloc + 1 ;
colY0[rloc] -= rsum00 ; colY0[iloc] -= isum00 ;
rloc = 2*rowindAT[irowAT+1] ; iloc = rloc + 1 ;
colY0[rloc] -= rsum10 ; colY0[iloc] -= isum10 ;
rloc = 2*rowindAT[irowAT+2] ; iloc = rloc + 1 ;
colY0[rloc] -= rsum20 ; colY0[iloc] -= isum20 ;
}
rowAT0 = rowAT2 + 2*ncolAT ;
}
if ( irowAT == nrowAT - 2 ) {
double ai0, ai1, ar0, ar1, isum00, isum10, rsum00, rsum10,
xi0, xr0 ;
int ialoc, iloc, ixloc, raloc, rloc, rxloc ;
isum00 = isum10 = 0.0 ;
rsum00 = rsum10 = 0.0 ;
rowAT1 = rowAT0 + 2*ncolAT ;
if ( ncolAT == nrowX ) {
for ( kcolAT = 0 ; kcolAT < ncolAT ; kcolAT++ ) {
rloc = 2*kcolAT ; iloc = rloc + 1 ;
ar0 = rowAT0[rloc] ; ai0 = rowAT0[iloc] ;
ar1 = rowAT1[rloc] ; ai1 = rowAT1[iloc] ;
xr0 = colX0[rloc] ; xi0 = colX0[iloc] ;
rsum00 += ar0*xr0 + ai0*xi0 ; isum00 += ar0*xi0 - ai0*xr0 ;
rsum10 += ar1*xr0 + ai1*xi0 ; isum10 += ar1*xi0 - ai1*xr0 ;
}
} else {
for ( kcolAT = 0 ; kcolAT < ncolAT ; kcolAT++ ) {
raloc = 2*kcolAT ; ialoc = raloc + 1 ;
ar0 = rowAT0[raloc] ; ai0 = rowAT0[ialoc] ;
ar1 = rowAT1[raloc] ; ai1 = rowAT1[ialoc] ;
rxloc = 2*colindAT[kcolAT] ; ixloc = rxloc + 1 ;
xr0 = colX0[rxloc] ; xi0 = colX0[ixloc] ;
rsum00 += ar0*xr0 + ai0*xi0 ; isum00 += ar0*xi0 - ai0*xr0 ;
rsum10 += ar1*xr0 + ai1*xi0 ; isum10 += ar1*xi0 - ai1*xr0 ;
}
}
if ( nrowY == nrowAT ) {
rloc = 2*irowAT ; iloc = rloc + 1 ;
colY0[rloc] -= rsum00 ; colY0[iloc] -= isum00 ;
rloc+= 2 ; iloc += 2 ;
colY0[rloc] -= rsum10 ; colY0[iloc] -= isum10 ;
} else {
rloc = 2*rowindAT[irowAT] ; iloc = rloc + 1 ;
colY0[rloc] -= rsum00 ; colY0[iloc] -= isum00 ;
rloc = 2*rowindAT[irowAT+1] ; iloc = rloc + 1 ;
colY0[rloc] -= rsum10 ; colY0[iloc] -= isum10 ;
}
} else if ( irowAT == nrowAT - 1 ) {
double ai0, ar0, isum00, rsum00, xi0, xr0 ;
int ialoc, iloc, ixloc, raloc, rloc, rxloc ;
isum00 = 0.0 ;
rsum00 = 0.0 ;
if ( ncolAT == nrowX ) {
for ( kcolAT = 0 ; kcolAT < ncolAT ; kcolAT++ ) {
rloc = 2*kcolAT ; iloc = rloc + 1 ;
ar0 = rowAT0[rloc] ; ai0 = rowAT0[iloc] ;
xr0 = colX0[rloc] ; xi0 = colX0[iloc] ;
rsum00 += ar0*xr0 + ai0*xi0 ; isum00 += ar0*xi0 - ai0*xr0 ;
}
} else {
for ( kcolAT = 0 ; kcolAT < ncolAT ; kcolAT++ ) {
raloc = 2*kcolAT ; ialoc = raloc + 1 ;
ar0 = rowAT0[raloc] ; ai0 = rowAT0[ialoc] ;
rxloc = 2*colindAT[kcolAT] ; ixloc = rxloc + 1 ;
xr0 = colX0[rxloc] ; xi0 = colX0[ixloc] ;
rsum00 += ar0*xr0 + ai0*xi0 ; isum00 += ar0*xi0 - ai0*xr0 ;
}
}
if ( nrowY == nrowAT ) {
rloc = 2*irowAT ; iloc = rloc + 1 ;
colY0[rloc] -= rsum00 ; colY0[iloc] -= isum00 ;
} else {
rloc = 2*rowindAT[irowAT] ; iloc = rloc + 1 ;
colY0[rloc] -= rsum00 ; colY0[iloc] -= isum00 ;
}
}
}
return ; }
/*--------------------------------------------------------------------*/
/*
--------------------
A has sparse columns
--------------------
*/
static void
complex_updSparseColumns (
SubMtx *mtxY,
SubMtx *mtxA,
SubMtx *mtxX
) {
double *colX0, *colX1, *colX2, *colY0, *colY1, *colY2,
*entA, *entX, *entY ;
int ii, iloc, inc1, inc2, irowAT, jcolX, kk, ncolAT, ncolX,
ncolY, nentA, nrowAT, nrowX, nrowY, rloc, size ;
int *colindAT, *indices, *rowindAT, *sizes ;
/*
fprintf(stdout, "\n UPDATE_SPARSE_ROWS(%d,%d)",
mtxA->rowid, mtxA->colid) ;
*/
SubMtx_denseInfo(mtxY, &nrowY, &ncolY, &inc1, &inc2, &entY) ;
SubMtx_denseInfo(mtxX, &nrowX, &ncolX, &inc1, &inc2, &entX) ;
SubMtx_sparseColumnsInfo(mtxA, &nrowAT, &nentA, &sizes, &indices, &entA) ;
if ( (ncolAT = mtxA->nrow) != nrowX ) {
SubMtx_rowIndices(mtxA, &ncolAT, &colindAT) ;
} else {
colindAT = NULL ;
}
if ( (nrowAT = mtxA->ncol) != nrowY ) {
SubMtx_columnIndices(mtxA, &nrowAT, &rowindAT) ;
} else {
rowindAT = NULL ;
}
colX0 = entX ;
colY0 = entY ;
for ( jcolX = 0 ; jcolX < ncolX - 2 ; jcolX += 3 ) {
double ai, ar, isum0, isum1, isum2, rsum0, rsum1, rsum2,
xi0, xi1, xi2, xr0, xr1, xr2 ;
colX1 = colX0 + 2*nrowX ;
colX2 = colX1 + 2*nrowX ;
colY1 = colY0 + 2*nrowY ;
colY2 = colY1 + 2*nrowY ;
for ( irowAT = kk = 0 ; irowAT < nrowAT ; irowAT++ ) {
if ( (size = sizes[irowAT]) > 0 ) {
isum0 = isum1 = isum2 = rsum0 = rsum1 = rsum2 = 0.0 ;
if ( ncolAT == nrowX ) {
for ( ii = 0 ; ii < size ; ii++, kk++ ) {
ar = entA[2*kk] ; ai = entA[2*kk+1] ;
rloc = 2*indices[kk] ; iloc = rloc + 1 ;
xr0 = colX0[rloc] ; xi0 = colX0[iloc] ;
xr1 = colX1[rloc] ; xi1 = colX1[iloc] ;
xr2 = colX2[rloc] ; xi2 = colX2[iloc] ;
rsum0 += ar*xr0 + ai*xi0 ; isum0 += ar*xi0 - ai*xr0 ;
rsum1 += ar*xr1 + ai*xi1 ; isum1 += ar*xi1 - ai*xr1 ;
rsum2 += ar*xr2 + ai*xi2 ; isum2 += ar*xi2 - ai*xr2 ;
}
} else {
for ( ii = 0 ; ii < size ; ii++, kk++ ) {
ar = entA[2*kk] ; ai = entA[2*kk+1] ;
rloc = 2*colindAT[indices[kk]] ; iloc = rloc + 1 ;
xr0 = colX0[rloc] ; xi0 = colX0[iloc] ;
xr1 = colX1[rloc] ; xi1 = colX1[iloc] ;
xr2 = colX2[rloc] ; xi2 = colX2[iloc] ;
rsum0 += ar*xr0 + ai*xi0 ; isum0 += ar*xi0 - ai*xr0 ;
rsum1 += ar*xr1 + ai*xi1 ; isum1 += ar*xi1 - ai*xr1 ;
rsum2 += ar*xr2 + ai*xi2 ; isum2 += ar*xi2 - ai*xr2 ;
}
}
if ( nrowAT == nrowY ) {
rloc = 2*irowAT ; iloc = rloc + 1 ;
colY0[rloc] -= rsum0 ; colY0[iloc] -= isum0 ;
colY1[rloc] -= rsum1 ; colY1[iloc] -= isum1 ;
colY2[rloc] -= rsum2 ; colY2[iloc] -= isum2 ;
} else {
rloc = 2*rowindAT[irowAT] ; iloc = rloc + 1 ;
colY0[rloc] -= rsum0 ; colY0[iloc] -= isum0 ;
colY1[rloc] -= rsum1 ; colY1[iloc] -= isum1 ;
colY2[rloc] -= rsum2 ; colY2[iloc] -= isum2 ;
}
}
}
colX0 = colX2 + 2*nrowX ;
colY0 = colY2 + 2*nrowY ;
}
if ( jcolX == ncolX - 2 ) {
double ai, ar, isum0, isum1, rsum0, rsum1, xi0, xi1, xr0, xr1 ;
colX1 = colX0 + 2*nrowX ;
colY1 = colY0 + 2*nrowY ;
for ( irowAT = kk = 0 ; irowAT < nrowAT ; irowAT++ ) {
if ( (size = sizes[irowAT]) > 0 ) {
isum0 = isum1 = rsum0 = rsum1 = 0.0 ;
if ( ncolAT == nrowX ) {
for ( ii = 0 ; ii < size ; ii++, kk++ ) {
ar = entA[2*kk] ; ai = entA[2*kk+1] ;
rloc = 2*indices[kk] ; iloc = rloc + 1 ;
xr0 = colX0[rloc] ; xi0 = colX0[iloc] ;
xr1 = colX1[rloc] ; xi1 = colX1[iloc] ;
rsum0 += ar*xr0 + ai*xi0 ; isum0 += ar*xi0 - ai*xr0 ;
rsum1 += ar*xr1 + ai*xi1 ; isum1 += ar*xi1 - ai*xr1 ;
}
} else {
for ( ii = 0 ; ii < size ; ii++, kk++ ) {
ar = entA[2*kk] ; ai = entA[2*kk+1] ;
rloc = 2*colindAT[indices[kk]] ; iloc = rloc + 1 ;
xr0 = colX0[rloc] ; xi0 = colX0[iloc] ;
xr1 = colX1[rloc] ; xi1 = colX1[iloc] ;
rsum0 += ar*xr0 + ai*xi0 ; isum0 += ar*xi0 - ai*xr0 ;
rsum1 += ar*xr1 + ai*xi1 ; isum1 += ar*xi1 - ai*xr1 ;
}
}
if ( nrowAT == nrowY ) {
rloc = 2*irowAT ; iloc = rloc + 1 ;
colY0[rloc] -= rsum0 ; colY0[iloc] -= isum0 ;
colY1[rloc] -= rsum1 ; colY1[iloc] -= isum1 ;
} else {
rloc = 2*rowindAT[irowAT] ; iloc = rloc + 1 ;
colY0[rloc] -= rsum0 ; colY0[iloc] -= isum0 ;
colY1[rloc] -= rsum1 ; colY1[iloc] -= isum1 ;
}
}
}
} else if ( jcolX == ncolX - 1 ) {
double ai, ar, isum0, rsum0, xi0, xr0 ;
for ( irowAT = kk = 0 ; irowAT < nrowAT ; irowAT++ ) {
if ( (size = sizes[irowAT]) > 0 ) {
isum0 = rsum0 = 0.0 ;
if ( ncolAT == nrowX ) {
for ( ii = 0 ; ii < size ; ii++, kk++ ) {
ar = entA[2*kk] ; ai = entA[2*kk+1] ;
rloc = 2*indices[kk] ; iloc = rloc + 1 ;
xr0 = colX0[rloc] ; xi0 = colX0[iloc] ;
rsum0 += ar*xr0 + ai*xi0 ; isum0 += ar*xi0 - ai*xr0 ;
}
} else {
for ( ii = 0 ; ii < size ; ii++, kk++ ) {
ar = entA[2*kk] ; ai = entA[2*kk+1] ;
rloc = 2*colindAT[indices[kk]] ; iloc = rloc + 1 ;
xr0 = colX0[rloc] ; xi0 = colX0[iloc] ;
rsum0 += ar*xr0 + ai*xi0 ; isum0 += ar*xi0 - ai*xr0 ;
}
}
if ( nrowAT == nrowY ) {
rloc = 2*irowAT ; iloc = rloc + 1 ;
colY0[rloc] -= rsum0 ; colY0[iloc] -= isum0 ;
} else {
rloc = 2*rowindAT[irowAT] ; iloc = rloc + 1 ;
colY0[rloc] -= rsum0 ; colY0[iloc] -= isum0 ;
}
}
}
}
return ; }
/*--------------------------------------------------------------------*/
/*
-----------------
A has sparse rows
-----------------
*/
static void
complex_updSparseRows (
SubMtx *mtxY,
SubMtx *mtxA,
SubMtx *mtxX
) {
double *colX0, *colX1, *colX2, *colY0, *colY1, *colY2,
*entA, *entX, *entY ;
int ii, inc1, inc2, jcolAT, jcolX, jrowX, kk,
ncolAT, ncolX, ncolY, nentA, nrowAT, nrowX, nrowY, size ;
int *colindAT, *indices, *rowindAT, *sizes ;
/*
fprintf(stdout, "\n UPDATE_SPARSE_COLUMNS(%d,%d)",
mtxA->rowid, mtxA->colid) ;
*/
SubMtx_denseInfo(mtxY, &nrowY, &ncolY, &inc1, &inc2, &entY) ;
SubMtx_denseInfo(mtxX, &nrowX, &ncolX, &inc1, &inc2, &entX) ;
SubMtx_sparseRowsInfo(mtxA, &ncolAT, &nentA, &sizes, &indices, &entA) ;
if ( (ncolAT = mtxA->nrow) != nrowX ) {
SubMtx_rowIndices(mtxA, &ncolAT, &colindAT) ;
} else {
colindAT = NULL ;
}
if ( (nrowAT = mtxA->ncol) != nrowY ) {
SubMtx_columnIndices(mtxA, &nrowAT, &rowindAT) ;
} else {
rowindAT = NULL ;
}
colX0 = entX ;
colY0 = entY ;
for ( jcolX = 0 ; jcolX < ncolX - 2 ; jcolX += 3 ) {
double ai, ar, xi0, xi1, xi2, xr0, xr1, xr2 ;
int iloc, rloc ;
colX1 = colX0 + 2*nrowX ;
colX2 = colX1 + 2*nrowX ;
colY1 = colY0 + 2*nrowY ;
colY2 = colY1 + 2*nrowY ;
for ( jcolAT = kk = 0 ; jcolAT < ncolAT ; jcolAT++ ) {
if ( (size = sizes[jcolAT]) > 0 ) {
if ( ncolAT == nrowX ) {
jrowX = jcolAT ;
} else {
jrowX = colindAT[jcolAT] ;
}
rloc = 2*jrowX ; iloc = rloc + 1 ;
xr0 = colX0[rloc] ; xi0 = colX0[iloc] ;
xr1 = colX1[rloc] ; xi1 = colX1[iloc] ;
xr2 = colX2[rloc] ; xi2 = colX2[iloc] ;
if ( nrowAT == nrowY ) {
for ( ii = 0 ; ii < size ; ii++, kk++ ) {
ar = entA[2*kk] ; ai = entA[2*kk+1] ;
rloc = 2*indices[kk] ; iloc = rloc + 1 ;
colY0[rloc] -= ar*xr0 + ai*xi0 ;
colY0[iloc] -= ar*xi0 - ai*xr0 ;
colY1[rloc] -= ar*xr1 + ai*xi1 ;
colY1[iloc] -= ar*xi1 - ai*xr1 ;
colY2[rloc] -= ar*xr2 + ai*xi2 ;
colY2[iloc] -= ar*xi2 - ai*xr2 ;
}
} else {
for ( ii = 0 ; ii < size ; ii++, kk++ ) {
ar = entA[2*kk] ; ai = entA[2*kk+1] ;
rloc = 2*rowindAT[indices[kk]] ; iloc = rloc + 1 ;
colY0[rloc] -= ar*xr0 + ai*xi0 ;
colY0[iloc] -= ar*xi0 - ai*xr0 ;
colY1[rloc] -= ar*xr1 + ai*xi1 ;
colY1[iloc] -= ar*xi1 - ai*xr1 ;
colY2[rloc] -= ar*xr2 + ai*xi2 ;
colY2[iloc] -= ar*xi2 - ai*xr2 ;
}
}
}
}
colX0 = colX2 + 2*nrowX ;
colY0 = colY2 + 2*nrowY ;
}
if ( jcolX == ncolX - 2 ) {
double ai, ar, xi0, xi1, xr0, xr1 ;
int iloc, rloc ;
colX1 = colX0 + 2*nrowX ;
colY1 = colY0 + 2*nrowY ;
for ( jcolAT = kk = 0 ; jcolAT < ncolAT ; jcolAT++ ) {
if ( (size = sizes[jcolAT]) > 0 ) {
if ( ncolAT == nrowX ) {
jrowX = jcolAT ;
} else {
jrowX = colindAT[jcolAT] ;
}
rloc = 2*jrowX ; iloc = rloc + 1 ;
xr0 = colX0[rloc] ; xi0 = colX0[iloc] ;
xr1 = colX1[rloc] ; xi1 = colX1[iloc] ;
if ( nrowAT == nrowY ) {
for ( ii = 0 ; ii < size ; ii++, kk++ ) {
ar = entA[2*kk] ; ai = entA[2*kk+1] ;
rloc = 2*indices[kk] ; iloc = rloc + 1 ;
colY0[rloc] -= ar*xr0 + ai*xi0 ;
colY0[iloc] -= ar*xi0 - ai*xr0 ;
colY1[rloc] -= ar*xr1 + ai*xi1 ;
colY1[iloc] -= ar*xi1 - ai*xr1 ;
}
} else {
for ( ii = 0 ; ii < size ; ii++, kk++ ) {
ar = entA[2*kk] ; ai = entA[2*kk+1] ;
rloc = 2*rowindAT[indices[kk]] ; iloc = rloc + 1 ;
colY0[rloc] -= ar*xr0 + ai*xi0 ;
colY0[iloc] -= ar*xi0 - ai*xr0 ;
colY1[rloc] -= ar*xr1 + ai*xi1 ;
colY1[iloc] -= ar*xi1 - ai*xr1 ;
}
}
}
}
} else if ( jcolX == ncolX - 1 ) {
double ai, ar, xi0, xr0 ;
int iloc, rloc ;
for ( jcolAT = kk = 0 ; jcolAT < ncolAT ; jcolAT++ ) {
if ( (size = sizes[jcolAT]) > 0 ) {
if ( ncolAT == nrowX ) {
jrowX = jcolAT ;
} else {
jrowX = colindAT[jcolAT] ;
}
rloc = 2*jrowX ; iloc = rloc + 1 ;
xr0 = colX0[rloc] ; xi0 = colX0[iloc] ;
if ( nrowAT == nrowY ) {
for ( ii = 0 ; ii < size ; ii++, kk++ ) {
ar = entA[2*kk] ; ai = entA[2*kk+1] ;
rloc = 2*indices[kk] ; iloc = rloc + 1 ;
colY0[rloc] -= ar*xr0 + ai*xi0 ;
colY0[iloc] -= ar*xi0 - ai*xr0 ;
}
} else {
for ( ii = 0 ; ii < size ; ii++, kk++ ) {
ar = entA[2*kk] ; ai = entA[2*kk+1] ;
rloc = 2*rowindAT[indices[kk]] ; iloc = rloc + 1 ;
colY0[rloc] -= ar*xr0 + ai*xi0 ;
colY0[iloc] -= ar*xi0 - ai*xr0 ;
}
}
}
}
}
return ; }
/*--------------------------------------------------------------------*/
syntax highlighted by Code2HTML, v. 0.9.1