Исследование скорости сходимости ускоренных блочных вариантов строчно-ориентированной формы регуляризованного алгоритма Качмажа

Сиротин Алексей Дмитриевич

Исследование скорости сходимости ускоренных блочных вариантов строчно-ориентированной формы регуляризованного алгоритма Качмажа

Authors: ¹
Affiliations:
1. Самарский государственный технический университет
Issue: Vol 1 (2025)
Pages: 183-184
Section: ЧАСТЬ I. Прикладная математика и математическое моделирование
Submitted: 15.05.2025
Accepted: 30.05.2025
Published: 02.11.2025
URL: https://rjpbr.com/osnk-sr2025/article/view/679742
ID: 679742

Cite item

Full Text

Abstract
Full Text
About the authors
References
Supplementary files
Statistics

Abstract

Обоснование. Классический алгоритм Качмажа и его регуляризованные модификации обладают предельно простой алгоритмической структурой, что делает их удобным инструментом для решения прикладных задач больших размерностей, таких как обработка изображений, машинное обучение и восстановление сигналов. Однако, несмотря на концептуальную ясность и вычислительную доступность, эти алгоритмы страдают низкой скоростью сходимости.

Цель — разработка, исследование и программная реализация ускоренных блочных вариантов строчно-ориентированной формы регуляризованного алгоритма Качмажа.

Методы. Для регуляризованной формы алгоритма Качмажа ключевым этапом является вычисление псевдообратной матрицы, что определяет общую вычислительную сложность метода. В работе [1] используется итерационный алгоритм Бен-Израэля для вычисления псевдообратной матрицы:

$X_{k + 1} = X_{k} [2 E - A X_{k}], k = 0, 1, 2, \dots$ (1)

Этот метод учитывает специфическую структуру расширенной матрицы системы [2] и позволяет эффективно использовать современные высокопроизводительные вычислительные платформы.

Рассмотрим методы ускорения процедуры вычисления псевдообратной матрицы. Так, Тутуниан и Солеймани [3] предложили метод четвертого порядка, требующий пять операций умножения матриц:

$X_{k + 1} = 0.5 X_{k} (9 E - A X_{k} (16 E - A X_{k} (14 E - A X_{k} (6 E - A X_{k}))))$ . (2)

Кришнамурти и Сен [3] представили альтернативный метод четвертого порядка, включающий четыре операции умножения матриц:

$X_{k + 1} = X_{k} (E + Y_{k} (E + Y_{k} (E + Y_{k}))), Y_{k} = E - A X_{k}$ . (3)

Другим эффективным способом ускорения сходимости алгоритма является этап препроцессинга. Линейную систему $A u = f$ можно преобразовать в эквивалентную систему $Q A u = Q f$ . При этом матрица $Q$ определяется как:

$Q = H D$ ,

где $H$ — матрица Адамара, $D$ — диагональная матрица размером $m \times m$ , элементы которой случайным образом принимают значения $\pm 1 / \sqrt{m}$ .

Результаты. На рис. 1 представлены графики сравнения времени вычисления псевдообратной матрицы для методов (1)–(3), примененных к матрице $A^{4096 \times 4096}$ на CPU и GPU.

Рис. 1. Тестовая задача c матрицей $A^{4096 \times 4096}$

На рис. 2 приведены графики, демонстрирующие сравнение относительной ошибки и времени выполнения классического алгоритма и его версии с препроцессингом для матрицы $A^{4096 \times 4096}$ .

Рис. 2. Тестовая задача c матрицей $A^{4096 \times 4096}$ . Число блоков 4

Выводы. Анализ методов ускорения вычислительного процесса показывает, что применение методов (2) и (3) обеспечивает лишь умеренное сокращение времени вычисления псевдообратной матрицы, но требует дополнительных вычислительных ресурсов. Это ограничивает их эффективность при обработке больших объемов данных и высокоразмерных систем. Напротив, алгоритм с этапом препроцессинга демонстрирует существенное преимущество, снижая время выполнения расчетов в 14,5 раз. Этот результат подтверждает, что предварительная обработка данных и оптимизация вычислительных структур играют ключевую роль в повышении скорости работы алгоритма.

Keywords

строчно-ориентированная форма, регуляризация, алгоритм Качмажа, псевдообратная матрица, итерационный алгоритм Бен-Израэля, препроцессинг

Full Text

$X_{k + 1} = X_{k} [2 E - A X_{k}], k = 0, 1, 2, \dots$ (1)

$X_{k + 1} = 0.5 X_{k} (9 E - A X_{k} (16 E - A X_{k} (14 E - A X_{k} (6 E - A X_{k}))))$ . (2)

$X_{k + 1} = X_{k} (E + Y_{k} (E + Y_{k} (E + Y_{k}))), Y_{k} = E - A X_{k}$ . (3)

$Q = H D$ ,

Рис. 1. Тестовая задача c матрицей $A^{4096 \times 4096}$

Рис. 2. Тестовая задача c матрицей $A^{4096 \times 4096}$ . Число блоков 4

About the authors

Самарский государственный технический университет

Author for correspondence.
Email: sad17052001@gmail.com

студент, группа 2-ИАИТ-110М, институт автоматики и информационных технологий

Russian Federation, Самара

References

Derezinski M., Needell D., Rebrova E., Yang J. Randomized Kaczmarz Methods with Beyond-Krylov Convergence. 2025. 41 p. doi: 10.48550/arXiv.2501.11673
Сидоров Ю.В. Итерационные методы регуляризации в регрессионном моделировании и обработке цифровых данных. Самара, 2022. 120 с. EDN: NVMJOI
Esmaeili H., Erfanifar R., Rashidi M. A fourth-order iterative method for computing the moore-penrose inverse // Journal of Hyperstructures. 2017. Vol. 6, N 1. P. 52–67.

Supplementary files

Supplementary Files

Action

1. JATS XML

Download

2. Рис. 1. Тестовая задача c матрицей A4096×4096

Download (93KB)

Indexing metadata

3. Рис. 2. Тестовая задача c матрицей A4096×4096. Число блоков 4

Download (107KB)

Indexing metadata

Username
Password
Remember me

Forgot password?	Register

Username
Password
Remember me

Forgot password?	Register