Исследование скорости сходимости ускоренных блочных вариантов строчно-ориентированной формы регуляризованного алгоритма Качмажа

Cover Page

Cite item

Full Text

Abstract

Обоснование. Классический алгоритм Качмажа и его регуляризованные модификации обладают предельно простой алгоритмической структурой, что делает их удобным инструментом для решения прикладных задач больших размерностей, таких как обработка изображений, машинное обучение и восстановление сигналов. Однако, несмотря на концептуальную ясность и вычислительную доступность, эти алгоритмы страдают низкой скоростью сходимости.

Цель — разработка, исследование и программная реализация ускоренных блочных вариантов строчно-ориентированной формы регуляризованного алгоритма Качмажа.

Методы. Для регуляризованной формы алгоритма Качмажа ключевым этапом является вычисление псевдообратной матрицы, что определяет общую вычислительную сложность метода. В работе [1] используется итерационный алгоритм Бен-Израэля для вычисления псевдообратной матрицы:

Xk+1=Xk[2E-AXk],k=0,1,2, (1)

Этот метод учитывает специфическую структуру расширенной матрицы системы [2] и позволяет эффективно использовать современные высокопроизводительные вычислительные платформы.

Рассмотрим методы ускорения процедуры вычисления псевдообратной матрицы. Так, Тутуниан и Солеймани [3] предложили метод четвертого порядка, требующий пять операций умножения матриц:

Xk+1=0.5Xk(9E-AXk(16E-AXk(14E-AXk(6E-AXk)))). (2)

Кришнамурти и Сен [3] представили альтернативный метод четвертого порядка, включающий четыре операции умножения матриц:

Xk+1=Xk(E+Yk(E+Yk(E+Yk))),Yk=E-AXk. (3)

Другим эффективным способом ускорения сходимости алгоритма является этап препроцессинга. Линейную систему Au=f можно преобразовать в эквивалентную систему QAu=Qf. При этом матрица Q определяется как:

Q=HD,

где H — матрица Адамара, D — диагональная матрица размером m×m, элементы которой случайным образом принимают значения ±1/m.

Результаты. На рис. 1 представлены графики сравнения времени вычисления псевдообратной матрицы для методов (1)–(3), примененных к матрице A4096×4096 на CPU и GPU.

 

Рис. 1. Тестовая задача c матрицей A4096×4096

 

На рис. 2 приведены графики, демонстрирующие сравнение относительной ошибки и времени выполнения классического алгоритма и его версии с препроцессингом для матрицы A4096×4096.

 

Рис. 2. Тестовая задача c матрицей A4096×4096. Число блоков 4

 

Выводы. Анализ методов ускорения вычислительного процесса показывает, что применение методов (2) и (3) обеспечивает лишь умеренное сокращение времени вычисления псевдообратной матрицы, но требует дополнительных вычислительных ресурсов. Это ограничивает их эффективность при обработке больших объемов данных и высокоразмерных систем. Напротив, алгоритм с этапом препроцессинга демонстрирует существенное преимущество, снижая время выполнения расчетов в 14,5 раз. Этот результат подтверждает, что предварительная обработка данных и оптимизация вычислительных структур играют ключевую роль в повышении скорости работы алгоритма.

Full Text

Обоснование. Классический алгоритм Качмажа и его регуляризованные модификации обладают предельно простой алгоритмической структурой, что делает их удобным инструментом для решения прикладных задач больших размерностей, таких как обработка изображений, машинное обучение и восстановление сигналов. Однако, несмотря на концептуальную ясность и вычислительную доступность, эти алгоритмы страдают низкой скоростью сходимости.

Цель — разработка, исследование и программная реализация ускоренных блочных вариантов строчно-ориентированной формы регуляризованного алгоритма Качмажа.

Методы. Для регуляризованной формы алгоритма Качмажа ключевым этапом является вычисление псевдообратной матрицы, что определяет общую вычислительную сложность метода. В работе [1] используется итерационный алгоритм Бен-Израэля для вычисления псевдообратной матрицы:

Xk+1=Xk[2E-AXk],k=0,1,2, (1)

Этот метод учитывает специфическую структуру расширенной матрицы системы [2] и позволяет эффективно использовать современные высокопроизводительные вычислительные платформы.

Рассмотрим методы ускорения процедуры вычисления псевдообратной матрицы. Так, Тутуниан и Солеймани [3] предложили метод четвертого порядка, требующий пять операций умножения матриц:

Xk+1=0.5Xk(9E-AXk(16E-AXk(14E-AXk(6E-AXk)))). (2)

Кришнамурти и Сен [3] представили альтернативный метод четвертого порядка, включающий четыре операции умножения матриц:

Xk+1=Xk(E+Yk(E+Yk(E+Yk))),Yk=E-AXk. (3)

Другим эффективным способом ускорения сходимости алгоритма является этап препроцессинга. Линейную систему Au=f можно преобразовать в эквивалентную систему QAu=Qf. При этом матрица Q определяется как:

Q=HD,

где H — матрица Адамара, D — диагональная матрица размером m×m, элементы которой случайным образом принимают значения ±1/m.

Результаты. На рис. 1 представлены графики сравнения времени вычисления псевдообратной матрицы для методов (1)–(3), примененных к матрице A4096×4096 на CPU и GPU.

 

Рис. 1. Тестовая задача c матрицей A4096×4096

 

На рис. 2 приведены графики, демонстрирующие сравнение относительной ошибки и времени выполнения классического алгоритма и его версии с препроцессингом для матрицы A4096×4096.

 

Рис. 2. Тестовая задача c матрицей A4096×4096. Число блоков 4

 

Выводы. Анализ методов ускорения вычислительного процесса показывает, что применение методов (2) и (3) обеспечивает лишь умеренное сокращение времени вычисления псевдообратной матрицы, но требует дополнительных вычислительных ресурсов. Это ограничивает их эффективность при обработке больших объемов данных и высокоразмерных систем. Напротив, алгоритм с этапом препроцессинга демонстрирует существенное преимущество, снижая время выполнения расчетов в 14,5 раз. Этот результат подтверждает, что предварительная обработка данных и оптимизация вычислительных структур играют ключевую роль в повышении скорости работы алгоритма.

×

About the authors

Самарский государственный технический университет

Author for correspondence.
Email: sad17052001@gmail.com

студент, группа 2-ИАИТ-110М, институт автоматики и информационных технологий

Russian Federation, Самара

References

  1. Derezinski M., Needell D., Rebrova E., Yang J. Randomized Kaczmarz Methods with Beyond-Krylov Convergence. 2025. 41 p. doi: 10.48550/arXiv.2501.11673
  2. Сидоров Ю.В. Итерационные методы регуляризации в регрессионном моделировании и обработке цифровых данных. Самара, 2022. 120 с. EDN: NVMJOI
  3. Esmaeili H., Erfanifar R., Rashidi M. A fourth-order iterative method for computing the moore-penrose inverse // Journal of Hyperstructures. 2017. Vol. 6, N 1. P. 52–67.

Supplementary files

Supplementary Files
Action
1. JATS XML
2. Рис. 1. Тестовая задача c матрицей A4096×4096

Download (93KB)
3. Рис. 2. Тестовая задача c матрицей A4096×4096. Число блоков 4

Download (107KB)

Copyright (c) 2025 Сиротин А.Д.

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.