feat: moving to numba package

2026-07-04 16:43:12 +02:00 · 2025-01-13 17:05:20 +01:00 · 2025-01-13 17:05:20 +01:00 · d1a3deab53
commit d1a3deab53
parent 8b457a2f43
2 changed files with 163 additions and 72 deletions
--- a/code/threads_indep.py
+++ b/code/threads_indep.py
@ -1,103 +1,91 @@
 import multiprocessing
 import gc
 import time
-from concurrent.futures import ThreadPoolExecutor
+import numpy as np
 from numba import njit, prange
 from time_measurement import time_measurement_longest, longest_threads_time_accumulator, tests_time
 import linear_algebra_utils as linAlg
 # Funkcje równoległe z Numba
@njit(parallel=True)
 def numba_matrix_vector_multiply(A, input_x, Ax):
    n, m = A.shape
    for i in prange(n):
        Ax[i] = np.dot(A[i], input_x)
@njit(parallel=True)
 def numba_vector_vector_subtraction(b, Ax, residual):
    for i in prange(len(b)):
        residual[i] = b[i] - Ax[i]
@njit(parallel=True)
 def numba_scalar_vector_multiply(omega, vector, result):
    for i in prange(len(vector)):
        result[i] = omega * vector[i]
@njit(parallel=True)
 def numba_vector_vector_addition(input_x, vector, output_x):
    for i in prange(len(input_x)):
        output_x[i] = input_x[i] + vector[i]
 # Funkcje z dekoratorem
@time_measurement_longest(longest_threads_time_accumulator)
 def matrix_vector_multiply(A, input_x, Ax):
    numba_matrix_vector_multiply(A, input_x, Ax)
@time_measurement_longest(longest_threads_time_accumulator)
-def matrix_vector_multiply(A, input_x, start, end, Ax):
+def vector_vector_subtraction(b, Ax, residual):
-    Ax[start:end] = [sum(x*y for x, y in zip(row, input_x)) for row in A[start:end]]
+    numba_vector_vector_subtraction(b, Ax, residual)
@time_measurement_longest(longest_threads_time_accumulator)
-def vector_vector_subtraction(b, Ax, start, end, residual):
+def scalar_vector_multiply(omega, vector, result):
-    residual[start:end] = [x-y for x, y in zip(b[start:end], Ax[start:end])]
+    numba_scalar_vector_multiply(omega, vector, result)
@time_measurement_longest(longest_threads_time_accumulator)
-def scalar_vector_multiply(omega, vector, start, end, result):
+def vector_vector_addition(input_x, vector, output_x):
-    result[start:end] = [omega * x for x in vector[start:end]]
+    numba_vector_vector_addition(input_x, vector, output_x)
@time_measurement_longest(longest_threads_time_accumulator)
 def vector_vector_addition(input_x, vector, start, end, output_x):
    output_x[start:end] = [x+y for x, y in zip(input_x[start:end], vector[start:end])]
 # Metoda Richardson z obsługą wątków
 def RichardsonMethodThreads(A, b, lambda_min, lambda_max, max_iterations, x0=None, tol=1e-5):
    longest_threads_time_accumulator.hard_reset()
    gc.disable()
    start_time = time.perf_counter()
-    n = len(b)
+    A = np.array(A)
-    x0 = x0 if x0 is not None else [0.0] * len(b)
+    b = np.array(b)
-    x = x0[:]
+    x0 = np.array(x0) if x0 is not None else np.zeros_like(b)
    x = x0.copy()
    omega = 2 / (lambda_min + lambda_max)
-    num_threads = multiprocessing.cpu_count()
+    n = len(b)
    chunk_size = n // num_threads
-    with ThreadPoolExecutor(max_workers=num_threads) as executor: # wątki są tworzone raz i nie są niszczone
+    for iteration in range(max_iterations):
-        for iteration in range(max_iterations):
+        Ax = np.zeros_like(x)
        matrix_vector_multiply(A, x, Ax)
        longest_threads_time_accumulator.save_lap_and_reset()
-            Ax = [0] * len(x) # tutaj zostanie przypisany wynik z mnożenia macierzy A z wektorem x
+        residual = np.zeros_like(b)
-            futures = []
+        vector_vector_subtraction(b, Ax, residual)
        longest_threads_time_accumulator.save_lap_and_reset()
-            for i in range(num_threads):
+        change_vector = np.zeros_like(residual)
-                start = i * chunk_size
+        scalar_vector_multiply(omega, residual, change_vector)
-                end = n if i == num_threads - 1 else (i + 1) * chunk_size
+        longest_threads_time_accumulator.save_lap_and_reset()
                futures.append(executor.submit(matrix_vector_multiply, A, x, start, end, Ax))
            for future in futures:
                future.result()
-            longest_threads_time_accumulator.save_lap_and_reset()
+        _x = np.zeros_like(x)
-            residual = [0] * len(b) # tutaj zostanie przypisany wynik z vector_vector_subtraction
+        vector_vector_addition(x, change_vector, _x)
-            futures = []
+        longest_threads_time_accumulator.save_lap_and_reset()
-            for i in range(num_threads):
+        x = _x.copy()
                start = i * chunk_size
                end = n if i == num_threads - 1 else (i + 1) * chunk_size
                futures.append(executor.submit(vector_vector_subtraction, b, Ax, start, end, residual))
            for future in futures:
                future.result()
-            longest_threads_time_accumulator.save_lap_and_reset()
+        if linAlg.SequentialLinearAlgebraUtils.vector_norm(residual) < tol:
-            change_vector = [0] * len(residual) # zostanie tu przypisany wynik scalar_vector_multiply po pracy wątków
+            break
            futures = []
            for i in range(num_threads):
                start = i * chunk_size
                end = n if i == num_threads - 1 else (i + 1) * chunk_size
                futures.append(executor.submit(scalar_vector_multiply, omega, residual, start, end, change_vector))
            for future in futures:
                future.result()
            longest_threads_time_accumulator.save_lap_and_reset()
            _x = x[:] # do _x zostanie przez wątki przypisany wynik pracy w danej iteracji
            futures = []
            for i in range(num_threads):
                start = i * chunk_size
                end = n if i == num_threads - 1 else (i + 1) * chunk_size
                futures.append(executor.submit(vector_vector_addition, x, change_vector, start, end, _x))
            for future in futures:
                future.result()
            longest_threads_time_accumulator.save_lap_and_reset()
            x = _x[:]
            if (linAlg.SequentialLinearAlgebraUtils.vector_norm(residual) < tol):
                    break
    end_time = time.perf_counter()
    gc.enable()
    total_time = end_time - start_time
    sequential_time = total_time - longest_threads_time_accumulator.total_time
-    
+
    print(f"Total: {total_time:.3e}s, Seq: {sequential_time:.3e}s, Parallel (threads): {longest_threads_time_accumulator.total_time:.3e}s, Tests time: {tests_time.total_time:.3e}s")
-    
+
-    return x, 0
+    return x, 0
--- a/code/threads_indep_old.py
+++ b/code/threads_indep_old.py
@ -0,0 +1,103 @@
 import multiprocessing
 import gc
 import time
 from concurrent.futures import ThreadPoolExecutor
 from time_measurement import time_measurement_longest, longest_threads_time_accumulator, tests_time
 import linear_algebra_utils as linAlg
@time_measurement_longest(longest_threads_time_accumulator)
 def matrix_vector_multiply(A, input_x, start, end, Ax):
    Ax[start:end] = [sum(x*y for x, y in zip(row, input_x)) for row in A[start:end]]
@time_measurement_longest(longest_threads_time_accumulator)
 def vector_vector_subtraction(b, Ax, start, end, residual):
    residual[start:end] = [x-y for x, y in zip(b[start:end], Ax[start:end])]
@time_measurement_longest(longest_threads_time_accumulator)
 def scalar_vector_multiply(omega, vector, start, end, result):
    result[start:end] = [omega * x for x in vector[start:end]]
@time_measurement_longest(longest_threads_time_accumulator)
 def vector_vector_addition(input_x, vector, start, end, output_x):
    output_x[start:end] = [x+y for x, y in zip(input_x[start:end], vector[start:end])]
 def RichardsonMethodThreads(A, b, lambda_min, lambda_max, max_iterations, x0=None, tol=1e-5):
    longest_threads_time_accumulator.hard_reset()
    gc.disable()
    start_time = time.perf_counter()
    n = len(b)
    x0 = x0 if x0 is not None else [0.0] * len(b)
    x = x0[:]
    omega = 2 / (lambda_min + lambda_max)
    num_threads = multiprocessing.cpu_count()
    chunk_size = n // num_threads
    with ThreadPoolExecutor(max_workers=num_threads) as executor: # wątki są tworzone raz i nie są niszczone
        for iteration in range(max_iterations):
            Ax = [0] * len(x) # tutaj zostanie przypisany wynik z mnożenia macierzy A z wektorem x
            futures = []
            for i in range(num_threads):
                start = i * chunk_size
                end = n if i == num_threads - 1 else (i + 1) * chunk_size
                futures.append(executor.submit(matrix_vector_multiply, A, x, start, end, Ax))
            for future in futures:
                future.result()
            longest_threads_time_accumulator.save_lap_and_reset()
            residual = [0] * len(b) # tutaj zostanie przypisany wynik z vector_vector_subtraction
            futures = []
            for i in range(num_threads):
                start = i * chunk_size
                end = n if i == num_threads - 1 else (i + 1) * chunk_size
                futures.append(executor.submit(vector_vector_subtraction, b, Ax, start, end, residual))
            for future in futures:
                future.result()
            longest_threads_time_accumulator.save_lap_and_reset()
            change_vector = [0] * len(residual) # zostanie tu przypisany wynik scalar_vector_multiply po pracy wątków
            futures = []
            for i in range(num_threads):
                start = i * chunk_size
                end = n if i == num_threads - 1 else (i + 1) * chunk_size
                futures.append(executor.submit(scalar_vector_multiply, omega, residual, start, end, change_vector))
            for future in futures:
                future.result()
            longest_threads_time_accumulator.save_lap_and_reset()
            _x = x[:] # do _x zostanie przez wątki przypisany wynik pracy w danej iteracji
            futures = []
            for i in range(num_threads):
                start = i * chunk_size
                end = n if i == num_threads - 1 else (i + 1) * chunk_size
                futures.append(executor.submit(vector_vector_addition, x, change_vector, start, end, _x))
            for future in futures:
                future.result()
            longest_threads_time_accumulator.save_lap_and_reset()
            x = _x[:]
            if (linAlg.SequentialLinearAlgebraUtils.vector_norm(residual) < tol):
                    break
    end_time = time.perf_counter()
    gc.enable()
    total_time = end_time - start_time
    sequential_time = total_time - longest_threads_time_accumulator.total_time
    print(f"Total: {total_time:.3e}s, Seq: {sequential_time:.3e}s, Parallel (threads): {longest_threads_time_accumulator.total_time:.3e}s, Tests time: {tests_time.total_time:.3e}s")
    return x, 0