使用c++进行大规模的矩阵运算

算法通过分块矩阵乘法和多线程并行计算实现了大规模矩阵乘法的高效计算

#include <iostream>
#include <vector>
#include <thread>
#include <cmath>

class LargeMatrixMultiplier {
private:
    const int BLOCK_SIZE = 64;  // 分块大小

    // 辅助函数:小规模矩阵乘法
    void multiplyBlock(const std::vector<std::vector<double>>& A,  // A矩阵
                       const std::vector<std::vector<double>>& B,  // B矩阵
                       std::vector<std::vector<double>>& C,        // C矩阵
                       int rowA, int colA, int colB) const {       // 起始行和列
        for (int i = 0; i < BLOCK_SIZE; ++i) {                     // 遍历块的行
            for (int j = 0; j < BLOCK_SIZE; ++j) {                 // 遍历块的列
                double sum = 0;                                    // 初始化累加器
                for (int k = 0; k < BLOCK_SIZE; ++k) {             // 遍历块的内部
                    sum += A[rowA + i][colA + k] * B[colA + k][colB + j];  // 累加乘积
                }
                C[rowA + i][colB + j] += sum;                      // 更新C矩阵的值
            }
        }
    }

    // 线程函数
    void multiplyBlocksThread(const std::vector<std::vector<double>>& A,  // A矩阵
                              const std::vector<std::vector<double>>& B,  // B矩阵
                              std::vector<std::vector<double>>& C,        // C矩阵
                              int startRow, int endRow) const {           // 起始行和结束行
        int n = A.size();                                                 // 获取矩阵的大小
        for (int i = startRow; i < endRow; i += BLOCK_SIZE) {             // 遍历行块
            for (int j = 0; j < n; j += BLOCK_SIZE) {                     // 遍历列块
                for (int k = 0; k < n; k += BLOCK_SIZE) {                 // 遍历内部块
                    multiplyBlock(A, B, C, i, k, j);                      // 进行块乘法
                }
            }
        }
    }

public:
    std::vector<std::vector<double>> multiply(const std::vector<std::vector<double>>& A,  // A矩阵
                                              const std::vector<std::vector<double>>& B) const {  // B矩阵
        int n = A.size();                                                             // 获取矩阵的大小
        std::vector<std::vector<double>> C(n, std::vector<double>(n, 0));             // 初始化C矩阵
        C.reserve(n);                                                                 // 预留空间

        int numThreads = std::thread::hardware_concurrency();                         // 获取硬件并发线程数
        std::vector<std::thread> threads;                                             // 存储线程

        int rowsPerThread = n / numThreads;                                           // 每个线程处理的行数
        for (int i = 0; i < numThreads; ++i) {                                        // 创建线程
            int startRow = i * rowsPerThread;                                         // 计算起始行
            int endRow = (i == numThreads - 1) ? n : (i + 1) * rowsPerThread;         // 计算结束行
            threads.emplace_back(&LargeMatrixMultiplier::multiplyBlocksThread, this,  // 创建线程
                                 std::ref(A), std::ref(B), std::ref(C), startRow, endRow); // 传递参数
        }

        for (auto& thread : threads) {                                                // 等待所有线程完成
            thread.join();                                                            // 等待线程
        }

        return C;                                                                     // 返回结果矩阵
    }
};

int main() {
    int n = 1024;  // 矩阵大小
    std::vector<std::vector<double>> A(n, std::vector<double>(n, 1.0));  // 初始化A矩阵
    std::vector<std::vector<double>> B(n, std::vector<double>(n, 2.0));  // 初始化B矩阵

    LargeMatrixMultiplier multiplier;                                     // 创建乘法器对象
    auto C = multiplier.multiply(A, B);                                   // 进行矩阵乘法

    std::cout << "Matrix multiplication completed." << std::endl;        // 输出完成信息
    std::cout << "C[0][0] = " << C[0][0] << std::endl;  // 应该是 2048.0  // 输出C矩阵的第一个元素

    return 0;  // 返回0
}

这只是一个简略的算法,具体需要根据实际情况进行修改

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/778466.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

html+css+js图片手动轮播

源代码在界面图片后面 轮播演示用的几张图片是Bing上的&#xff0c;直接用的几张图片的URL&#xff0c;谁加载可能需要等一下&#xff0c;现实中替换成自己的图片即可 关注一下点个赞吧&#x1f604; 谢谢大佬 界面图片 源代码 <!DOCTYPE html> <html lang&quo…

C++继承初识

一。继承 1.继承本质是复用相同的代码&#xff08;属性&#xff09; 2.格式&#xff1a;class 类名&#xff1a;继承方式 父类 3.继承方式的规律&#xff1a; 父类的&#xff1a; 对于私有成员&#xff0c;不管哪种继承方式都不可见--->不想被子类继承的成员 对于保护…

代码随想录——划分字母区间(Leetcode763)

题目链接 贪心 class Solution {public List<Integer> partitionLabels(String s) {int[] count new int[27];Arrays.fill(count,0);// 统计元素最后一次出现的位置for(int i 0; i < s.length(); i){count[s.charAt(i) - a] i;}List<Integer> res new Ar…

非对称加密算法原理与应用2——RSA私钥加密文件

作者:私语茶馆 1.相关章节 (1)非对称加密算法原理与应用1——秘钥的生成-CSDN博客 第一章节讲述的是创建秘钥对,并将公钥和私钥导出为文件格式存储。 本章节继续讲如何利用私钥加密内容,包括从密钥库或文件中读取私钥,并用RSA算法加密文件和String。 2.私钥加密的概述…

JDK都出到20多了,你还不会使用JDK8的Stream流写代码吗?

目录 前言 Stream流 是什么&#xff1f; 为什么要用Steam流 常见stream流使用案例 映射 map() & 集合 collect() 单字段映射 多字段映射 映射为其他的对象 映射为 Map 去重 distinct() 过滤 filter() Stream流的其他方法 使用Stream流的弊端 前言 当你某天看…

深度学习模型加密python版本

支持加密的模型: # torch、torch script、onnx、tensorrt 、torch2trt、tensorflow、tensorflow2tensorrt、paddlepaddle、paddle2tensorrt 深度学习推理模型通常以文件的形式进行保存&#xff0c;相应的推理引擎通过读取模型文件并反序列化即可进行推理过程. 这样一来&#…

跨平台Ribbon UI组件QtitanRibbon全新发布v6.7.0——支持Qt 6.6.3

没有Microsoft在其办公解决方案中提供的界面&#xff0c;就无法想象现代应用程序&#xff0c;这个概念称为Ribbon UI&#xff0c;目前它是使应用程序与时俱进的主要属性。QtitanRibbon是一款遵循Microsoft Ribbon UI Paradigm for Qt技术的Ribbon UI组件&#xff0c;QtitanRibb…

vue3【实战】来回拖拽放置图片

效果预览 技术要点 img 标签默认就是可拖拽的&#xff08;a 标签也是&#xff09;事件 e 内的 dataTransfer 对象可用于临时存储事件过程中的数据拖拽事件的默认行为是用浏览器新开页签打开被拖拽对象&#xff0c;所以通常需要禁用默认的浏览器行为被拖拽元素必须设置 id&#…

拉曼光谱入门:2.拉曼光谱发展史、拉曼效应与试样温度的确定方法

1.拉曼光谱技术发展史 这里用简单的箭头与关键字来概括一下拉曼光谱技术的发展史 1928年&#xff1a;拉曼效应的发现 → 拉曼光谱术的初步应用20世纪40年代&#xff1a;红外光谱术的发展 → 拉曼光谱术的限制20世纪60年代&#xff1a;激光作为光源的引入 → 拉曼光谱术的性能提…

阿里云人工智能平台PAI部署开源大模型chatglm3之失败记录

想学习怎么部署大模型&#xff0c;跟着网上的帖子部署了一个星期&#xff0c;然而没有成功。失败的经历也是经历&#xff0c;记在这里。 我一共创建了3个实例来部署chatglm3&#xff0c;每个实例都是基于V100创建的&#xff08;当时没有A10可选了&#xff09;&#xff0c;其显…

数据库缓存管理

1. 简介 缓存管理器是数据库管理系统&#xff08;DBMS&#xff09;中负责管理内存中page并处理文件和索引管理器的page请求的组件。由于内存空间有限&#xff0c;我们不能将所有page存储在缓存池中。因此&#xff0c;缓存管理器需要制定替换策略&#xff0c;当空间填满时选择哪…

rider使用libman

问题 rider没有libman的相关功能&#xff0c;需要使用cli 安装Libman dotnet tool install -g Microsoft.Web.LibraryManager.Cli # 如果存在可以尝试更新 dotnet tool update -g Microsoft.Web.LibraryManager.Cli查看命令 libman --help初始化 cdnjs官网 libman init安…

【十三】图解 Spring 核心数据结构:BeanDefinition 其二

图解 Spring 核心数据结构&#xff1a;BeanDefinition 其二 概述 前面写过一篇相关文章作为开篇介绍了一下BeanDefinition&#xff0c;本篇将深入细节来向读者展示BeanDefinition的设计&#xff0c;让我们一起来揭开日常开发中使用的bean的神秘面纱&#xff0c;深入细节透彻理解…

CTFShow的RE题(三)

数学不及格 strtol 函数 long strtol(char str, char **endptr, int base); 将字符串转换为长整型 就是解这个方程组了 主要就是 v4, v9的关系&#xff0c; 3v9-(v10v11v12)62d10d4673 v4 v12 v11 v10 0x13A31412F8C 得到 3*v9v419D024E75FF(1773860189695) 重点&…

刷代码随想录有感(127):动态规划——判断是否为子序列

题干&#xff1a; 代码&#xff1a; class Solution { public:bool isSubsequence(string s, string t) {vector<vector<int>>dp(s.size() 1, vector<int>(t.size() 1, 0));for(int i 1; i < s.size(); i){for(int j 1; j < t.size(); j){if(s[i …

方法引用详解

什么是方法引用&#xff1f;&#xff1a;针对于函数式接口中的抽象方法 为什么用方法引用&#xff1f;&#xff1a;避免代码的重复&#xff0c;简便书写&#xff0c;提高效率 在使用Lambda表达式的时候&#xff0c;我们实际上传递进去的代码就是一种解决方案&#xff1a;拿参数…

数据结构之“栈”(全方位认识)

&#x1f339;个人主页&#x1f339;&#xff1a;喜欢草莓熊的bear &#x1f339;专栏&#x1f339;&#xff1a;数据结构 前言 栈是一种数据结构&#xff0c;具有" 后进先出 "的特点 或者也可见说是 ” 先进后出 “。大家一起加油吧冲冲冲&#xff01;&#xff01; …

u盘存了东西却显示没有文件怎么办?原因分析与解决方案

在数字化时代&#xff0c;U盘已成为我们日常生活中不可或缺的存储设备。然而&#xff0c;有时我们可能会遇到一种令人困惑的情况&#xff1a;明明在U盘中存储了重要文件&#xff0c;但插上电脑后却显示没有文件。这种突如其来的“消失”不仅让人感到焦虑&#xff0c;更可能对我…

web前端开发——开发环境和基本知识

今天我来针对web前端开发讲解一些开发环境和基本知识 什么是前端 前端通常指的是网站或者Web应用中用户可以直接与之交互的部分&#xff0c;包括网站的结构、设计、内容和功能。它是软件开发中的一个专业术语&#xff0c;特别是指Web开发领域。前端开发涉及的主要技术包括HTML…

Windows ipconfig命令详解,Windows查看IP地址信息

「作者简介」&#xff1a;冬奥会网络安全中国代表队&#xff0c;CSDN Top100&#xff0c;就职奇安信多年&#xff0c;以实战工作为基础著作 《网络安全自学教程》&#xff0c;适合基础薄弱的同学系统化的学习网络安全&#xff0c;用最短的时间掌握最核心的技术。 ipconfig 1、基…