內容簡介
《CUDA高性能並行計算》以清晰簡明的方式介紹瞭CUDAC編程的核心知識,始於運行CUDA樣例程序,快速引導讀者構建自己的代碼。自始至終,你可以通過親手創建、運行和修改書中的示例程序進行體驗式教學。書中配備的實踐項目用以加深和鞏固你的理解。
目錄
本書贊譽
緻謝
第0章 本書導讀1
0.1 什麼是CUDA1
0.2 學習CUDA的“須知”2
0.3 本書的讀者對象3
0.4 學習CUDA的必備3
0.5 本書的組織結構4
0.6 本書體例5
0.7 本書代碼6
0.8 用戶指南7
0.9 曆史沿革8
參考文獻9
第1章 起步10
1.1 運行CUDA樣例程序10
1.1.1 在Windows下運行CUDA樣例程序11
1.1.2 在Linux下運行CUDA樣例程序13
1.1.3 估計“加速效果”13
1.2 運行我們自己的串行程序14
1.2.1 dist_v1應用15
1.2.2 dist_v2應用16
1.3 本章小結18
1.4 推薦項目18
第2章 CUDA基礎知識19
2.1 CUDA並行模式 19
2.2 需要知道的CUDA API和C語言拓展21
2.3 本章小結23
2.4 推薦項目23
參考文獻24
第3章 從循環到網格25
3.1 並行化 dist_v125
3.2 並行化dist_v229
3.3 標準操作流程33
3.4 簡化操作流程33
3.4.1 統一內存和托管數組34
3.4.2 使用cudaMallocManaged()實現的距離應用34
3.5 本章小結36
3.6 推薦項目37
參考文獻38
第4章 二維網格與交互式圖形39
4.1 啓動二維計算網格40
4.1.1 二維內核啓動的語法41
4.1.2 定義二維內核41
4.1.3 dist_2d43
4.2 通過圖形交互實時顯示45
4.3 stability應用程序54
4.4 本章小結62
4.5 推薦項目62
參考文獻62
第5章 模闆與共享內存64
5.1 綫程間依賴64
5.2 一維網格上的導數計算66
5.2.1 實現dd_ld_global66
5.2.2 實現dd_ld_shared69
5.2.3 解決二維拉普拉斯方程:heat_2d72
5.2.4 圖像邊緣銳化:sharpen83
5.3 本章小結96
5.4 推薦項目97
參考文獻98
第6章 歸約與原子操作99
6.1 全局交互的綫程99
6.2 實現parallel_dot100
6.3 計算整體屬性:centroid_2d106
6.4 本章小結113
6.5 推薦項目113
參考文獻114
第7章 三維數據交互115
7.1 計算三維網格數據:dist_3d117
7.2 查看三維數據並與之交互:vis_3d119
7.2.1 切片法121
7.2.2 體繪製法124
7.2.3 光綫投射法124
7.2.4 創建vis_3d應用126
7.3 本章小結139
7.4 推薦項目139
參考文獻140
第8章 CUDA函數庫實踐141
8.1 自定義的與現有的141
8.2 Thrust庫143
8.2.1 使用inner_product()計算嚮量的模144
8.2.2 使用transform()計算距離147
8.2.3 使用generate()、transform()以及reduce()對的值進行估計151
8.3 cuRAND庫156
8.4 NPP庫158
8.4.1 sharpen_npp159
8.4.2 更多使用NPP進行的圖像處理操作163
8.5 綫性代數中的cuSOLVER和cuBLAS實踐166
8.6 cuDNN庫170
8.7 ArrayFire庫171
8.8 本章小結171
8.9 推薦項目171
參考文獻172
第9章 探索CUDA生態係統174
9.1 主要資源的權威列錶174
9.1.1 CUDA空間174
9.1.2 其他的主要網絡資源175
9.1.3 在綫課程176
9.1.4 CUDA書籍176
9.2 更多資源179
9.2.1 CUDA樣例179
9.2.2 CUDA語言和庫179
9.2.3 更多的CUDA書籍179
9.3 本章小結180
9.4 推薦項目180
附錄A 硬件設置182
附錄B 軟件設置189
附錄C C語言編程須知201
附錄D CUDA實踐技巧:計時、性能分析、錯誤處理與調試229
前言/序言
Praise 本書贊譽FORTRAN(盛行於20世紀60年代)是最早允許我們在大型機上編程的語言。之後是BASIC(流行於20世紀80年代)賦予我們為第一批微型計算機編寫程序的能力。現在輪到CUDA,讓我們可以為超級微型計算機編寫程序。 本書介紹的技術能夠幫助工程和數學等領域的研究者以超越微機100倍的速度執行計算任務。這使新的計算任務得以完成,也使本書得以成為顛覆傳統規則的教程。 —Richard H. Rand,康奈爾大學機械與航空航天工程係教授、數學係教授本書結構閤理,內容實用,能夠幫助讀者快速體驗CUDA並行編程並即時得到結果。本書圍繞不同科學和工程問題,展示瞭GPU編程的魅力。書中提供瞭優秀的示例程序和項目練習,讓人讀之愉悅。 —Mark Staveley博士,微軟Azure高性能計算高級項目經理本書名副其實,手把手教授讀者基本概念、核心策略、關鍵術語和典型示例。這些內容有機構成的教學體係以老道而深入的方式介紹高性能計算。本書同時適用於專傢和普通讀者。 —Joseph M. Iaquinto博士,VA Puget Sound公司研究專傢本書體現的實用性與我為工程師講授數值方法課程的教學方法具有驚人的一緻性。本書將為工程專業的學生以及程序員補充新的數值計算工具箱,使他們能夠基於CUDA進行高性能科學計算。對於有一定編程基礎的CUDA初學者,本書堪稱完美。建議讀者遵從作者的建議,盡早好好練習實踐項目。踐行本書的理論,你將可以熟練應對GPU計算方麵的項目,進入CUDA開發者行列。 —Lorena A. Barba,喬治華盛頓大學機械與航空航天工程係副教授緻 謝 Acknowledgements我們需要嚮很多人緻謝,沒有他們也就沒有這本書。 感謝我們的傢人,在寫作本書的過程中,我們對他們時有忽略。謝謝Laura Lewin和Pearson公司的所有人,他們為本書的編輯、齣版和營銷做瞭大量努力。多謝《CUDA專傢手冊:GPU編程權威指南》一書的作者Nicholas Wilt先生(曾任職於英偉達公司,現任職於亞馬遜公司),是他建議我們與Laura聯係,最終促成瞭本書的齣版。同樣需要感謝英偉達公司的Thomas Bradley、微軟公司的Mark Staveley和康奈爾大學的Richard Rand,作為技術評審專傢,他們提供瞭頗具建設性的評論、校正和見解。 謝謝華盛頓大學西雅圖校區機械工程係的同事們。他們與我們上聊科技大勢下聊底層技術細節,為本書貢獻瞭素材。這些同事包括卻不僅限於Mark Ganter、Di Zhang、Ben Weiss等人。他們幫本書繪製瞭多幅圖片並提供瞭多個好用的軟件幫我們製作標簽和自動排版代碼。我們也要感謝機械工程係係主任Per Reinhall,是他批準瞭我們的課程申請,正是這門課促使我們編寫瞭本書的很多內容。另外要感謝同校放射科的David Haynor和西雅圖VA醫院的William Ledoux,他們的研究項目持續圍繞著CUDA相關的技術探索。 特彆感謝英偉達公司的員工們。包括首席執行官黃仁勛,他一直堅信並熱情堅持基於GPU的並行計算;學術項目經理Chandra Cheij;高等教育與醫療行業主任Kimberly Powell;給我們幫助和啓迪的CUDA大師Jon Saposhnik和Bob Crovella。最後同樣的感謝送給戰略營銷主任Jay White,他長期支持西雅圖地區的GPU計算交流會並是我們聚會的召集人。 我們還要感謝所有的學生。他們敢於參加華盛頓大學早期的CUDA課程,頗有冒險精神。特彆是已畢業的碩士生Grant Marchelli(現在他已拿到瞭博士學位並受聘在Envitrum公司任職CTO),他參與瞭課程的很多關鍵環節,包括建立實驗環境、提供示例代碼並受邀講課。特彆感謝Gerald Barnett,當本書進入第一稿編輯環節時,他立即放下自己的事情,全情參與。 最後,真心感謝本書的讀者。分享對象的價值取決於有沒有閤適的人去共享。謝謝你們對本書感興趣。我們真誠地希望本書能為你們帶來有用的經驗和豐厚的迴報。
CUDA高性能並行計算 epub pdf mobi txt 電子書 下載 2025
CUDA高性能並行計算 下載 epub mobi pdf txt 電子書