NO IMAGE

 

目錄

CUDA

  CUDA(Compute Unified Device Architecture),顯示卡廠商NVidia推出的運算平臺。
  隨著顯示卡的發展,GPU越來越強大,而且GPU為顯示影象做了優化。在計算上已經超越了通用的CPU。如此強大的晶片如果只是作為顯示卡就太浪費了,因此NVidia推出CUDA,讓顯示卡可以用於影象計算以外的目的。
  目前只有G80平臺的NVidia顯示卡才能使用CUDA,工具集的核心是一個C語言編譯器。G80中擁有128個單獨的ALU,因此非常適合平行計算,而且數值計算的速度遠遠優於CPU。
  CUDA的SDK中的編譯器和開發平臺支援Windows、Linux系統,可以與Visual Studio2005整合在一起。
  目前這項技術處在起步階段,僅支援32位系統,編譯器不支援雙精度資料等問題要在晚些時候解決。Geforce8CUDA(Compute Unified Device Architecture)是一個新的基礎架構,這個架構可以使用GPU來解決商業、工業以及科學方面的複雜計算問題。它是一個完整的GPGPU解決方案,提供了硬體的直接訪問介面,而不必像傳統方式一樣必須依賴圖形API介面來實現GPU的訪問。在架構上採用了一種全新的計算體系結構來使用GPU提供的硬體資源,從而給大規模的資料計算應用提供了一種比CPU更加強大的計算能力。CUDA採用C語言作為程式語言提供大量的高效能運算指令開發能力,使開發者能夠在GPU的強大計算能力的基礎上建立起一種效率更高的密集資料計算解決方案。
  從CUDA體系結構的組成來說,包含了三個部分:開發庫、執行期環境和驅動(表2)。
  開發庫是基於CUDA技術所提供的應用開發庫。目前CUDA的1.1版提供了兩個標準的數學運算庫——CUFFT(離散快速傅立葉變換)和CUBLAS(離散基本線性計算)的實現。這兩個數學運算庫所解決的是典型的大規模的平行計算問題,也是在密集資料計算中非常常見的計算型別。開發人員在開發庫的基礎上可以快速、方便的建立起自己的計算應用。此外,開發人員也可以在CUDA的技術基礎上實現出更多的開發庫。
  執行期環境提供了應用開發介面和執行期元件,包括基本資料型別的定義和各類計算、型別轉換、記憶體管理、裝置訪問和執行排程等函式。基於CUDA開發的程式程式碼在實際執行中分為兩種,一種是執行在CPU上的宿主程式碼(Host Code),一種是執行在GPU上的裝置程式碼(Device Code)。不同型別的程式碼由於其執行的物理位置不同,能夠訪問到的資源不同,因此對應的執行期元件也分為公共元件、宿主元件和裝置元件三個部分,基本上囊括了所有在GPGPU開發中所需要的功能和能夠使用到的資源介面,開發人員可以通過執行期環境的程式設計介面實現各種型別的計算。
  由於目前存在著多種GPU版本的NVidia顯示卡,不同版本的GPU之間都有不同的差異,因此驅動部分基本上可以理解為是CUDA-enable的GPU的裝置抽象層,提供硬體裝置的抽象訪問介面。CUDA提供執行期環境也是通過這一層來實現各種功能的。目前基於CUDA開發的應用必須有NVIDIA CUDA-enable的硬體支援,NVidia公司GPU運算事業部總經理Andy Keane在一次活動中表示:一個充滿生命力的技術平臺應該是開放的,CUDA未來也會向這個方向發展。由於CUDA的體系結構中有硬體抽象層的存在,因此今後也有可能發展成為一個通用的GPGPU標準介面,相容不同廠商的GPU產品
  CUDA™ 工具包是一種針對支援CUDA功能的GPU(圖形處理器)的C語言開發環境。CUDA開發環境包括:
  · nvcc C語言編譯器
  · 適用於GPU(圖形處理器)的CUDA FFT和BLAS庫
  · 分析器
  · 適用於GPU(圖形處理器)的gdb偵錯程式(在2008年3月推出alpha版)
  · CUDA執行時(CUDA runtime)驅動程式(目前在標準的NVIDIA GPU驅動中也提供)
  · CUDA程式設計手冊
  CUDA開發者軟體開發包(SDK)提供了一些範例(附有原始碼),以幫助使用者開始CUDA程式設計。這些範例包括:
  · 並行雙調排序
  · 矩陣乘法
  · 矩陣轉置
  · 利用計時器進行效能評價
  · 並行大陣列的字首和(掃描)
  · 影象卷積
  · 使用Haar小波的一維DWT
  · OpenGL和Direct3D圖形互操作示例
  · CUDA BLAS和FFT庫的使用示例
  · CPU-GPU C—和C —程式碼整合
  · 二項式期權定價模型
  · Black-Scholes期權定價模型
  · Monte-Carlo期權定價模型
  · 並行Mersenne Twister(隨機數生成)
  · 並行直方圖
  · 影象去噪
  · Sobel邊緣檢測濾波器
  · MathWorks MATLAB® 外掛 (點選這裡下載)
  新的基於1.1版CUDA的SDK 範例現在也已經發布了。要檢視完整的列表、下載程式碼,請點選此處。
  技術功能
  · 在GPU(圖形處理器)上提供標準C程式語言
  · 為在支援CUDA的NVIDIA GPU(圖形處理器)上進行平行計算而提供了統一的軟硬體解決方案
  · CUDA相容的GPU(圖形處理器)包括很多:從低功耗的筆記本上用的GPU到高效能的,多GPU的系統。
  · 支援CUDA的GPU(圖形處理器)支援並行資料快取和執行緒執行管理器
  · 標準FFT(快速傅立葉變換)和BLAS(基本線性代數子程式)數值程式庫
  · 針對計算的專用CUDA驅動
  · 經過優化的,從中央處理器(CPU)到支援CUDA的GPU(圖形處理器)的直接上傳、下載通道
  · CUDA驅動可與OpenGL和DirectX圖形驅動程式實現互操作
  · 支援Linux 32位/64位以及Windows XP 32位/64位 作業系統
  · 為了研究以及開發語言的目的,CUDA提供對驅動程式的直接訪問,以及組合語言級的訪問
  NVIDIA進軍高效能運算領域,推出了Tesla&CUDA高效能運算系列解決方案,CUDA技術,一種基於NVIDIA圖形處理器(GPU)上全新的平行計算體系架構,讓科學家、工程師和其他專業技術人員能夠解決以前無法解決的問題,作為一個專用高效能GPU計算解決方案,NVIDIA把超級計算能夠帶給任何工作站或伺服器,以及標準、基於CPU的伺服器叢集
  CUDA是用於GPU計算的開發環境,它是一個全新的軟硬體架構,可以將GPU視為一個並行資料計算的裝置,對所進行的計算進行分配和管理。在CUDA的架構中,這些計算不再像過去所謂的GPGPU架構那樣必須將計算對映到圖形API(OpenGL和Direct 3D)中,因此對於開發者來說,CUDA的開發門檻大大降低了。CUDA的GPU程式語言基於標準的C語言,因此任何有C語言基礎的使用者都很容易地開發CUDA的應用程式。
  由於GPU的特點是處理密集型資料和並行資料計算,因此CUDA非常適合需要大規模平行計算的領域。目前CUDA除了可以用C語言開發,也已經提供FORTRAN的應用介面,未來可以預計CUDA會支援C 、Java、Python等各類語言。可廣泛的應用在圖形動畫、科學計算、地質、生物、物理模擬等領域。
  2008年NVIDIA推出CUDA SDK2.0版本,大幅提升了CUDA的使用範圍。使得CUDA技術愈發成熟