compression

壓縮在Hadoop中的應用

概述 壓縮:壓縮是一種通過特定的演算法來減小計算機檔案大小的機制,簡單來說就是使用相關壓縮技術將檔案內容減少的過程 優點: 1.節省儲存空間 2.減少網路頻寬IO 3.減少磁碟IO 缺點: 1.壓縮解壓會有CPU開銷 2.消耗時間 分類: 1.Lossless 無失真壓縮,應用在一些日誌檔案等 2. […]