java容器詳細解析

java容器詳細解析

前言:在java開發中我們肯定會大量的使用集合,在這裡我將總結常見的集合類,每個集合類的優點和缺點,以便我們能更好的使用集合。下面我用一幅圖來表示

其中淡綠色的表示介面,紅色的表示我們經常使用的類。

1:基本概念

Java容器類類庫的用途是儲存物件,可以將其分為2個概念。

1.1:Collection

一個獨立元素的序列,這些元素都服從一條或多條規則。其中List必須按照插入的順序儲存元素、Set不能有重複的元素、Queue按照排隊規則來確定物件的產生順序(通常也是和插入順序相同)

1.2:Map

一組成對的值鍵對物件,允許用鍵來查詢值。ArrayList允許我們用數字來查詢值,它是將數字和物件聯絡在一起。而Map允許我們使用一個物件來查詢某個物件,它也被稱為關聯陣列。或者叫做字典。

2:List

List承諾可以將元素維護在特定的序列中。List介面在Collection的基礎上加入了大量的方法,使得可以在List中間可以插入和移除元素。下面主要介紹2種List

2.1:基本的ArrayList

它的優點在於隨機訪問元素快,但是在中間插入和移除比較慢

那麼現在我們就一起來看看為什麼ArrayList隨機訪問快,而插入移除比較慢。先說關於ArrayList的初始化。

ArrayList有三種方式進行初始化如下


private transient Object[] elementData;
public ArrayList() {
    this(10);
  }
 public ArrayList(int initialCapacity) {
    super();
    if (initialCapacity < 0)
      throw new IllegalArgumentException("Illegal Capacity: " 
initialCapacity);
    this.elementData = new Object[initialCapacity];
  }
 public ArrayList(Collection<? extends E> c) {
    elementData = c.toArray();
    size = elementData.length;
    // c.toArray might (incorrectly) not return Object[] (see 6260652)
    if (elementData.getClass() != Object[].class)
      elementData = Arrays.copyOf(elementData, size, Object[].class);
  }

我們可以看出ArrayList其實就是採用的是陣列(預設是長度為10的陣列)。所有ArrayList在讀取的時候是具有和陣列一樣的效率,它的時間複雜度為1。

插入尾部就是elementData[size ] = e;當然中間會進行擴容。現在主要說插入中間為什麼相對來說比較慢原始碼如下


public void add(int index, E element) {
    rangeCheckForAdd(index);//驗證(可以不考慮)
    ensureCapacityInternal(size   1); // Increments modCount!!(超過當前陣列長度進行擴容)
    System.arraycopy(elementData, index, elementData, index   1,
             size - index);(核心程式碼)
    elementData[index] = element;
    size  ;
  }

System.arraycopy(elementData, index, elementData, index 1)第一個引數是源陣列,源陣列起始位置,目標陣列,目標陣列起始位置,複製陣列元素數目。那麼這個意思就是從index索性處每個元素向後移動一位,最後把索引為index空出來,並將element賦值給它。這樣一來我們並不知道要插入哪個位置,所以會進行匹配那麼它的時間賦值度就為n。

2.2:LinkedList

它是通過代價較低在List中間進行插入和移除,提供了優化的順序訪問,但是在隨機訪問方面相對較慢。但是他的特性功能要比ArrayList強大的多。支援Queue和Stack

ListedList採用的是鏈式儲存。鏈式儲存就會定一個節點Node。包括三部分前驅節點、後繼節點以及data值。所以儲存儲存的時候他的實體地址不一定是連續的。

我們看下它的中間插入實現

從程式碼我們可以看出先獲取插入索引元素的前驅節點,然後把這個元素作為後繼節點,然後在建立新的節點,而新的節點前驅節點和獲取前驅節點相同,而後繼節點則等於要移動的這個元素。所以這裡是不需要迴圈的,從而在插入和刪除的時候效率比較高。

我們在來看看查詢(我們可以分析出它的效率要比ArrayList低了不少)

3:Set

Set也是一個集合,但是他的特點是不可以有重複的物件,所以Set最常用的就是測試歸屬性,很容易的詢問出某個物件是否存在Set中。並且Set是具有和Collection完全一樣的介面,沒有額外的功能,只是表現的行為不同。

3.1:HashSet

HashSet查詢速度比較快,但是儲存的元素是隨機的並沒有排序,下面我寫一段程式看一下


public static void main(String[] args){
    /**
     * 沒有順序可循,這是因為hashset採用的是雜湊(處於速度考慮)
     */
    Random random=new Random(47);
    Set<Integer> intset=new HashSet<Integer>();
    for (int i=0;i<10000;i  ){
      intset.add(random.nextInt(30));
    }
    System.out.print(intset);
  }

3.2:TreeSet

TreeSet是將元素儲存紅-黑樹結構中,所以儲存的結果是有順序的(所以如果你想要自己儲存的集合有順序那麼選擇TreeSet)


public static void main(String[] args){
    Random random=new Random(47);
    Set<Integer> intset=new TreeSet<Integer>();
    for (int i=0;i<10000;i  ){
      intset.add(random.nextInt(30));
    }
    System.out.print(intset);
  }

關於LinkedHashSet後面再說。

4:Queue

Queue是佇列,佇列是典型的先進先出的容器,就是從容器的一端放入元素,從另一端取出,並且元素放入容器的順序和取出的順序是相同的。LinkedList提供了對Queue的實現,LinkedList向上轉型為Queue。其中Queue有offer、peek、element、pool、remove等方法

offer是將元素插入隊尾,返回false表示新增失敗。peek和element都將在不移除的情況下返回對頭,但是peek在對頭為null的時候返回null,而element會丟擲NoSuchElementException異常。poll和remove方法將移除並返回對頭,但是poll在佇列為null,而remove會丟擲NoSuchElementException異常,以下是例子


public static void main(String[] args){
    Queue<Integer> queue=new LinkedList<Integer>();
    Random rand=new Random();
    for (int i=0;i<10;i  ){
      queue.offer(rand.nextInt(i 10));
    }
    printQ(queue);
    Queue<Character> qc=new LinkedList<Character>();
    for (char c:"HelloWorld".toCharArray()){
      qc.offer(c);
    }
    System.out.println(qc.peek());
    printQ(qc);
    List<String> mystrings=new LinkedList<String>();
    mystrings.add("1");
    mystrings.get(0);
    Set<String> a=new HashSet<String>();
    Set<String> set=new HashSet<String>();
    set.add("1");
  }
  public static void printQ(Queue queue){
    while (queue.peek

從上面的輸出的結果我們可以看出結果並不是一個順序的,沒有規則的,這個時候如果想讓佇列按照規則輸出那麼這個時候我們就要考慮優先順序了,這個時候我們就應該使用PriorityQueue,這個時候如果在呼叫offer方法插入一個物件的時候,這個物件就會按照優先順序在對列中進行排序,預設的情況是自然排序,當然我們可以通過Comparator來修改這個順序(在下一篇講解)。PriorityQueue可以確保當你呼叫peek、pool、remove方法時,獲取的元素將是對列中優先順序最高的元素。ok我們再次通過程式碼檢視


public static void main(String[] args) {
    PriorityQueue<Integer> priorityQueue = new PriorityQueue<Integer>();
    Random rand = new Random();
    for (int i = 0; i < 10; i  ) {
      priorityQueue.offer(rand.nextInt(i   10));
    }
    QueueDemo.printQ(priorityQueue);
    List<Integer>ints= Arrays.asList(25,22,20,18,14,9,3,1,1,2,3,9,14,18,21,23,25);
    priorityQueue=new PriorityQueue<Integer>(ints);
    QueueDemo.printQ(priorityQueue);
  }

從輸出可以看到,重複是允許的,最小值擁有最高優先順序(如果是String,空格也可以算作值,並且比字母具有更高的優先順序)如果你想消除重複,可以採用Set進行儲存,然後把Set作為priorityQueue物件的初始值即可。

5:Map

Map在實際開發中使用非常廣,特別是HashMap,想象一下我們要儲存一個物件中某些元素的值,如果我們在建立一個物件顯得有點麻煩,這個時候我們就可以用上map了,HashMap採用是雜湊函式所以查詢的效率是比較高的,如果我們需要一個有序的我們就可以考慮使用TreeMap。這裡主要介紹一下HashMap的方法,大家注意HashMap的鍵可以是null,而且鍵值不可以重複,如果重複了以後就會對第一個進行鍵值進行覆蓋。

put進行新增值鍵對,containsKey驗證主要是否存在、containsValue驗證值是否存在、keySet獲取所有的鍵集合、values獲取所有值集合、entrySet獲取鍵值對。


public static void main(String[] args){
    //Map<String,String> pets=new HashMap<String, String>();
    Map<String,String> pets=new TreeMap<String, String>();
    pets.put("1","張三");
    pets.put("2","李四");
    pets.put("3","王五");
    if (pets.containsKey("1")){
      System.out.println("已存在鍵1");
    }
    if (pets.containsValue("張三")){
      System.out.println("已存在值張三");
    }
    Set<String> sets=pets.keySet();
    Set<Map.Entry<String , String>> entrySet= pets.entrySet();
    Collection<String> values= pets.values();
    for (String value:values){
      System.out.println(value ";");
    }
    for (String key:sets){
      System.out.print(key ";");
    }
    for (Map.Entry entry:entrySet){
      System.out.println("鍵:" entry.getKey());
      System.out.println("值:" entry.getValue());
    }
  }

6:Iterator和Foreach

現在foreach語法主要作用於陣列,但是他也可以應用於所有的Collection物件。Collection之所以能夠使用foreach是由於繼承了Iterator這個介面。下面我寫段程式碼供大家檢視


public class IteratorClass {
  public Iterator<String> iterator(){
   return new Itr();
  }
  private class Itr implements Iterator<String>{
    protected String[] words=("Hello Java").split(" ");
    private int index=0;
    public boolean hasNext() {
      return index<words.length;
    }
    public String next() {
      return words[index  ];
    }
    public void remove() {
    }
  }
}
Iterator iterators=new IteratorClass().iterator();
    for (Iterator it=iterator;iterators.hasNext();) {
      System.out.println(iterators.next());
    }
    while (iterators.hasNext()){
      System.out.println(iterators.next());
    }

從中我們可以看出foreach迴圈最終是轉換成 for (Iterator it=iterator;iterators.hasNext();)只不過jdk幫我們隱藏我們無法檢視。下面我們在來分析一個問題,關於List刪除問題。我們大多肯定使用過for迴圈或者foreach迴圈去刪除,但是結果很明顯會出現錯誤,那麼現在我們一起分析為啥會出現錯誤。

1:使用for迴圈刪除(出現錯誤分析)

2:foreach迴圈刪除(錯誤分析)

從上面我們得知foreach最終是會轉成Iterator的所以它首先會通過next來獲取元素,我們看程式碼

請看for迴圈刪除那段程式碼,沒刪除一次modCount會 ,所以第二次在次刪除的時候modCount由於增加和expectedModCount不等所以無法獲取元素也就無法刪除。

3:正確的刪除方式

採用迭代器程式碼如下


 Iterator<String> iterator=userList.iterator();
    while (iterator.hasNext()){
      iterator.next();
      iterator.remove();
    }

請記住一定要加上iterator.next();這是因為在原始碼中有一個lastRed,通過它來記錄是否是最後一個元素,如果不加上iterator.next()那麼lastRed=-1,在刪除驗證的時候有這麼一段程式碼if (lastRet < 0)throw new IllegalStateException();所以就會丟擲異常。

7:Collections和Arrays

這裡只介紹2個常用的Collections.addAll和Arrays.asList

addAll:

asList採用的是陣列

可以看出最終轉換成ArrayList。

8:總結

1):陣列是將數字和物件聯絡起來,它儲存明確的物件,查詢物件時候不需要對查詢結果進行轉換,它可以是多維的,可以儲存基本型別的資料,但是陣列一旦生成,其容量不能改變。所以陣列是不可以直接刪除和新增元素。

2):Collection儲存單一的元素,而Map儲存相關聯的值鍵對,有了Java泛型,可以指定容器存放物件型別,不會將錯誤型別的物件放在容器中,取元素時候也不需要轉型。而且Collection和Map都可以自動調整其尺寸。容器不可以持有基本型別。

3):像陣列一樣,List也建立數字索性和物件的關聯,因此,陣列和List都是排好序的容器,List可以自動擴容

4):如果需要大量的隨機訪問就要使用ArrayList,如果要經常從中間插入和刪除就要使用LinkedList。

5):各種Queue和Stack由LinkedList支援

6):Map是一種將物件(而非數字)與物件相關聯的設計。HashMap用於快速訪問,TreeMap保持鍵始終處於排序狀態,所以不如HashMap快,而LinkedHashMap保持元素插入的順序,但是也通過雜湊提供了快速訪問的能力

7):Set不接受重複的元素,HashSet提供最快的訪問能力,TreeSet保持元素排序狀態,LinkedHashSet以插入順序儲存元素。