数据结构与算法--静态链表

链表的实现依赖于指针(在Java中称作对象引用可能更准确),如果某编程语言没有指针呢?那就只好使用数组来实现咯。数组里的每一个元素都对应一个由datanext组成的对象。data存放该结点的数据,next存放下一个结点所在的数组下标,链表末尾是例外,其next为0,指示着这是链表的最后一个结点了。这和单链表中Node的定义差不多嘛。只不过变成了下面这样。

private class Node<E> {
    E data;
    int next;
}

那么这个数组则可以表示成Node<Item>[],其中Item是静态链表的泛型参数,如下。由于Node是内部类,为了不至于混淆,Node使用了E而不是Item。当然Node也可以指定成static

public class StaticLinkedList<Item> implements Iterable<Item> {}

像这种由数组描述的链表,叫做静态链表;由于数组初始化必须指定长度,所以和其他链表实现相比,静态链表的容量固定。除非使用类似resize的方法在需要的时候调整容量。

和之前单链表、双向链表的Node类不一样,这次Node也添加了泛型参数,直接使用StaticLinkedList<Item>的泛型参数不可以吗?我们来看

private class Node {
    Item data;
    int next;
}

private Node[] a = new Node[capacity]; // Error, Generic Array Creation

如果Node没有指定泛型参数,那么数组应该像最后一行那样创建,然而这会报错,原因是创建泛型数组,因为Node里的data是泛型变量。所以还是乖乖加上吧,那数组的创建应该变成下面代码最后一行那样。有警告,可不必理会。需要注意的是,注释里面的两种数组初始化方法是错误的。

private class Node<E> {
    E data;
    int next;
}

private Node<Item>[] a = (Node<Item>[]) new Node[capacity]; // Uncheked, from Node[] to Node<Item>[]

// private Node<Item>[] a = new Node<>[capacity];
// private Node<Item>[] a = new Node<Item>[capacity];

此时数组只是规定了大小,里面其实还没有内容。所以需要进行初始化,用new Node<>填充数组的每一个位置。data域初始化为null就行,next域的初始化就有讲究了。按照约定,数组的第一个位置a[0]和最后一个位置a[length - 1]不表示结点,不仅data为null,next表达的意义也比较特殊。如果将未使用的数组元素称为备用链表,那么a[0]的next始终指向备用链表第一个结点的下标——也就是第一个空闲元素的下标。a[length - 1]的next始终指向链表第一个结点的下标。由于刚开始还没有结点,链表为空。所以a[0].next自然是第一个空闲元素a[1]的下标1,a[length - 1].next则应该等于0,为什么是0下面会解释。

private Node<Item>[] a;
// 初始化数组
public StaticLinkedList(int capacity) {
    a = (Node<Item>[]) new Node[capacity];
    for (int i = 0; i < capacity - 1; i++) {
        a[i] = new Node<>();
        a[i].next = i + 1;
    }
    a[capacity - 1] = new Node<>();
    a[capacity - 1].next = 0;
}

还是先给出全部代码,再一一解释吧。

package Chap3;


import java.util.Iterator;

/**
 * 可以使用数组代替指针(一般不这样做)。数组的每个元素包含两个值,一个是data,另外一个是下一元素的下标值
 * 由于是数组实现,故长度固定
 */

public class StaticLinkedList<Item> implements Iterable<Item> {

    private class Node<E> {
        E data;
        int next;
    }

    private int N;
    private Node<Item>[] a;

    public boolean isEmpty() {
        return N == 0;

    }

    public int size() {
        return N;
    }

    // 初始化数组
    public StaticLinkedList(int capacity) {
        a = (Node<Item>[]) new Node[capacity];
        for (int i = 0; i < capacity - 1; i++) {
            a[i] = new Node<>();
            a[i].next = i + 1;
        }
        a[capacity - 1] = new Node<>();
        a[capacity - 1].next = 0;
    }

    public StaticLinkedList(Item... items) {
        this(512);
        for (Item item : items) {
            add(item);
        }
    }

    private int getSpace() {
        // a[0]的next所指就是第一个空闲元素的下标
        int i = a[0].next;
        a[0].next = a[i].next;
        return i;
    }

    private void checkRange(int index) {
        if (index < 0 || index >= N) {
            throw new IndexOutOfBoundsException(index + "");
        }
    }

    private void checkRangeForInsert(int index) {
        if (index < 0 || index > N) {
            throw new IndexOutOfBoundsException(index + "");
        }
    }

    private Node<Item> index(int index) {
        // 最后一个元素的next就是第一个结点所在的下标
        int k = a.length - 1;
        for (int i = 0; i <= index; i++) {
            k = a[k].next;
        }
        return a[k];
    }

    public void insert(int index, Item item) {
        checkRangeForInsert(index);
        // 即使index为0,也能正确处理
        Node<Item> e = index(index - 1);
        int i = getSpace();
        a[i].data = item;
        // 表示新结点的下一个结点为插入处
        a[i].next = e.next;
        // 表示插入处前一结点的下一个结点变成了新插入的结点
        e.next = i;
        N++;
    }

    public Item get(int index) {
        checkRange(index);
        Node<Item> e = index(index);
        return e.data;
    }

    public void set(int index, Item item) {
        checkRange(index);
        Node<Item> e = index(index);
        e.data = item;
    }


    public Item remove(int index) {
        checkRange(index);
        // 移除和插入一样需要定位到前一元素
        Node<Item> e = index(index - 1);
        int j = e.next;
        Item item = a[e.next].data;
        // 帮助垃圾回收
        a[e.next].data = null;
        // p.next = p.next.next
        e.next = a[e.next].next;
        // 这里不要填入e.next,因为在上句已经被改变
        freeSpace(j);
        N--;
        return item;
    }

    // 让被移除的位置成为下一个插入的位置
    private void freeSpace(int index) {
        // 表示index之后才轮到原备用表第一个元素
        a[index].next = a[0].next;
        // 再将备用表第一个元素换成被删除的位置。优先填入这个后,再填入上步中原来的备用表第一位置
        a[0].next = index;
    }

    // 链表的末尾插入
    public void add(Item item) {
        int index = a.length - 1;
        // 到0表示链表的末尾
        while (a[index].next != 0) {
            index = a[index].next;
        }

        int i = getSpace();
        a[i].data = item;
        // 找出最后一个元素, 将最后一个结点的下标给
        a[index].next = i;
        // 末尾元素的next为0
        a[i].next = 0;
        N++;
    }

    // 链表的开头插入
    public void push(Item item) {
        int i = getSpace();
        a[i].data = item;
        a[i].next = a[a.length - 1].next;
        a[a.length - 1].next = i;
        N++;
    }

    // 弹出表头
    public Item pop() {
        int index = a[a.length - 1].next;
        Item item = a[index].data;
        a[a.length - 1].next = a[index].next;
        // 帮助垃圾回收
        a[index].data = null;
        freeSpace(index);
        N--;
        return item;
    }

    public void clear() {
        for (int i = 0; i < a.length - 1; i++) {
            a[i].next = i + 1;
            a[i].data = null;
        }
        a[a.length - 1].next = 0;
        a[a.length - 1].data = null;
        N = 0;
    }

    public int indexOf(Item item) {
        int index = 0;
        if (item != null) {
            for (int i = a[a.length - 1].next; i != 0; i = a[i].next) {
                if (a[i].data.equals(item)) {
                    return index;
                }
                index++;
            }
        } else {
            for (int i = a[a.length - 1].next; i != 0; i = a[i].next) {
                if (a[i].data == null) {
                    return index;
                }
                index++;
            }

        }
        return -1;
    }

    public boolean contains(Item item) {
        return indexOf(item) >= 0;
    }

    @Override
    public Iterator<Item> iterator() {
        return new Iterator<Item>() {
            int index = a[a.length - 1].next;

            @Override
            public boolean hasNext() {
                return index != 0;
            }

            @Override
            public Item next() {
                Item item = a[index].data;
                index = a[index].next;
                return item;
            }
        };
    }


    @Override
    public String toString() {
        Iterator<Item> it = iterator();

        if (!it.hasNext()) {
            return "[]";
        }

        StringBuilder sb = new StringBuilder();
        sb.append("[");
        while (true) {
            Item item = it.next();
            sb.append(item);
            if (!it.hasNext()) {
                return sb.append("]").toString();
            }

            sb.append(", ");
        }
    }

    public static void main(String[] args) {
        StaticLinkedList<String> a = new StaticLinkedList<>(1000);

        a.push("123");
        a.push("456");
        a.push("789");
        a.clear();

        a.push("456");
        a.push("123");
        a.add("789");
        a.add("10");
        a.remove(1); // 456
        a.pop(); // 123
        System.out.println(a.get(1)); // 10
        a.set(1, "1011");
        a.insert(0, "234");
        a.insert(2, "456");
        System.out.println(a.contains("789")); // true
        System.out.println(a.size()); // 4
        for (String each : a) {
            System.out.println(each);
        }
        System.out.println(a.indexOf("1011")); // 3
        StaticLinkedList<Integer> b = new StaticLinkedList<>(1, 2, 32, 434);
        System.out.println(b);
    }
}

首先是范围检查,访问链表时候当然是限定在[0, N - 1]。如checkRange方法那样。不过插入操作时,略有不同。我们允许在链表的末尾插入结点,即允许在a[N]处插入。所以在checkRangeForInsertindex == N并不会抛出异常。

再就是定位方法了,Node<Item> index(int index)方法返回index处的Node对象。它甚至能正确处理index(index - 1)时,index 为0的情况,此时index(-1)返回的是数组最后一个元素,我们知道该元素的next才指向第一个结点。

getset方法主要就是用了index方法实现,比较简单就不讲了。

当添加结点的时候,放进数组的哪个位置呢,自然是备用链表的第一个元素了。同时备用链表的第二个元素变成了第一个元素。用代码表示如下

private int getSpace() {
    // a[0]的next所指就是第一个空闲元素的下标
    int i = a[0].next;
    a[0].next = a[i].next;
    return i;
}

相应的,当有结点被移除,被移除处成为优先插入位置,即如有新结点要插入,先插入到刚刚被移除结点的位置,接着再插入到原备用链表的第一个元素处。

// 让被移除的位置成为下一个插入的位置
private void freeSpace(int index) {
    // index的下一个才是原备用链表第一个空闲元素
    a[index].next = a[0].next;
    // 备用链表变成:第一个空闲元素为index处
    a[0].next = index;
}

来看push方法,先获得备用链表的第一个空闲位置。因为是在表头插入,所以新结点的next指向原链表的第一个结点(即数组最后一个元素的next处所在结点),接着数组最后一个元素的next应该变成新结点的下标。如果第一次添加结点到链表中,那么这个元素也是链表的尾结点。由于刚初始化后数组a的最后一个元素的next为0,根据push的实现,新结点的next为0。这和我们定义的链表尾结点的next约定为0符合,所以现在知道为什么初始化的时候要令a[capacity - 1].next = 0了吧。同时数组最后一个元素的next指向新插入结点的下标。

对于add方法也一样适用,第一次添加结点的时候,while循环不会执行,最后一个元素的next指向刚添加结点的下标,手动将第一个结点的next置为0;对于之后的add操作,则是通过while循环找到链表的尾结点,该结点的next指向新结点的下标,表示刚添加的结点成为了新的尾结点。再手动将尾结点的next置为0。

然后是pop方法,用index变量保存了第一个结点的索引,一会儿要调用freeSpace来更新备用链表。然后数组最后一个元素的next指向原链表的第二个结点,这样它也就成了链表的第一个结点。

insert方法,可以在链表尾结点之后的a[N]处插入。先定位到插入处的前一个结点index - 1处,因为新插入的结点实际上会位于index -1index之间。让新结点的next指向index处的结点,再让index - 1处的结点的next指向新结点。同样这两句的顺序不能反。因为如果先执行第二句,e.next的值就已经改变了,造成逻辑混乱,插入失败。

a[i].next = e.next;
e.next = i;

remove方法,同样需要定位到插入处的前一个结点index - 1处。只需让index - 1处的结点的next直接连上index的下一个结点就行了(跳过了index处的结点)。因为有结点被移除,所以调用freeSpace更新备用链表。

clear方法就是把数组中每个Node对象的data置为null,然后重新初始化next的值至空链表时的样子。

注意indexOfiterator方法,它们遍历整个链表的方式其实是一样的。从第一个结点即a[a.length - 1].next处开始,只要当前结点的下标不为0,就说明还没有遍历到链表末尾,继续循环。试想在尾结点处,index还不为0,访问到这个结点后,下一次index = a[index].next = 0,条件不满足,所以循环终止,刚好把整个链表遍历了一遍。

虽然静态链表是数组实现的,但是本质上它还是链表。什么意思?我们确实是划分了一段连续的内存空间没错,但并不是按照数组下标顺序存储的。举个例子,a[5]可能存的是链表的第一个结点,a[2]存的链表第二个结点,a[4]可能存的又是链表的最后一个结点...很多种情况。其实这些结点的位置还是分散的,不论位于数组中哪个位置都可以,只要能确定它下一个结点位于数组的哪个位置,最终还是能写出链表的正确顺序(虽然在数组中看是跳跃的)。所以setget方法时间复杂度还是和单链表一样是O(n),

可以看出用数组实现链表挺麻烦的,如果可以使用指针或对象引用的方式,就最好不要数组来实现了...


by @sunhaiyu

2017.8.8

内容来源于网络如有侵权请私信删除
你还没有登录,请先登录注册
  • 还没有人评论,欢迎说说您的想法!