자바 컬렉션 프레임워크 List

공부/Java

자바 컬렉션 프레임워크 List

Stair 2024. 9. 27. 17:09

자바의 다형성과 OCP 원칙을 가장 잘 활용할 수 있는 곳 중 하나가 바로 자료 구조이다.

자료 구조에 다형성과 OCP 원칙이 어떻게 적용되는지 알아보자.

List자료 구조

순서가 있고, 중복을 허용하는 자료 구조를 리스트(List)라고 한다.

우리가 지금까지 만든 MyArrayList와 MyLinkedList는 내부 구현만 다를 뿐 같은 기능을 제공하는 리스트이다. 물론 내부 구현이 다르기 때문에 상황에 따라 성능은 달라질 수 있다. 핵심은 사용자 입장에서 보면 같은 기능을 제공한다는 것이다.

이 둘의 공통 기능을 인터페이스로 뽑아서 추상화하면 다형성을 활용한 다양한 이득을 얻을 수 있다.

같은 기능을 제공하는 메서드를 MyList 인터페이스로 뽑아보자.

public interface MyList<E> {
    int size();

    void add(E e);

    void add(int index, E e);

    E get(int index);

    E set(int index, E element);

    E remove(int index);

    int indexOf(E o);
}

public class MyArrayList<E> implements MyList<E> {

    private static final int DEFAULT_CAPACITY = 5;

    private Object[] elementData;
    private int size = 0;

    public MyArrayList(){
        elementData = new Object[DEFAULT_CAPACITY];
    }

    public MyArrayList(int initialCapacity){
        elementData = new Object[initialCapacity];
    }

    @Override
    public int size(){
        return size;
    }

    @Override
    public void add(E e){
        //코드 추가
        if(size == elementData.length){
            grow();
        }

        elementData[size] = e;
        size++;
    }
    @Override
    public void add(int index, E e){
        //코드 추가
        if(size == elementData.length){
            grow();
        }
        //데이터 이동
        shiftRightFrom(index);
        elementData[index] = e;
        size++;
    }

    private void shiftRightFrom(int index) {
        for(int i = size; i>index; i--){
            elementData[i] = elementData[i-1];
        }
    }

    private void grow() {
        int oldCapacity = elementData.length;
        int newCapacity = oldCapacity *2;

        elementData = Arrays.copyOf(elementData, newCapacity);
    }

    @SuppressWarnings("unchecked")
    @Override
        public E get(int index){
        return (E) elementData[index];
    }

    @Override
    public E set(int index, E element){
        E oldValue = get(index);
        elementData[index] = element;
        return oldValue;
    }

    //코드 추가
    @Override
    public E remove(int index){
        E oldValue = get(index);
        //데이터 이동
        shiftLeftFrom(index);
        size--;
        elementData[size] = null;
        return oldValue;
    }

    private void shiftLeftFrom(int index) {
        for(int i = index; i < size -1; i++){
            elementData[i] = elementData[i+1];
        }
    }

    @Override
    public int indexOf(E o){
        for(int i = 0; i < size; i++){
            if(o.equals(elementData[i])){
                return i;
            }
        }
        return -1;
    }

    public String toString(){
        return Arrays.toString(Arrays.copyOf(elementData,size)) +
                " size=" + size + ", capacity=" + elementData.length;
    }


}

public class MyLinkedList<E> implements  MyList<E>{
    private Node<E> first;
    private int size = 0;

    @Override
    public void add(E o ){
        Node<E> newNode = new Node<>(o);
        if(first == null){
            first = newNode;
        }else {
            Node<E> lastNode = getLastNode();
            lastNode.next = newNode;
        }
        size++;
    }

    private Node<E> getLastNode() {
        Node<E> x = first;
        while (x.next != null){
            x = x.next;
        }
        return x;
    }

    //추가 코드
    @Override
    public void add(int index, E e){
        Node<E> newNode = new Node<>(e);
        if (index == 0){
            newNode.next = first;
            first = newNode;
        } else{
            Node<E> prev = getNode(index - 1);
            newNode.next = prev.next;
            prev.next = newNode;
        }
        size++;
    }

    @Override
    public E set(int index, E elemenet){
        Node<E> x = getNode(index);
        E oldValue = x.item;
        x.item = elemenet;
        return oldValue;
    }

    //추가 코드
    @Override
    public E remove(int index){
        Node<E> removeNode = getNode(index);
        E removedItem = removeNode.item;
        if(index == 0){
            first = removeNode.next;
        }else {
            Node<E> prev = getNode(index - 1);
            prev.next = removeNode.next;
        }
        removeNode.item = null;
        removeNode.next = null;
        size--;
        return removedItem;
    }

    @Override
    public E get(int index){
        return (E) getNode(index).item;
    }

    private Node<E> getNode(int index) {
        Node<E> x = first;
        for(int i = 0; i < index; i++){
            x = x.next;
        }
        return x;
    }

    @Override
    public int indexOf(E o){
        int index = 0;
        for(Node<E> x = first; x != null; x=x.next){
            if(o.equals(x.item)){
                return index;
            }
            index++;
        }
        return -1;
    }

    @Override
    public int size(){
        return size;
    }

    @Override
    public String toString() {
        return "MyLinkedListV1{" +
                "first=" + first +
                ", size=" + size +
                '}';
    }

    private static class Node<E>{

        E item;
        Node<E> next;

        public Node(E item){
            this.item = item;
        }

        @Override
        public String toString() {
            StringBuilder sb = new StringBuilder();
            Node<E> x = this;
            sb.append("[");
            while (x != null){
                sb.append(x.item);
                if(x.next != null){
                    sb.append("->");
                }
                x = x.next;

            }
            sb.append("]");
            return sb.toString();
        }
    }
}

리스트 추상화2 - 의존관계 주입

MyArrayList를 활용해서 많은 데이터를 처리하는 BatchProcessor 클래스를 개발하고 있다고 가정하자. 그런데 막상 프로그램을 개발하고 보니 데이터 앞에서 추가하는 일이 많은 상황이라고 가정해보자. 데이터를 앞에서 추가하거나 삭제하는 일이 많다면, MyArrayList보다는 MyLinkedList를 사용하는 것이 훨씬 효율적이다.

데이터를 앞에서 추가하거나 삭제할 때 빅오 비교

MyArrayList : O(n)

MyLinkedList : O(1)

MyArrayList를 사용해보니 성능이 너무 느려서 MyLinkedList를 사용하도록 코드를 변경해야 한다면 BatchProcessor의 내부 코드도 MyArrayList에서 MyLinkedList를 사용하도록 함께 변경해야 한다.

BatchProcessor는 구체적인 MyArrayList 또는 MyLinkedList를 사용하고 있다. 이것을 BatchProcessor가 구체적인 클래스에 의존한다고 표현한다. 이렇게 구체적인 클래스에 직접 의존하면 MyArrayList를 MyLinkedList로 변경할 때 마다 여기에 의존하는 BatchProcessor도 함께 변경해야한다.

코드를 다음과 같이 변경하면 이 문제를 해결할 수 있다.

BatchProcessor가 구체적인 클래스에 의존하는 대신 추상적인 MyList 인터페이스에 의존하는 방법도 있다.

추상적인 MyList에 의존하는 BatchProcessor

public class BatchProcessor {
    private final MyList<Integer> list;

    public BatchProcessor(MyList<Integer> list) {
        this.list = list;
    }

    public void logic(int size){
        for (int i = 0; i < size; i++){
            list.add(0,i);
        }
    }
}

생성자를 통해 밖에서 나중에 결정하여 넘기면 된다.

main(){

new BatchProcessor(new MyArrayList()); //MyArrayList를 사용하고 싶을 때

new BatchProcessor(new MyLinkedList()); //MyLinkedList를 사용하고 싶을 때

}

이것을 의존관계 주입이라고 한다.

그리고 BatchProcessor를 생성하는 시점에 생성자를 통해 원하는 리스트 전략(알고리즘)을 선택해서 전달하면 된다.

이렇게 하면 MyList를 사용하는 클라이언트 코드인 BatchProcessor를 전혀 변경하지 않고, 원하는 리스트 전략을 런타임에 지정할 수 있다.

정리하면 다형성과 추상화를 활용하면 BatchProcessor를 전혀 변경하지 않고 리스트 전략(알고리즘)을 MyArrayList에서 MyLinkedList로 변경할 수 있다.

public class BatchProcessor {
    private final MyList<Integer> list;

    public BatchProcessor(MyList<Integer> list) {
        this.list = list;
    }

    public void logic(int size){
        long startTime = System.currentTimeMillis();
        for (int i = 0; i < size; i++){
            list.add(0,i);
        }
        long endTime = System.currentTimeMillis();
        System.out.println("크기: " + size +",계산 시간: " + (endTime-startTime) + "ms");
        
    }
}

logic 메서드는 매우 복잡한 비즈니스 로직을 다룬다고 가정하자.

어떤 MyList list의 구현체를 선택할 지는 실행 시점에 생성자를 통해 결정한다.

MyArrayList의 인스턴스가 들어올수도, MyLinkedList의 인스턴스가 들어올 수도 있다.

이것은 BatchProcessor의 외부에서 의존관계가 결정되어서 BatchProcessor 인스턴스에 들어오는 것 같다. 마치 의존 관계가 외부에서 주입되는 것 같다고 해서 이것을 의존관계 주입이라 한다.

-참고로 생성자를 통해 의존관계를 주입했기 때문에 생성자 의존관계 주입이라 한다.

※Dependency Injection, 줄여서 DI라고 부른다. 의존성 주입이라고도 부른다.

다음 코드를 통해 결과를 확인해보자.

public class BatchProcessorMain {

    public static void main(String[] args) {
//        MyArrayList<Integer> list = new MyArrayList<>();
        MyLinkedList<Integer> list = new MyLinkedList<>();
        BatchProcessor processor = new BatchProcessor(list);
        processor.logic(100_000);
    }
}

BatchProcessor의 생성자에 MyArrayList를 사용할지, MyLinkedList를 사용할지 결정해서 넘겨야 한다.

이후 processor.logic()을 호출하면 생성자로 넘긴 자료 구조를 사용해서 실행한다.

MyArrayList를 대신하여 MyLinkedList를 사용한 덕에 O(n) -> O(1)로 개선된 것을 확인할 수 있다.

리스트 추상화3 - 컴파일 타임, 런타임 의존관계

의존관계는 크게 컴파일 타임 의존관계와 런타임 의존관계로 나눌 수 있다.

-컴파일 타임(compile time): 코드 컴파일 시점을 뜻한다.

-런타임(runtime): 프로그램 실행 시점을 뜻한다.

컴파일 타임 의존관계 vs 런타임 의존관계

-컴파일 타임 의존관계는 자바 컴파일러가 보는 의존관계이다. 클래스에 모든 의존관계가 다 나타난다.

-쉽게 이야기해서 클래스에 바로 보이는 의존관계이다. 그리고 실행하지 않은 소스 코드에 정적으로 나타나는 의존관계이다.

-BatchProcessor클래스를 보면 MyList인터페이스만 사용한다. 코드 어디에도 MyArrayList나 MyLinkedList같은 정보는 보이지 않는다. 따라서 BatchProcessor는 MyList인터페이스에만 의존한다.

-런타임 의존관계는 실제 프로그램이 작동할 때 보이는 의존관계이다. 주로 생성된 인스턴스와 그것을 참조하는 의존관계이다.

-쉽게 이야기해서 프로그램이 실행될 때 인스턴스 간에 의존관계로 보면 된다.

-런타임 의존관계는 프로그램 실행 중에 계속 변할 수 있다.

다음과 같이 코드를 작성하고 실행한다고 가정하자.

MyArrayList<Integer> list = new MyArrayList<>();

BatchProcessor processor = new BatchProcessor(list);

processor.logic(50_000);

BatchProcessor인스턴스의 MyList list는 생성자를 통해 MyArrayList(x001) 인스턴스를 참조한다.

따라서 이후 logic()을 호출하면 MyArrayList 인스턴스를 사용하게 된다.

정리

1. MyList 인터페이스 도입으로 같은 리스트 자료구조를 그댜ㅐ로 사용하면서 원하는 구현을 변경할 수 있게 되었다.

2. BatchProcessor에서 다음과 같이 처음부터 MyArrayList를 사용하도록 컴파일 타임 의존관계를 지정했다면 이후 MyLinkedList로 수정하기 위해서는 BatchProcessor의 코드를 변경해야 한다.

3. BatchProcessor 클래스는 구체적인 MyArrayList나 MyLinkedList에 의존하는 것이 아니라 추상적인 MyList에 의존한다. 따라서 런타임에 MyList의 구현체를 얼마든지 선택할 수 있다.

4. BatchProcessor에서 사용하는 리스트의 의존 관계를 클래스에서 미리 결정하는 것이 아니라, 런타임에 객체를 생성하는 시점으로 미룬다. 따라서 런타임에 MyList의 구현체를 변경해도 BatchProcessor의 코드는 전혀 변경하지 않아도 된다.

5. 이렇게 생성자를 통해 런타임 의존관계를 주입하는 것을 생성자 의존관계 주입, 생성자 주입이라 한다.

6. OCP원칙을 잘 지켜 클라이언트(BatchProcessor)의 코드 변경 없이 구련하였다.

7. 클라이언트 클래스는 컴파일 타임에 추상적인 것에 의존하고, 런타입에 의존 관계 주입을 통해 구현체를 주입받아 사용함으로써, 이런 이점을 얻을 수 있다.

전략 패턴(Strategy Pattern) : 알고리즘을 클라이언트의 코드 변경 없이 쉽게 교체할 수 있다. 방금 설명한 코드가 전략 패턴을 사용한 코드이다. MyList 인터페이스가 바로 전략을 정의하는 인터페이스가 되고, 각각 구현체들인 MyArrayList, MyLinkedList가 전략의 구체적인 구현이 된다. 그리고 전략을 클라이언트 코드( BatchProcessor)의 변경 없이 손쉽게 교체할 수 있다.

public class MyListPerformanceTest {

    public static void main(String[] args) {
        int size = 50_000;
        System.out.println("==MyArrayList 추가==");
        addFirst(new MyArrayList<>(), size);
        addMid(new MyArrayList<>(), size);
        MyArrayList<Integer> arrayList = new MyArrayList<>();
        addLast(arrayList,size);

        int loop = 10000;
        System.out.println("==MyArrayList 조회 ==");
        getIndex(arrayList,loop,0);
        getIndex(arrayList,loop,size/2);
        getIndex(arrayList,loop,size-1);

        System.out.println("==MyArrayList 검색 ==");
        search(arrayList,loop,0);
        search(arrayList,loop,size/2);
        search(arrayList,loop,size-1);


        System.out.println("==MyLinkedList 추가==");
        addFirst(new MyLinkedList<>(), size);
        addMid(new MyLinkedList<>(), size);
        MyLinkedList<Integer> linkedList = new MyLinkedList<>();
        addLast(linkedList,size);

        System.out.println("==MyLinkedList 조회 ==");
        getIndex(linkedList,loop,0);
        getIndex(linkedList,loop,size/2);
        getIndex(linkedList,loop,size-1);

        System.out.println("==MyLinkedList 검색 ==");
        search(linkedList,loop,0);
        search(linkedList,loop,size/2);
        search(linkedList,loop,size-1);

    }

    private static void addFirst(MyList<Integer> list, int size){
        long startTime = System.currentTimeMillis();
        for (int i = 0; i < size; i++) {
            list.add(0, i);

        }
        long endTime = System.currentTimeMillis();
        System.out.println("앞에 추가 - 크기: " + size + ", 계산 시간: " + (endTime - startTime) + "ms");
    }

    private static void addMid(MyList<Integer> list, int size){
        long startTime = System.currentTimeMillis();
        for (int i = 0; i < size; i++) {
            list.add(i/2, i);

        }
        long endTime = System.currentTimeMillis();
        System.out.println("평균 추가 - 크기: " + size + ", 계산 시간: " + (endTime - startTime) + "ms");
    }

    private static void addLast(MyList<Integer> list, int size){
        long startTime = System.currentTimeMillis();
        for (int i = 0; i < size; i++) {
            list.add(i);

        }
        long endTime = System.currentTimeMillis();
        System.out.println("뒤에 추가 - 크기: " + size + ", 계산 시간: " + (endTime - startTime) + "ms");
    }

    private static void getIndex(MyList<Integer> list, int loop, int index) {
        long startTime = System.currentTimeMillis();
        for (int i = 0; i < loop; i++) {
            list.get(index);
        }
        long endTime = System.currentTimeMillis();
        System.out.println("index: " + index + ", 반복: " + loop + ", 계산 시간: " +(endTime - startTime) + "ms");
    }

    private static void search(MyList<Integer> list, int loop, int findValue) {
        long startTime = System.currentTimeMillis();
        for (int i = 0; i < loop; i++) {
            list.indexOf(findValue);
        }
        long endTime = System.currentTimeMillis();
        System.out.println("findValue: " + findValue + ", 반복: " + loop + ", 계산 시간: " +(endTime - startTime) + "ms");
    }
}

==MyArrayList 추가==
앞에 추가 - 크기: 50000, 계산 시간: 2932ms
평균 추가 - 크기: 50000, 계산 시간: 1435ms
뒤에 추가 - 크기: 50000, 계산 시간: 4ms
==MyArrayList 조회 ==
index: 0, 반복: 10000, 계산 시간: 1ms
index: 25000, 반복: 10000, 계산 시간: 0ms
index: 49999, 반복: 10000, 계산 시간: 0ms
==MyArrayList 검색 ==
findValue: 0, 반복: 10000, 계산 시간: 1ms
findValue: 25000, 반복: 10000, 계산 시간: 214ms
findValue: 49999, 반복: 10000, 계산 시간: 499ms
==MyLinkedList 추가==
앞에 추가 - 크기: 50000, 계산 시간: 7ms
평균 추가 - 크기: 50000, 계산 시간: 1746ms
뒤에 추가 - 크기: 50000, 계산 시간: 3296ms
==MyLinkedList 조회 ==
index: 0, 반복: 10000, 계산 시간: 1ms
index: 25000, 반복: 10000, 계산 시간: 592ms
index: 49999, 반복: 10000, 계산 시간: 1213ms
==MyLinkedList 검색 ==
findValue: 0, 반복: 10000, 계산 시간: 1ms
findValue: 25000, 반복: 10000, 계산 시간: 779ms
findValue: 49999, 반복: 10000, 계산 시간: 1546ms

(시스템 환경마다 실행 결과는 다를 수 있다.)

추가, 삭제

- 배열리스트는 인덱스를 통해 추가나 삭제할 위치를 O(1)로 빠르게 찾지만, 추가나 삭제 이후 데이터를 한칸씩 밀어야한다. 이 부분이 O(n)으로 오래 걸린다.

연결 리스트는 인덱스를 통해 추가나 삭제할 위치를 O(n)으로 느리게 찾지만 실제 데이터으 ㅣ추가는 간단한 참조 변경으로 빠르게 O(1)로 수행된다.

앞에 추가(삭제)

배열 리스트: 추가나 삭제할 위치를 찾는데는 O(1) , 데이터를 한칸씩 이동 O(n) -> O(n)

연결 리스트: 추가나 삭제할 위치는 찾는데 O(1), 노드 변경하는데 O(1) -> O(1)

평균 추가(삭제)

배열 리스트: 추가나 삭제할 위치를 찾는데는 O(1) , 인덱스 이후의 데이터를 한칸씩 이동 O(n) -> O(n)

연결 리스트: 추가나 삭제할 위치는 찾는데 O(1/2), 노드 변경하는데 O(1) -> O(n)

뒤에추가(삭제)

배열 리스트: 추가나 삭제할 위치를 찾는데 O(1) , 이동할 데이터 없음 -> O(1)

연결 리스트: 추가나 삭제할 위치는 찾는데 O(n), 노드 변경하는데 O(1) -> O(n)

인덱스 조회

배열 리스트: 배열에 인덱스를 사용해서 값을 O(1)로 찾을 수 있음

연결 리스트: 노드를 인덱스 수 만큼 이동해야 함 O(n)

검색

배열 리스트: 데이터를 찾을 떄 까지 배열을 순회 O(n)

연결 리스트: 데이터를 찾을 때 까지 노드를 순회 O(n)

시간복잡도와 실제 성능

이론적으로 MyLinkedList의 평균 추가(중간 삽입)연산은 MyArrayList보다 빠를 수 있다. 그러나 실제 성능은 요소의 순차적 접근 속도, 메모리 할당 및 해제 비용, CPU 캐시 활용도 등 다양한 요소에 의해 영향을 받는다.

MyArrayList는 요소들이 메모리 상에서 연속적으로 위치하여 CPU캐시 효율이 좋고, 메모리 접근 속도가 빠르다.

반면 MyLinkedList는 각 요소가 별도의 객체로 존재하고 다음 요소의 참조를 저장학 ㅣ때문에 CPU 캐시 효율이 떨어지고, 메모리 접근 속도가 상대적으로 느릴 수 있다.

MyArrayList의 경우 CPAPCITY를 넘어서면 배열을 다시 만들고 복사하는 과정이 추가된다 하지만 한번에 2배씩 늘어나기 때문에 이 과정은 가끔 발생하므로, 전체 성능에 큰영향을 주진 않는다.

정리하면 이론적으로 MyLinkedList가 평균 추가(중간 삽입)에 있어 더 효율적일 수 있지만, 현대 컴퓨터 시스템의 메모리 접근 패턴, CPU 캐시 최적화 등을 고려할 때 MyArrayList가 실제 사용환경에서 더 나은 성능을 보여주는 경우가 많다.

배열 리스트 vs 연결 리스트

대부분의 경우 배열 리스트가 성능상 유리하다. 이런 이유로 실무에서는 주로 배열 리스트를 기본으로 사용한다.

만약 데이터를 앞쪽에서 자주 추가하거나 삭제할 일이 있다면 연결 리스트를 고려하도록 하자.

자바 리스트

List 자료 구조

순서가 있고, 중복을 허용하는 자료 구조를 리스트라 한다. 자바의 컬렉션 프레임워크가 제공하는 가장 대표적인 자료 구조가 바로 리스트이다. 리스트와 관련된 컬렉션 프레임워크는 다음 구조를 가진다.

Collection 인터페이스

Collection 인터페이스는 java.util 패키지의 컬렉션 프레임워크의 핵심 인터페이스 중 하나이다. 이 인터페이스는 자바에서 다양한 컬렉션, 즉 데이터 그룹을 다루기 위한 메서드들을 정의한다. Collection 인터페이스는 List, Set, Queue와 같은 다양한 하위 인터페이스와 함께 사용되며, 이를 통해 데이터를 리스트, 세트, 큐 등의 형태로 관리할 수 있다. 자세한 내용은 뒤에서 다룬다.

List 인터페이스

List 인터페이스는 java.util 패키지에 있는 컬렉션 프레임워크의 일부다. list는 객체들의 순서가 있는 컬렉션을 나타내며, 같은 객체의 중복 저장을 허용한다. 이 리스트는 배열과 비슷하지만, 크기가 동적으로 변화하는 컬렉션을 다룰 때 유연하게 사용할 수 있다.

List인터페이스는 ArrayList, LinkedList와 같은 여러 구현 클래스를 가지고 있으며, 각 클래스는 list인터페이스의 메서드를 구현한다.

자바 ArrayList

java.util.ArrayList

자바가 제공하는 ArrayList는 우리가 직접 만든 MyArrayList와 거의 비슷하다.

- 배열을 사용해서 데이터를 관리한다.

- 기본 CAPACITY는 10이다.

- CAPACITY를 넘어가면 배열을 50% 증가한다.

- 10 -> 15 -> 22 -> 33 - > 49로 증가한다.(자바 버전에 따라 다를 수 있다)

- 메모리 고속 복사 연산을 사용한다

- ArrayList의 중간 위치에 데이터를 추가하면, 추가할 위치 이후의 모든 요소를 한 칸씩 뒤로 이동시켜야 한다.

- 자바가 제공하는 ArrayList는 이 부분을 최적화 하는데, 배열의 요소 이동은 시스템 레벨에서 최적화된 메모리 고속복사 연산을 사용해서 비교적 빠르게 수행된다. 참고로 System.arraycopy()를 사용한다.

기존에는 데이터를 한칸씩 옆으로 밀었지만 자바 List에서는 통째로 한번에 복사하여 집어넣는다.

시스템 레벨에서 배열을 한번에 아주 빠르게 복사한다. 이 부분은 OS, 하드웨어에 따라 성능이 다르기 때문에 정확한 측정이 어렵지만 , 한칸씩 이동하는 방식과 비교하면 보통 수 배 이상의 빠른 성능을 제공한다.

자바 LinkedList

java.util.LinkedList

자바가 제공하는 LinkedList는 우리가 직접 만든 MyLinkedList와 거의 비슷하다. 특징은 다음과 같다.

- 이중 연결 리스트 구조

- 첫 번째 노드와 마지막 노드 둘 다 참조

우리가 직접 만든 MyLinkedList의 노드는 다음 노드로만 이동할 수 있는 단일 연결 구조이다. 따라서 이전 노드로 이동할 수 없다는 단점이 있었다.

-자바가 제공하는 LinkedList는 이중 연결 구조를 사용한다. 이 구조는 다음 노드 뿐만 아니라 이전 노드로도 이동할 수 있다.

ex) node.next를 호출하면 다음 노드로, node.prev를 호출하면 이전 노드로 이동한다.

-마지막 노드에 대한 참조를 제공한다. 따라서 데이터를 마지막에 추가하는 경우에도 O(1)의 성능을 제공한다.

- 이전 노드로 이동할 수 있기 때문에 마지막 노드부터 앞으로, 그러니까 역방향으로 조회할 수 있다.

- 덕분에 인덱스 조회 성능을 최적화 할 수 있다.

- 예를 들어 인덱스로 조회하는 경우 인덱스가 사이즈의 절반 이하라면 처음부터 찾아서 올라가고, 인덱스가 사이즈의 절 반을 넘으면 마지막 노드부터 역방향으로 조회해서 성능을 최적화 할 수 있다.

그럼 자바가 제공하는 리스트의 성능을 비교해보자.

package collection.list;

import java.util.ArrayList;
import java.util.LinkedList;
import java.util.List;


public class JavaListPerformanceTest {

    public static void main(String[] args) {
        int size = 50_000;
        System.out.println("==ArrayList 추가==");
        addFirst(new ArrayList<>(), size);
        addMid(new ArrayList<>(), size);
        ArrayList<Integer> arrayList = new ArrayList<>();
        addLast(arrayList,size);

        int loop = 10000;
        System.out.println("==ArrayList 조회 ==");
        getIndex(arrayList,loop,0);
        getIndex(arrayList,loop,size/2);
        getIndex(arrayList,loop,size-1);

        System.out.println("==ArrayList 검색 ==");
        search(arrayList,loop,0);
        search(arrayList,loop,size/2);
        search(arrayList,loop,size-1);


        System.out.println("==LinkedList 추가==");
        addFirst(new LinkedList<>(), size);
        addMid(new LinkedList<>(), size);
        LinkedList<Integer> linkedList = new LinkedList<>();
        addLast(linkedList,size);

        System.out.println("==LinkedList 조회 ==");
        getIndex(linkedList,loop,0);
        getIndex(linkedList,loop,size/2);
        getIndex(linkedList,loop,size-1);

        System.out.println("==LinkedList 검색 ==");
        search(linkedList,loop,0);
        search(linkedList,loop,size/2);
        search(linkedList,loop,size-1);

    }

    private static void addFirst(List<Integer> list, int size){
        long startTime = System.currentTimeMillis();
        for (int i = 0; i < size; i++) {
            list.add(0, i);

        }
        long endTime = System.currentTimeMillis();
        System.out.println("앞에 추가 - 크기: " + size + ", 계산 시간: " + (endTime - startTime) + "ms");
    }

    private static void addMid(List<Integer> list, int size){
        long startTime = System.currentTimeMillis();
        for (int i = 0; i < size; i++) {
            list.add(i/2, i);

        }
        long endTime = System.currentTimeMillis();
        System.out.println("평균 추가 - 크기: " + size + ", 계산 시간: " + (endTime - startTime) + "ms");
    }

    private static void addLast(List<Integer> list, int size){
        long startTime = System.currentTimeMillis();
        for (int i = 0; i < size; i++) {
            list.add(i);

        }
        long endTime = System.currentTimeMillis();
        System.out.println("뒤에 추가 - 크기: " + size + ", 계산 시간: " + (endTime - startTime) + "ms");
    }

    private static void getIndex(List<Integer> list, int loop, int index) {
        long startTime = System.currentTimeMillis();
        for (int i = 0; i < loop; i++) {
            list.get(index);
        }
        long endTime = System.currentTimeMillis();
        System.out.println("index: " + index + ", 반복: " + loop + ", 계산 시간: " +(endTime - startTime) + "ms");
    }

    private static void search(List<Integer> list, int loop, int findValue) {
        long startTime = System.currentTimeMillis();
        for (int i = 0; i < loop; i++) {
            list.indexOf(findValue);
        }
        long endTime = System.currentTimeMillis();
        System.out.println("findValue: " + findValue + ", 반복: " + loop + ", 계산 시간: " +(endTime - startTime) + "ms");
    }
}

==ArrayList 추가==
앞에 추가 - 크기: 50000, 계산 시간: 144ms
평균 추가 - 크기: 50000, 계산 시간: 74ms
뒤에 추가 - 크기: 50000, 계산 시간: 4ms
==ArrayList 조회 ==
index: 0, 반복: 10000, 계산 시간: 0ms
index: 25000, 반복: 10000, 계산 시간: 1ms
index: 49999, 반복: 10000, 계산 시간: 0ms
==ArrayList 검색 ==
findValue: 0, 반복: 10000, 계산 시간: 1ms
findValue: 25000, 반복: 10000, 계산 시간: 348ms
findValue: 49999, 반복: 10000, 계산 시간: 429ms
==LinkedList 추가==
앞에 추가 - 크기: 50000, 계산 시간: 4ms
평균 추가 - 크기: 50000, 계산 시간: 1674ms
뒤에 추가 - 크기: 50000, 계산 시간: 7ms
==LinkedList 조회 ==
index: 0, 반복: 10000, 계산 시간: 0ms
index: 25000, 반복: 10000, 계산 시간: 511ms
index: 49999, 반복: 10000, 계산 시간: 0ms
==LinkedList 검색 ==
findValue: 0, 반복: 10000, 계산 시간: 1ms
findValue: 25000, 반복: 10000, 계산 시간: 769ms
findValue: 49999, 반복: 10000, 계산 시간: 1698ms

추가, 삭제

배열 리스트는 인덱스를 통해 추가나 삭제할 위치를 O(1)로 빠르게 찾지만, 추가나 삭제 이후에 데이터를 한칸씩 밀어야 한다.

연결 리스트는 인덱스를 통해 추가나 삭제할 위치를 O(n)으로 느리게 찾지만, 일제 데이터의 추가는 간단한 참조 변경으로 O(1)로 빠르게 수행된다.

앞에 추가(삭제)

배열 리스트: 추가나 삭제할 위치를 찾는데는 O(1) , 데이터를 한칸씩 이동 O(n) -> O(n) (고속 복사 사용)

연결 리스트: 추가나 삭제할 위치는 찾는데 O(1), 노드 변경하는데 O(1) -> O(1)

평균 추가(삭제)

배열 리스트: 추가나 삭제할 위치를 찾는데는 O(1) , 인덱스 이후의 데이터를 한칸씩 이동 O(n/2) -> O(n)

연결 리스트: 추가나 삭제할 위치는 찾는데 O(n/2), 노드 변경하는데 O(1) -> O(n)

뒤에추가(삭제)

배열 리스트: 추가나 삭제할 위치를 찾는데 O(1) , 이동할 데이터 없음 -> O(1)

연결 리스트: 추가나 삭제할 위치는 찾는데 O(1), 노드 변경하는데 O(1) -> O(1)

--> 참고로 자바가 제공하는 연결 리스트(LinkedList)는 마지막 위치를 가지고 있다.

인덱스 조회

배열 리스트: 배열에 인덱스를 사용해서 값을 O(1)로 찾을 수 있음

연결 리스트: 노드를 인덱스 수 만큼 이동해야 함 O(n)

검색

배열 리스트: 데이터를 찾을 떄 까지 배열을 순회 O(n)

연결 리스트: 데이터를 찾을 때 까지 노드를 순회 O(n)

데이터를 추가할 때 자바 ArrayList가 직접 구현한 MyArrayList보다 빠른 이유

- 자바의 배열 리스트는 이때 메모리 고속 복사를 사용하기 때문에 성능이 최적화 된다.

- 메모리 고속 복사는 시스템에 따라 성능이 다르기 때문에 정확한 계산은 어렵지만 대략 O(n/10)정도로 추정하자. 상수를 제거하면 O(n)이 된다. 하지만 메모리 고속 복사라도 데이터가 아주 많으면 느려진다.

시간 복잡도와 실제 성능

- 이론적으로 LinkedList의 중간 삽입 연산은 ArrayList보다 빠를 수 있다. 그러나 실제 성능은 요소의 순차적 접근 속도, 메모리 할당 및 해제 비용, CPU 캐시 활용도 등 다양한 요소에 의해 영향을 받는다.

- ArrayList는 요소들이 메모리 상에서 연속적으로 위치하여 CPU 캐시 효율이 좋고, 메모리 접근 속도가 빠르다.

- 반면, LinkedList는 각 요소가 별도의 객체로 존재하고 다음 요소의 참조를 저장하기 때문에 CPU 캐시 효율이 떨어지고, 메모리 접근 속도가 상대적으로 느려질 수 있다.

- ArrayList의 경우 CAPACITY를 넘어서면 배열을 다시 만들고 복사하는 과정이 추가된다. 하지만 한번에 50%씩 늘어나기 때문에 이 과정은 가끔 발생하므로, 전체 성능에 큰 영향을 주지는 않는다.

정리하면 이론적으로 LinkedList가 중간 삽입에 있어 더 효율적일 수 있지만, 현대 컴퓨터 시스템의 메모리 접근 패턴, CPU 캐시 최적화, 메모리 고속 복사 등을 고려할 때 ArrayList가 실제 사용환경에서 더 나은 성능을 보여주는 경우가 많다.

배열리스트 vs 연결 리스트

대부분의 경우 배열 리스트가 성능상 유리하다. 이런 이유로 실무에서는 주로 배열 리스트를 기본으로 사용한다.

만약 데이터를 앞쪽에서 자주 추가하거나 삭제할 일이 있다면 연결 리스트를 고려하자

'공부 > Java' 카테고리의 다른 글

컬렉션 프레임워크 - HashSet (0)	2024.09.30
자바 컬렉션 프레임워크 - 해시(Hash) (2)	2024.09.28
자바 컬렉션 프레임워크 - LinkedList (0)	2024.09.26
자바 컬렉션 프레임워크 - ArrayList (1)	2024.09.25
자바 제네릭(Generic) 2편 (2)	2024.09.24

현재글자바 컬렉션 프레임워크 List

IT 개발자의 공부방

티스토리챌린지, 예외처리, 참조형, 컬렉션 프레임워크, 다형성, 스프링, 김영한, MVC, 자바, 오블완, http, 메서드, ISTQB, java, spring, API, Thymeleaf, jpa, 클래스, 공부,

Today :
Yesterday :

surrealCode