Шпаргалка программиста Java 3. Коллекции в Java (стандартные, guava, apache, trove, gc-collections и другие)

Сегодня я хотел бы поговорить о коллекциях в Java. Это тема встречается практически на любом техническом интервью Java разработчика, однако далеко не все разработчики в совершенстве освоили все коллекции даже стандартной библиотеки, не говоря уже о всех библиотеках с альтернативными реализациями коллекций, таких как guava, apache, trove и ряд других. Давайте посмотрим какие вообще коллекции можно найти в мире Java и какие методы работы с ними существуют.

727bf44364b7422ba39240661856d73b.jpg

Эта статья полезна как для начинающих (чтобы получить общее понимание что такое коллекции и как с ними работать), так и для более опытных программистов, которые возможно найдут в ней что-то полезное или просто структурируют свои знания. Собственно, главное чтобы у вас были хотя бы базовые знания о коллекциях в любом языке программирования, так как в статье не будет объяснений что такое коллекция в принципе.

I. Стандартная библиотека коллекций Java

Естественно, практически все и так знают основные коллекции в JDK, но все-таки вспомним о них, если вы уверены, что и так все знаете о стандартных коллекциях можете смело пропускать все что в спойлерах до следующего раздела.

Замечание о коллекциях для начинающих

Иногда достаточно сложно для начинающих (особенно если они перешли из других языков программирования) понять, что в коллекции Java хранятся только ссылки/указатели и ничего более. Им кажется, что при вызове add или put объекты действительно хранятся где-то внутри коллекции, это верно только для массивов, когда они работают с примитивными типами, но никак не для коллекций, которые хранят только ссылки. Поэтому очень часто на вопросы собеседований вроде «А можно ли назвать точный размер коллекции ArrayList» начинающие начинают отвечать что-то вроде «Зависит от типа объектов что в них хранятся». Это совершенно не верно, так коллекции никогда не хранят сами объекты, а только ссылки на них. Например, можно в List добавить миллион раз один и то же объект (точнее создать миллион ссылок на один объект).


1) Интерфейсы коллекций JDK

Интерфейсы коллекций JDK
Интерфейсы коллекций
Название Описание
Iterable Интерфейс означающий что у коллекции есть iterator и её можно обойти с помощью for(Type value:collection). Есть почти у всех коллекций (кроме Map)
Collection Основной интерфейс для большинства коллекций (кроме Map)
List Список это упорядоченная в порядке добавления коллекция, так же известная как последовательность
(sequence). Дублирующие элементы в большинстве реализаций — разрешены. Позволяет доступ по
индексу элемента. Расширяет Collection интерфейс.
Set Интерфейс реализующий работу с множествами (похожими на математические множества), дублирующие
элементы запрещены. Может быть, а может и не быть упорядоченным. Расширяет Collection интерфейс.
Queue Очередь — это коллекция, предназначенная для хранения объектов до обработки, в отличии от обычных операций над коллекциями, очередь предоставляет дополнительные методы добавление, получения и просмотра. Быстрый доступ по индексу элемента, как правило, не содержит. Расширяет Collection интерфейс
Deque Двухсторонняя очередь, поддерживает добавление и удаление элементов с обоих концов. Расширяет
Queue интерфейс.
Map Работает со соответствием ключ — значение. Каждый ключ соответствует только одному значению. В
отличие от других коллекций не расширяет никакие интерфейсы (в том числе Collection и Iterable)
SortedSet Автоматически отсортированное множество, либо в натуральном порядке (для подробностей смотрите
Comparable интерфейс), либо используя Comparator. Расширяет Set интерфейс
SortedMap Это map'а ключи которой автоматически отсортированы, либо в натуральном порядке, либо с помощью
comparator'а. Расширяет Map интерфейс.
NavigableSet
Это SortedSet, к которому дополнительно добавили методы для поиска ближайшего значения к заданному значению поиска. NavigableSet может быть доступен для доступа и обхода или в порядке
убывания значений или в порядке возрастания.
NavigableMap
Это SortedMap, к которому дополнительно добавили методы для поиска ближайшего значения к заданному значению поиска. Доступен для доступа и обхода или в порядке убывания значений или в
порядке возрастания.

Интерфейсы из пакета java.util.concurrent
Название Описание
BlockingQueue
Многопоточная реализация Queue, содержащая возможность задавать размер очереди, блокировки по условиях, различные методы, по-разному обрабатывающие переполнение при добавлении или отсутствие данных при получении (бросают exception, блокируют поток постоянно или на время, возвращают false и т.п.)
TransferQueue
Эта многопоточная очередь может блокировать вставляющий поток, до тех пор, пока принимающий поток не вытащит элемент из очереди, таким образом с её помощью можно реализовывать синхронные и асинхронные передачи сообщений между потоками
BlockingDeque
Аналогично BlockingQueue, но для двухсторонней очереди
ConcurrentMap 
Интерфейс, расширяет интерфейс Map. Добавляет ряд новых атомарных методов: putIfAbsent, remove, replace, которые позволяют облегчить и сделать более безопасным многопоточное программирование.
ConcurrentNavigableMap
Расширяет интерфейс NavigableMap для многопоточного варианта

Если вам интересны более подробная информация о интерфейсах и коллекциях из java.util.concurrent советую
прочитать вот эту статью.


2) Таблица с очень кратким описанием всех коллекций

Таблица с очень кратким описанием всех коллекций
Тип Однопоточные Многопоточные
Lists
  • ArrayList — основной список, основан на массиве
  • LinkedList — рекомендуется не использовать
  • Vector — устарел

  • CopyOnWriteArrayList — редкие обновления, частые чтения

Queues /
Deques
  • ArrayDeque — основная реализация, основан на массиве
  • Stack — устарел
  • PriorityQueue — отсортированная очередь

  • ArrayBlockingQueue — блокирующая очередь
  • ConcurrentLinkedDeque / ConcurrentLinkedQueue — очередь на связанных нодах
  • DelayQueue — очередь с задержкой для каждого элемента
  • LinkedBlockingDeque / LinkedBlockingQueue — блокирующая очередь на связанных нодах
  • LinkedTransferQueue — может служить для передачи элементов
  • PriorityBlockingQueue — многопоточная PriorityQueue
  • SynchronousQueue — простая многопоточная очередь

Maps
  • HashMap — основная реализация
  • EnumMap — enum в качестве ключей
  • Hashtable — устарел
  • IdentityHashMap — ключи сравниваются с помощью ==
  • LinkedHashMap — сохраняет порядок вставки
  • TreeMap — сортированные ключи
  • WeakHashMap — слабые ссылки, полезно для кешей

  • ConcurrentHashMap — основная многопоточная реализация
  • ConcurrentSkipListMap — отсортированная многопоточная реализация

Sets
  • HashSet — основная реализация множества
  • EnumSet — множество из enums
  • BitSet* — множество битов
  • LinkedHashSet — сохраняет порядок вставки
  • TreeSet — отсортированные set
  • ConcurrentSkipListSet — отсортированный многопоточный set
  • CopyOnWriteArraySet — редкие обновления, частые чтения


* — на самом деле, BitSet хоть и называется Set'ом, интерфейс Set не наследует.


3) Устаревшие коллекции в JDK

Устаревшие коллекции Java
Универсальные коллекции общего назначения, которые признаны устаревшими (legacy)
Имя Описание
Hashtable
Изначально задумывался как синхронизированный аналог HashMap, когда ещё не было возможности
получить версию коллекции используя Collecions.synchronizedMap. На данный момент как правило
используют ConcurrentHashMap. HashTable более медленный и менее потокобезопасный чем синхронный
HashMap, так как обеспечивает синхронность на уровне отдельных операций, а не целиком на уровне
коллекции.
Vector Раньше использовался как синхронный вариант ArrayList, однако устарел по тем же причинам что и
HashTable.
Stack Раньше использовался как для построения очереди, однако поскольку построен на основе Vector,
тоже считается морально устаревшим.

Специализированные коллекции, построенные на устаревших (legacy) коллекциях
Имя Основан на Описание
Properties
Hashtable Как структура данных, построенная на Hashtable, Properties довольно устаревшая конструкция,
намного лучше использовать Map, содержащий строки. Подробнее почему Properties
не рекомендуется использовать можно найти в этом обсуждении.
UIDefaults
Hashtable Коллекция, хранящая настройки по умолчанию для Swing компонент


4) Коллекции, реализующие интерфейс List (список)

Коллекции, реализующие интерфейс List (список)
Универсальные коллекции общего назначения, реализующие List:
Название Основан
на
Описание Размер*
ArrayList
List Реализация List интерфейса на основе динамически изменяемого массива. В большинстве случаев, лучшая возможная реализация List интерфейса по потреблению памяти и производительности. В крайне редких случаях, когда требуются частые вставки в начало или середину списка с очень малым
количеством перемещений по списку, LinkedList будет выигрывать в производительности (но советую в этих случаях использовать TreeList от apache). Если интересны подробности ArrayList советую посмотреть эту статью.
4*N
LinkedList
List Реализация List интерфейса на основе двухстороннего связанного списка, то есть когда каждый элемент, указывает на предыдущий и следующий элемент. Как правило, требует больше памяти и хуже по производительности, чем ArrayList, имеет смысл использовать лишь в редких случаях когда часто требуется вставка/удаление в середину списка с минимальными перемещениями по списку (но советую в этих случаях использовать TreeList от apache).Так же реализует Deque интерфейс. При работе через Queue интерфейс, LinkedList действует как FIFO очередь. Если интересны подробности LinkedList советую посмотреть эту статью.
24*N

Коллекции из пакета java.util.concurrent
Название Основан
на
Описание
CopyOnWriteArrayList
List Реализация List интерфейса, аналогичная ArrayList, но при каждом изменении списка, создается
новая копия всей коллекции. Это требует очень больших ресурсов при каждом изменении коллекции,
однако для данного вида коллекции не требуется синхронизации, даже при изменении коллекции во
время итерирования.

Узкоспециализированные коллекции на основе List.
Название Основан на Описание
RoleList
ArrayList Коллекция для хранения списка ролей (Roles). Узкоспециализированная коллекция основанная на
ArrayList с несколькими дополнительными методами
RoleUnresolvedList
ArrayList Коллекция для хранения списка unresolved ролей (Unresolved Roles). Узкоспециализированная
коллекция основанная на ArrayList с несколькими дополнительными методами
AttributeList
ArrayList Коллекция для хранения атрибутов MBean. Узкоспециализированная коллекция основанная на ArrayList
с несколькими дополнительными методами

* — размер дан в байтах для 32 битных систем и Compressed Oops, где N это capacity списка


5) Коллекции, реализующие интерфейс Set (множество)

Коллекции, реализующие интерфейс Set (множество)
Название Основан
на
Описание Размер*
HashSet Set Реализация Set интерфейса с использованием хеш-таблиц. В большинстве случаев, лучшая возможная реализация Set интерфейса.
32*S + 4*C
LinkedHashSet
HashSet Реализация Set интерфейса на основе хеш-таблиц и связанного списка. Упорядоченное по добавлению множество, которое работает почти так же быстро как HashSet. В целом, практически тоже самое что HashSet, только порядок итерирования по множеству определен порядком добавления элемента во
множество в первый раз.
40 * S + 4*C
TreeSet NavigableSet
Реализация NavigableSet интерфейса, используя красно-черное дерево. Отсортировано с помощью Comparator или натурального порядка, то есть обход/итерирование по множеству будет происходить в зависимости от правила сортировки. Основано на TreeMap, так же как HashSet основан на HashMap
40 * S
EnumSet Set Высокопроизводительная реализация Set интерфейса, основанная на битовом векторе. Все элементы EnumSet объекта должны принадлежать к одному единственному enum типу
S/8

* — размер дан в байтах для 32 битных систем и Compressed Oops, где С это capacity списка, S это size списка

Узкоспециализированные коллекции на основе Set

Название Основан
на
Описание
JobStateReasons
HashSet Коллекция для хранения информации о заданиях печати (print job's attribute set).
Узкоспециализированная коллекция основанная на HashSet с несколькими дополнительными методами

Коллекции из пакета java.util.concurrent
Название Основан
на
Описание
CopyOnWriteArraySet
Set Аналогично CopyOnWriteArrayList при каждом изменении создает копию всего множества, поэтому
рекомендуется при очень редких изменениях коллекции и требованиях к thread-safe
ConcurrentSkipListSet
Set Является многопоточным аналогом TreeSet


6) Коллекции, реализующие интерфейс Map (ассоциативный массив)

Коллекции, реализующие Map интерфейс
Универсальные коллекции общего назначения, реализующие Map:
Название Основан
на
Описание Размер*
HashMap Map Реализация Map интерфейса с помощью хеш-таблиц (работает как не синхронная Hashtable, с
поддержкой ключей и значений равных null). В большинстве случаев лучшая по производительности и
памяти реализация Map интерфейса. Если интересны подробности устройства HashMap советую посмотреть эту статью.
32 * S + 4*C
LinkedHashMap
HashMap Реализация Map интерфейса, на основе хеш-таблицы и связного списка, то есть ключи в Map'е
хранятся и обходятся во порядке добавления. Данная коллекция работает почти так же быстро как
HashMap. Так же она может быть полезна для создания кешей (смотрите
removeEldestEntry(Map.Entry) ). Если интересны подробности устройства LinkedHashMap советую посмотреть эту статью.
40 * S + 4*C
TreeMap NavigableMap
Реализация NavigableMap с помощью красно-черного дерева, то есть при обходе коллекции, ключи
будут отсортированы по порядку, так же NavigableMap позволяет искать ближайшее значение к ключу.
40 * S
WeakHashMap
Map Аналогична HashMap, однако все ключи являются слабыми
ссылками (weak references), то есть garbage collected может удалить объекты ключи и объекты
значения, если других ссылок на эти объекты не существует. WeakHashMap один из самых простых
способов для использования всех преимуществ слабых ссылок.
32 * S + 4*C
EnumMap Map Высокопроизводительная реализация Map интерфейса, основанная на простом массиве. Все ключи в
этой коллекции могут принадлежать только одному enum типу.
4*C
IdentityHashMap
Map Identity-based Map, так же как HashMap, основан на хеш-таблице, однако в отличии от HashMap он
никогда не сравнивает объекты на equals, только на то является ли они реально одиним и тем же
объектом в памяти. Это во-первых, сильно ускоряет работу коллекции, во-вторых, полезно для
защиты от «spoof attacks», когда сознательно генерируется объекты equals другому объекту.
В-третьих, у данной коллекции много применений при обходе графов (таких как глубокое копирование
или сериализация), когда нужно избежать обработки одного объекта несколько раз.
8*C

* — размер дан в байтах для 32 битных систем и Compressed Oops, где С это capacity списка, S это size списка

Коллекции из пакета java.util.concurrent

Название Основан
на
Описание
ConcurrentHashMap
ConcurrentMap
Многопоточный аналог HashMap. Все данные делятся на отдельные сегменты и блокируются только
отдельные сегменты при изменении, что позволяет значительно ускорить работу в многопоточном
режиме. Итераторы никогда не кидают ConcurrentModificationException для данного вида коллекции
ConcurrentSkipListMap
ConcurrentNavigableMap
Является многопоточным аналогом TreeMap


7) Коллекции, основанные на интерфейсах Query/Dequery (очереди)

Коллекции, основанные на Query/Dequery
Название Основан
на
Описание Размер*
ArrayDeque
Deque Эффективная реализация Deque интерфейса, на основе динамического массива, аналогичная
ArrayList
6*N
LinkedList
Deque Реализация List и Deque интерфейса на основе двухстороннего связанного списка, то есть когда каждый элемент, указывает на предыдущий и следующий элемент.При работе через Queue интерфейс, LinkedList действует как FIFO очередь.
40*N
PriorityQueue
Queue Неограниченная priority queue, основанная на куче (нeap). Элементы отсортированы в натуральном
порядке или используя Comparator. Не может содержать null элементы.

* — размер дан в байтах для 32 битных систем и Compressed Oops, где С это capacity списка, S это size списка

Многопоточные Queue и Deque, который определены в java.util.concurrent, требуют отдельной статьи, поэтому здесь приводить их не буду, если вам интересна информация о них советую прочитать вот эту статью


8) Прочие коллекции

Прочие коллекции
Название Описание Размер*
BitSet
Несмотря на название, BitSet не реализует интерфейс Set. BitSet служит для компактной записи массива битов.
N / 8


9) Методы работы с коллекциями

Методы работы с коллекциями
Алгоритмы- В классе Collections содержится много полезных статистических методов.
Для работы с любой коллекцией:
Метод Описание
frequency(Collection, Object)
Возвращает количество вхождений данного элемента в указанной коллекции
disjoint(Collection, Collection) Возвращает true, если в двух коллекциях нет общих элементов
addAll(Collection<? super T>, T...) Добавляет все элементы из указанного массива (или перечисленные в параметрах) в указанную коллекцию
min(Collection) Возвращение минимального элемента из коллекции
max(Collection) Возвращение максимального элемента из коллекции

Для работы со списками:

Метод Описание
sort(List) Сортировка с использованием алгоритма сортировки соединением (merge sort algorithm), производительность которой в большинстве случаев близка к производительности быстрой сортировки (high quality quicksort), гарантируется O(n*log n) производительность (в отличии от quicksort), и стабильность (в отличии от quicksort). Стабильная сортировка это такая которая не меняет порядок одинаковых элементов при сортировке
binarySearch(List, Object) Поиск элемента в списке (list), используя binary search алгоритм.
reverse(List) Изменение порядка всех элементов списка (list)
shuffle(List) Перемешивание всех элементов в списке в случайном порядке
fill(List, Object)  Переписывание каждого элемента в списке каким-либо значением
copy(List dest, List src) Копирование одного списка в другой
rotate(List list, int distance) Передвигает все элементы в списке на указанное расстояние
replaceAll(List list, Object oldVal, Object newVal) Заменяет все вхождения одного значения на другое
indexOfSubList(List source, List target) Возвращает индекс первого вхождения списка target в список source
lastIndexOfSubList(List source, List target) Возвращает индекс последнего вхождения списка target в список source
swap(List, int, int) Меняет местами элементы, находящиеся на указанных позициях

В Java 8 так же появился такой способ работы с коллекциями как stream Api, но мы рассмотрим примеры его использование далее в разделе 5.


10) Как устроенны разные типы коллекций JDK внутри

Как устроенны разные типы коллекций JDK внутри
Коллекция Описание внутреннего устройства
ArrayList Данная коллекция лишь настройка над массивом + переменная хранящая size списка. Внутри просто
массив, который пересоздается каждый раз когда нет места для добавления нового элемента. В
случае, добавления или удаления элемента внутри коллекции весь хвост сдвигается в памяти на
новое место. К счастью, копирование массива при увеличении емкости или при добавлении/удалении
элементов производится быстрыми нативными/системными методами. Если интересны подробности
советую посмотреть эту статью.
LinkedList Внутри коллекции используется внутренний класс Node, содержащий ссылку на предыдущий элемент,
следующий элемент и само значение элемента. В самом инстансе коллекции хранится размер и ссылки
на первый и последний элемент коллекции. Учитывая что создание объекта дорогое удовольствие для
производительности и затратно по памяти, LinkedList чаще всего работает медленно и занимает
намного больше памяти чем аналоги. Обычно ArrayList, ArrayDequery лучшее решение по производительности и памяти, но в некоторых редких случаях (частые вставки в середину списка с редкими перемещениями по списку), он может быть быть полезен (но в этом случае полезнее использовать TreeList от apache). Если интересны подробности советую посмотреть эту статью.
HashMap Данная коллекция построена на хеш-таблице, то есть внутри коллекции находится массив внутреннего класса (buket) Node равный capacity коллекции. При добавлении нового элемента вычисляться его хеш-функция, делиться на capacity HashMap по модулю и таким образом вычисляется место элемента в массиве. Если на данном месте ещё не храниться элементов создается новый объект Node с ссылкой на добавляемый элемент и записывается в нужное место массива. Если на данном месте уже есть элемент/ы (происходит хеш-коллизия), то так Node является по сути односвязным списком, то есть содержит ссылку на следующий элемент, то можно обойти все элементы в списке и проверить их на equals добавляемому элементу, если этот такого совпадение не найдено, то создается новый объект Node и добавляется в конец списка. В случае, если количество элементов в связном списке (buket) становится более 8 элементов, вместо него создается бинарное дерево. Подробнее о хеш таблицах смотрите вики (в HashMap используется метод цепочек для разрешения коллизий). Если интересны подробности устройства HashMap советую посмотреть эту статью.
HashSet HashSet это просто HashMap, в которую записывается фейковый объект Object вместо значения, при этом имеет значение только ключи. Внутри HashSet всегда хранится коллекция HashMap.
IdentityHashMap IdentityHashMap это аналог HashMap, но при этом не требуется элементы проверять на equals, так
как разными считаются любые два элементы. указывающие на разные объекты. Благодаря этому удалось
избавится от внутреннего класса Node, храня все данные в одном массиве, при этом при коллизиях
ищется подходящая свободная ячейка до тех пор пока не будет найдена (метод
открытой адресации).Подробнее о хеш таблицах смотрите вики
(в IdentityHashMap используется метод открытой адресации для разрешения коллизий)
LinkedHashMap/LinkedHashSet Внутренняя структура практически такая же как при HashMap, за исключением того что вместо
внутреннего класса Node, используется TreeNode, которая знает предыдущее и следующее значение,
это позволяет обходить LinkedHashMap по порядку добавления ключей. По сути, LinkedHashMap =
HashMap + LinkedList. Если интересны подробности устройства LinkedHashMap советую посмотреть эту статью.
TreeMap/TreeSet Внутренняя структура данных коллекций построена на сбалансированным красно-черным деревом,
подробнее о нем можно почитать в вики
WeakHashMap Внутри все организовано практически как в HashMap, за исключением что вместо обычных ссылок
используются WeakReference и есть отдельная очередь ReferenceQueue, необходимая для удаления
WeakEntries
EnumSet/EnumMap В EnumSet и EnumMap в отличие от HashSet и HashMap используются битовые векторы и массивы для
компактного хранения данных и ускорения производительности. Ограничением этих коллекций является
то что EnumSet и EnumMap могут хранить в качестве ключей только значения одного Enum'а.


11) Другие полезные сущности стандартной библиотеки коллекций

Другие полезные сущности стандартной библиотеки коллекций
Давайте посмотрим какие ещё полезные сущности содержит официальный гайд по коллекциями
1) Wrapper implementations – Обертки для добавления функциональности и изменения поведения других реализаций. Доступ исключительно через статистические методы.
  • Collections.unmodifiableInterface– Обертка для создания не модифицируемой коллекции на основе указанной, при любой попытки изменения данной коллекции будет выкинут UnsupportedOperationException
  • Collections.synchronizedInterface– Создания синхронизированной коллекции на основе указанной, до тех пор пока доступ к базовой коллекции идет через коллекцию-обертку, возвращенную данной функцией, потокобезопасность гарантируется.
  • Collections.checkedInterface – Возвращает коллекцию с проверкой правильности типа динамически
    (во время выполнения), то есть возвращает type-safe view для данной коллекции, который
    выбрасывает ClassCastException при попытке добавить элемент ошибочного типа. При использовании
    механизма generic'ов JDK проверяет на уровне компиляции соответствие типов, однако этот механизм
    можно обойти, динамическая проверка типов не позволяет воспользоваться этой возможностью.

2) Adapter implementations – данная реализация адаптирует один интерфейс коллекций к другому
  • newSetFromMap(Map) – Создает из любой реализации Set интерфейса реализацию Map интерфейса.
  • asLifoQueue(Deque) - возвращает view из Deque в виде очереди работающей по принципу Last In First Out (LIFO).

3) Convenience implementations – Высокопроизводительные «мини-реализации» для интерфейсов коллекций.
  • Arrays.asList – Позволяет отобразить массив как список (list)
  • emptySet, emptyList и emptyMap – возвращает пустую не модифицированную реализацию empty set, list, or
    map
  • singleton, singletonList и singletonMap – возвращает не модифицируемый set, list или map, содержащий один заданный объект (или одно связь ключ-значение)
  • nCopies – Возвращает не модифицируемый список, содержащий n копий указанного объекта

4) Абстрактные реализации интерфейсов — Реализация общих функций (скелета коллекций) для упрощения создания конкретных реализаций коллекций.
  • AbstractCollection – Абстрактная реализация интерфейса Collection для коллекций, которые не являются ни множеством, ни списком (таких как «bag» или multiset).
  • AbstractSet — Абстрактная реализация Set интерфейса.
  • AbstractList – Абстрактная реализация List интерфейса для списков, позволяющих позиционный доступ (random access), таких как массив.
  • AbstractSequentialList – Абстрактная реализация List интерфейса, для списков, основанных на последовательном доступе (sequential access), таких как linked list.
  • AbstractQueue — Абстрактная Queue реализация.
  • AbstractMap — Абстрактная Map реализация.

4) Инфраструктура
  • Iterators – Похожий на обычный Enumeration интерфейс, но с большими возможностями.
  • Iterator – Дополнительно к функциональности Enumeration интерфейса, который включает возможности по удалению элементов из коллекции.
  • ListIterator – это Iterator который используется для lists, который добавляет к функциональности обычного Iterator интерфейса, такие как итерация в обе стороны, замена элементов, вставка элементов, получение по индексу.

5) Ordering
  • Comparable — Определяет натуральный порядок сортировки для классов, которые реализуют их. Этот порядок может быть использован в методах сортировки или для реализации sorted set или map.
  • Comparator — Represents an order relation, which can be used to sort a list or maintin order in a sorted set or map. Can override a type's natural ordering or order objects of a type that does not implement the Comparable interface.

6) Runtime exceptions
  • UnsupportedOperationException – Это ошибка выкидывается когда коллекция не поддерживает операцию, которая была вызвана.
  • ConcurrentModificationException – Выкидывается iterators или list iterators, если коллекция на которой он основан была неожиданно (для алгоритма) изменена во время итерирования, также выкидывается во views основанных на списках, если главный список был неожиданно изменен.

7) Производительность
  • RandomAccess — Интерфейс-маркер, который отмечает списки позволяющие быстрый (как правило за константное время) доступ к элементу по позиции. Это позволяет генерировать алгоритмы учитывающие это поведение для выбора последовательного и позиционного доступа.

8) Утилиты для работы с массивами
  • Arrays – Набор статических методов для сортировки, поиска, сравнения, изменения размера, получения хеша для массива. Так же содержит методы для преобразования массива в строка и заполнения массива примитивами или объектами.

II. Краткий обзор сторонних библиотек коллекций

Итак, Я хотел бы сделать обзор следующих сторонних библиотек: guava, apache, trove и gc-collections. Почему именно эти библиотеки? Guava и Apache Commons Collections очень популярны и встречались мне почти в любом Java проекте, Trove — тоже очень популярная библиотека, когда нужно уменьшить память и улучшить производительность работы с коллекциями. GC-collections — судя по оценкам весьма популярная библиотека на github'e (>1300 звезд), больше неё набрала «звезд» только guava. Так же мельком захвачу несколько других популярных библиотек.

Итак, для начала рассмотрим что предлагают различные библиотеки, их главные фишки (Предупреждение: это очень субъективно, для кого-то главными фишками будут совсем другие возможности библиотек).

2.1 Фишки разных библиотек коллекций

Давайте сделаем небольшой обзор главных фишек (на мой взгляд) разных библиотек коллекций:
1) Guava — данная коллекция от гугл практически самая популярная после стандартного фреймворка коллекций, она
добавляет ряд интересных коллекций, но самая главная «фишка» это скорее богатый набор классов-утилит со статическими
методами, расширяющими возможности Collections для работы со стандартными коллекциями, чем новые виды коллекций.
Стандартные коллекции она практически не заменяет.

2) Apache Commons Collections — данная коллекция ближайший «конкурент» guava, она так же предоставляет ряд
интересных коллекций, утилит по работе со стандартными коллекциями Java, а так же большое количество wrapper'ов для
изменения поведения коллекций. Кроме того она предоставляет свою реализацию map'ы с более простым механизм
итерирования по ней.

3) Trove — фишка данной коллекции в первую очередь в производительности и сокращении памяти, поэтому она
предлагает более быстрые реализации стандартных коллекций (и требующие меньше памяти), а так же коллекции
примитивных типов.

4) GC-collections — фишка данной коллекции в идее объединить методы обработки, такие как сортировка и классы
коллекций для создания замены использования статических методов классов-утилит. Данная библиотека предлагает замену
практически всех стандартным коллекциям и добавляет несколько новых.

III. Альтернативные виды коллекций в разных библиотеках

Тут я попробую кратко рассмотреть, какие новые интересные виды коллекций можно найти в разных библиотеках:

3.1 Альтернативные виды коллекций у Guava


Официальная информация: документация, исходные коды, javadoc.
Как подключить к проекту:

Maven, Gradle
Maven
<dependency>
  <groupId>com.google.guava</groupId>
  <artifactId>guava</artifactId>
  <version>18.0</version>
</dependency>

Gradle

dependencies {
  compile 'com.google.guava:guava:18.0'
}


Гугл разработал ряд интересных дополнений к существующим коллекциям, которые весьма и весьма полезны, если вы можете
использовать guava библиотеку в своем проекте. Можно сказать, что эти коллекции давно уже стали стандартом де-факто
для большинства Java проектов, поэтому для любого опытного разработчика важно знать их, даже если он по каким-то
причинам не может использовать их в своих проектах, зачастую на собеседованиях можно услышать вопросы по guava
коллекциям.

Давайте рассмотрим их поподробнее. Для начала рассмотрим интерфейсы основных коллекций и группы классов в guava.

Внимание: если таблица не помещается целиком, попробуйте уменьшить масштаб страницы или открыть в другом браузере.

Название Описание Примеры реализаций Примеры использования
ImmutableCollection
ImmutableList
ImmutableSet
… и т.д.
Хотя в стандартном фреймворке Java коллекций есть возможность сделать коллекцию неизменяемой вызвав
Collections.unmodifiableCollection (unmodifiableList или unmodifiableMap), но этот подход не самый
оптимальный, так как отдельный тип для неизменяемых коллекций позволяет быть уверенным, что это
коллекция действительно неизменяемая, вместо ошибок времени исполнения, при попытке изменить коллекцию,
будут ошибки во время компиляции проекта, к тому же в стандартном фреймворке коллекций Java неизменяемые
коллекции по-прежнему тратят ресурсы на поддержку синхронизации при многопоточном чтении и т. п.
операциях, в то время как ImmutableCollection guava «знают» что они неизменяемые и оптимизированы с
учетом этого.
JDK: ImmutableCollection,
ImmutableList,
ImmutableSet,
ImmutableSortedSet,
ImmutableMap,
ImmutableSortedMap
Guava: ImmutableMultiset,
ImmutableSortedMultiset,
ImmutableMultimap,
ImmutableListMultimap,
ImmutableSetMultimap,
ImmutableBiMap,
ImmutableClassToInstanceMap,
ImmutableTable
— если публичный метод возвращает коллекцию, которую гарантировано не должны менять другие классы,
— если известно что значения коллекции больше никогда не должны меняться
Multiset
Коллекция аналогичная Set, но позволяющая дополнительно считать количество добавлений элемента. Очень
полезна для тех задач, когда нужно не только знать есть ли данный элемент в данном множестве, но и
посчитать их количество (самый простой пример подсчет количества упоминаний тех или иных слов в
каком-либо тексте). То есть данная коллекция более удобный вариант коллекции Map<T, Integer>, с методами специально предназначенными для подобных коллекций, позволяет очень сильно
сократить количество лишнего кода в таких случаях.
HashMultiset,
TreeMultiset,
LinkedHashMultiset,
ConcurrentHashMultiset,
ImmutableMultiset
SortedMultiset
— подсчет кол-ва вхождений слов в тексте
— подсчет кол-ва букв в тексте
— подсчет кол-ва любых объектов
Multimap
Практически любой опытный Java разработчик сталкивался с необходимостью использовать структуры вроде Map<K, List<V>> или Map<K,Set<V>>, при этом приходилось писать много лишнего кода, для упрощения работы в библиотеку guava были введены Multimap, то есть коллекции, позволяющие просто работать со случаями когда
один ключ и много значений у этого ключа. В отличии от конструкций вроде Map<K,Set<V>>, Multimap предоставляет ряд удобных функций для сокращения кода и упрощения алгоритмов.
ArrayListMultimap,
HashMultimap,
LinkedListMultimap,
LinkedHashMultimap,
TreeMultimap,
ImmutableListMultimap,
ImmutableSetMultimap
— реализация отношений один ко многим, таких как:
учитель — ученики
отдель — работники
начальник — подчиненные
BiMap
Достаточно часто встречаются ситуации, когда требуется создать Map'у работающую в обе стороны, то есть
когда ключ и значение могут меняться местами (например, русско-английский словарь, когда в одном случае
требуется получить по русскому слову — английское, в другом наоброт по английскому-русское). Обычно, это
© Habrahabr.ru