Swift - 数组、字典、集合

[Swift - 数组、字典、集合 - 简书](https://www.jianshu.com/p/7048a3d001d4 )

Swift语言提供 ArraysSets 和 Dictionaries 三种基本的集合类型用来存储集合数据。数组(Arrays)是有序数据的集。集合(Sets)是无序无重复数据的集。字典(Dictionaries)是无序的键值对的集。

  Swift - 数组、字典、集合 CollectionTypes_intro_2x.png

Swift 语言中的 ArraysSets 和 Dictionaries 中存储的数据值类型必须明确。这意味着我们不能把错误的数据类型插入其中。同时这也说明你完全可以对取回值的类型非常放心。

注意: Swift 的 ArraysSets 和 Dictionaries 类型被实现为泛型集合

数组

数组是Swift中最普通的集合,数组是有序的容器,并且容器中的每一个元素都是相同的类型, 我们可以使用下标对其直接进行访问(又称为随机访问),相同的值可以多次出现在一个数组的不同位置中。

注意:
Swift 的 Array 类型被桥接到 Foundation 中的 NSArray 类。更多关于在 Foundation 和 Cocoa 中使用 Array 的信息,参见 Using Swift with Cocoa and Obejective-C(Swift 4.1) 中使用 Cocoa 数据类型部分。

数组的简单语法

public struct Array<Element> { }

写Swift数组应该遵循像Array<Element>这样的形式,其中Element是这个数组中唯一允许存在的数据类型。我们也可以使用像[Element]这样的简单语法。尽管两种形式在功能上是一样的,但是推荐[Element]写法,Element是一个泛型表示可指定任意类型。

创建一个空数组

我们可以使用构造语法来创建一个由特定数据类型构成的空数组:

var someInts = [Int]()
print("someInts is of type [Int] with \(someInts.count) items.”)
//打印 "someInts is of type [Int] with 0 items.”

注意,通过构造函数的类型,someInts的值类型被推断为[Int]

如果代码上下文中已经提供了类型信息,例如一个函数参数或者一个已经定义好类型的常量或者变量,那么我们可以使用空数组语句创建一个空数组,它的写法很简单:[](一对空方括号):

someInts.append(3)   //someInts 现在包含一个 Int 值,值为3
someInts =  [] //someInts 现在是空数组,但是仍然是 [Int] 类型的。

创建一个带有默认值的数组

Swift中的Array类型还提供一个可以创建特定大小并且所有数据都被默认的构造方法。我们可以把准备加入新数组的数据项数量(count)和适当类型的初始值(repeating)传入数组构造函数:

var threeDoubles = Array(repeating: 0.0, count: 3)
//threeDoubles 是一种 [Double] 数组,等价于 [0.0, 0.0, 0.0]

通过两个数组相加创建一个数组

我们可以使用加法操作符(+)来组合两种已存在的相同类型数组。新数组的数据类型会被从两个数组的数据类型中推断出来:

var anotherThreeDoubles = Array(repeating: 2.5, count: 3)
//anotherThreeDoubles 被推断为 [Double],等价于 [2.5, 2.5, 2.5]
 
var sixDoubles = threeDoubles + anotherThreeDoubles
//sixDoubles 被推断为 [Double],等价于 [0.0, 0.0, 0.0, 2.5, 2.5, 2.5]

用数组字面量构造数组

我们可以使用数组字面量来进行数组构造,这是一种用一个或者多个数值构造数组的简单方法。数组字面量是一系列由逗号分割并由方括号包含的数值:形如:[value 1, value 2, value 3]。下面这个例子创建了一个叫做shoppingList并且存储String的数组:

var shoppingList: [String] = ["Eggs", "Milk"]

shoppingList已经被构造并且拥有两个初始项。shoppingList变量被声明为“字符串值类型的数组“,记作[String]。 因为这个数组被规定只有String一种数据结构,所以只有String类型可以在其中被存取。 在这里,shoppingList数组由两个String值("Eggs" 和"Milk")构造,并且由数组字面量定义。

注意:shoppingList数组被声明为变量(var关键字创建)而不是常量(let创建)是因为以后可能会有更多的数据项被插入其中。

在这个例子中,字面量仅仅包含两个String值。匹配了该数组的变量声明(只能包含String的数组),所以这个字面量的分配过程可以作为用两个初始项来构造shoppingList的一种方式。

由于Swift的类型推断机制,当我们用字面量构造只拥有相同类型值数组的时候,我们不必把数组的类型定义清楚。shoppingList的构造也可以这样写:

var shoppingList = ["Eggs", "Milk"]

因为所有数组字面量中的值都是相同的类型,Swift 可以推断出[String]shoppingList中变量的正确类型。

访问和修改数组

我们可以通过数组的方法和属性来访问和修改数组,或者使用下标语法,可以使用数组的只读属性count来获取数组中的数据项数量:

print("The shopping list contains \(shoppingList.count) items.")
// 输出 "The shopping list contains 2 items."

使用布尔属性isEmpty作为一个缩写形式去检查count属性是否为0:

if shoppingList.isEmpty {
    print("The shopping list is empty.")
} else {
    print("The shopping list is not empty.")
}
// 打印 "The shopping list is not empty."

也可以使用append()方法在数组后面添加新的数据项:

shoppingList.append("Flour")
// shoppingList 现在有3个数据项

除此之外,使用加法赋值运算符(+=)也可以直接在数组后面添加一个或多个拥有相同类型的数据项:

shoppingList += ["Baking Powder"]
// shoppingList 现在有四项了
shoppingList += ["Chocolate Spread", "Cheese", "Butter"]
// shoppingList 现在有七项了

可以直接使用下标语法来获取数组中的数据项,把我们需要的数据项的索引值放在直接放在数组名称的方括号中:

var firstItem = shoppingList[0]// 第一项是 "Eggs"

注意:第一项在数组中的索引值是0而不是1。 Swift 中的数组索引总是从零开始。

我们也可以用下标来改变某个已有索引值对应的数据值:

shoppingList[0] = "Six eggs"
// 其中的第一项现在是 "Six eggs" 而不是 “Eggs"

还可以利用下标来一次改变一系列数据值,即使新数据和原有数据的数量是不一样的。下面的例子把"Chocolate Spread","Cheese",和"Butter"替换为"Bananas"和 "Apples":

shoppingList[4...6] = ["Bananas", "Apples"]// shoppingList 现在有6项

注意:不可以用下标访问的形式去在数组尾部添加新项。

数组的插入

调用数组的insert(_:at:)方法来在某个具体索引值之前添加数据项:

shoppingList.insert("Maple Syrup", at: 0)
// shoppingList 现在有7项, "Maple Syrup" 现在是这个列表中的第一项

这次insert(_:at:)方法调用把值为"Maple Syrup"的新数据项插入列表的最开始位置,并且使用0作为索引值。

数组的删除

类似的我们可以使用remove(at:)方法来移除数组中的某一项。这个方法把数组在特定索引值中存储的数据项移除并且返回这个被移除的数据项(我们不需要的时候就可以无视它):

shoppingList.remove(at: 0)
// 索引值为0的数据项被移除
// shoppingList现在只有6项,而且不包括Maple Syrup;
// mapleSyrup常量的值等于被移除数据项的值 "Maple Syrup"

注意:如果我们试着对索引越界的数据进行检索或者设置新值的操作,会引发一个运行期错误。

我们可以使用索引值和数组的count属性进行比较来在使用某个索引之前先检验是否有效。除了当count等于0 时(说明这是个空数组),最大索引值一直是count - 1,因为数组都是零起索引。

数据项被移除后数组中的空出项会被自动填补,所以现在索引值为0的数据项的值再次等于"Six eggs":

firstItem = shoppingList[0]
// firstItem 现在等于"Six eggs"

如果我们只想把数组中的最后一项移除,可以使用removeLast()方法而不是remove(at:)方法来避免我们需要获取数组的count属性。就像后者一样,前者也会返回被移除的数据项:

let apples = shoppingList.removeLast()
// 数组的最后一项被移除了
// shoppingList现在只有5项,不包括Apples
// apples常量的值现在等于 "Apples" 字符串

数组的遍历

我们可以使用for-in循环来遍历所有数组中的数据项:

for item in shoppingList {
   print(item)
}
// Six eggs
// Milk
// Flour
// Baking Powder
// Bananas

如果我们同时需要每个数据项的值和索引值,可以使用enumerated()方法来进行数组遍历。enumerated()返回一个由每一个数据项索引值和数据值组成的元组。我们可以把这个元组分解成临时常量或者变量来进行遍历:

for (index, value) in shoppingList.enumerated() {
   print("Item \(String(index + 1)): \(value)")
}
// Item 1: Six eggs
// Item 2: Milk
// Item 3: Flour
// Item 4: Baking Powder
// Item 5: Bananas

遍历数组,但是不包括第一个元素

for x in shoppingList.dropFirst(){
 print(x) //
}
 
/*
 Milk
 Flour
 Baking Powder
 Bananas
 */

遍历数组,但是不包括最后一个或者几个元素

for x in shoppingList.dropLast(){
 print(x)
}
/*
 Six eggs
 Milk
 Flour
 Baking Powder
 */
for x in shoppingList.dropLast(3){
    print(x)
}
/*
 Six eggs
 Milk
 */
数组的可变性

举个例子,要创建一个数字的数组,我们可以这么写:

// 斐波拉契数列
let fibs = [0, 1, 1, 2, 3, 5]

如果我们使用像append这样的方法来修改上面定义的数组,会得到编译错误。因为在上面的代码中数组是用let生命为常量的。在很大情景下,这是正常的做法,它可以避免我们不小心对数组作出改变。如果我们想按照变量的方式来使用数组,我们需要使用var来进行定义,而且很容易添加单个或者一系列元素

var mutableFibs = [0, 1, 1, 2, 3, 5]

mutableFibs.append(8)
mutableFibs.append(contentsOf: [13,21,34])

区别使用var和let可以给我们带来不少好处,使用let定义的变量因为其具有不变性,因此更有理由被优先使用,当你读到类似let fib=...这样的声明时,你可以确定fibs的值将永远不变,这一点是由编译器强制保证的。

不过,要注意这只针对那些具有值语义的类型。使用let定义的类实例对象(也就是说对于引用类型)时,它保证的是这个引用永远不会发生变化,你不能再给这个引用赋一个新的值,但是这个引用所指向的对象却是可以改变的。

数组是值类型

数组和标准库中的所有集合类型一样,是具有值语义的。当你创建一个新的数组变量并且把一个已经存在的数组赋值给它时,这个数组的内容会被赋值。

举个例子,在下面的代码中,x将不会被更改:

var x = [1,2,3]
var y = x
y.append(4)
y // 1,2,3,4
x // 1,2,3

var y=x语句复制了x,所以在4添加到y末尾的时候,x并不会发生改变,它的值依然是[1,2,3]。当你把数组传递给一个函数时,会发生同样的事情;方法将得到这个数组的一份本地复制,所有对它的改变都不会影响调用者所持有的数组

对比一下Foundation框架中NSArray在可变特性上的处理方法,NSArray中没有更改方法,想要更改一个数组,你必须使用NSMutableArray。但是,就算你拥有的是一个不可变的NSArray,但是它的引用特性并不能保证这个数组不会被改变。

let a = NSMutableArray(array: [1,2,3])
let b: NSArray = a // 不想让b发生改变
a.insert(4, at: 3) // 但是事实上b的改变依然能够被a影响
b // 1,2,3,4

正确的方式是在赋值时,先收到进行复制

let c = NSMutableArray(array: [1,2,3])
let b: NSArray = c.copy() as! NSArray // 不想让b发生改变
c.insert(4, at: 3) // 1,2,3,4
b // 1,2,3

该例子中显而易见,我们需要进行复制,因为a的声明毕竟是可变的,但是当把数组在方法和函数之间来回传递的时候,事情可能就不那么明显了。

而在Swift中,相较于NSArrayNSMutableArray两种类型,数组只有严重统一的类型,那就是Array。使用var可以将数组定义为可变,但是区别与NS的数组,当你使用let定义第二个数组,并将第一个数组赋值给它,也可以保证这个新的数组是不会改变的,因为这里没有公用的引用

创建如此多的复制有可能造成性能问题,不过实际上Swift标准库中的所有集合类型都使用了“写时复制”这一技术,它能够保证只在必要的时候对数据进行复制。在上面的例子中,y.append被调用之前,x和y都将共享内部的存储

Swift数组提供了你能想到的所有常规操作,像是isEmpty或是count。数组也允许直接使用特定的下标直接访问其中的元素,像是fib[3]。不过要注意:在使用下标获取元素之前,需要确保索引值没有超出范围,否则会导致程序奔溃

数组变形

对数组中的每个值指向转换是一个很常见的任务。常用操作:创建一个新数组,对已有数组中的元素进行循环依次取出其中元素,对取出的元素进行操作,并把操作的结果加入到新数组的末尾。比如:下面的代码计算了一个整型数组里元素的平方

var squared: [Int] = []
for fib in fibs {
    squared.append(fib * fib)
}
squared // 0,1,1,4,9,25

Swift数组拥有map方法,这个方法来自函数式编程的世界,专门用于对数组中的元素进行遍历操作

public func map<T>(_ transform: (Element) throws -> T) rethrows -> [T]

map 方法接受一个闭包作为参数, 然后它会遍历整个数组,并对数组中每一个元素执行闭包中定义的操作。 相当于对数组中的所有元素做了一个映射,这是非常普遍的操作

let squared = fibs.map { $0 * $0}
squared // 0,1,1,4,9,25

使用map函数的优势

  • 代码很短,代码长度短意味着错误少,不过更重要的是,它比原来更清晰了。所有无关的内容都被移除了,一旦习惯了map的使用,就会发现map就像一个信号,一旦看见它,就会知道即将有一个函数被作用在数组的每一个元素上,并返回一个数组,它将包含所有被转换后的结果

  • squared将由map的结果得到,我们不会再改变它的值,所以也就不再需要用var来进行声明了,我们可以将其声明为let。另外,由于数组元素的类型可以从传递给map的函数中推断出来,我们也不再需要为squared显示地指明类型了

  • 创建map函数并不难,只需要把for循环模版部分用一个泛型函数封装起来就可以了,下面是一种可能的实现方式

extension Array {
    func map<T>(_ transform: (Element) -> T) -> [T] {
        var result: [T] = []
        result.reserveCapacity(count)
        for x in self {
            result.append(transform(x))
        }
        return result
    }
}

Element是数组包含元素类型的占位符,T是元素转换之后的类型占位符。map函数本身并不关心
ElementT究竟是什么,它们可以是任意类型。T的具体类型将由调用者传入给maptransform方法的返回值类型来决定。

index函数

找到具体元素的位置,第一次出现的位置

if let index = array.index(where: { element -> Bool in return element == 4 }) {
  print("index = \(index)") //index = 2
}

另外一个例子:

let students = ["Kofi", "Abena", "Peter", "Kweku", "Akosua"]
if let i = students.index(where: { $0.hasPrefix("A") }) {
    print("\(students[i]) starts with 'A'!")
}
// Prints "Abena starts with 'A'!"
Filter

将数组中符合一定条件的元素过滤出来并用它们创建一个新的数组。对数组进行循环并且根据条件过滤其中元素的模式。

let cast = ["Vivien", "Marlon", "Kim", "Karl"]
let shortNames = cast.filter { $0.characters.count < 5 }
print(shortNames)
// Prints "["Kim", "Karl"]"

filter内部实现

extension Array {
    func filter(_ isIncluded: (Element) -> Bool) -> [Element] {
        var result: [Element] = []
        for x in self where isIncluded(x) {
            result.append(x)
        }
        return result
    }
}

组合map,filter写出更简单的表达,如:查找100以下所有的偶数

let res = (1..<10).map{$0 * $0}.filter{$0 % 2 == 0}
print(res) //[4, 16, 36, 64]
reduce函数

对于map,filter都是在一个数组的基础上产生一个新数组或者修改数组,然后有时候,你想组合所有的元素到一个新值。例如:计算所有元素的和,我们能够使用如下代码:

let number = [0,1,1,2,3,4,5]
var total = 0
for num in number {
    total = total + num
}
print("total = \(total)") //total = 16

reduce方法使用了这种模式,并且抽象为两个部分,一个初始值,一个是函数用于组合中间值和元素值,使用reduce,我们的代码如下:

let sum = number.reduce(0){ total, num in total + num}
//因为操作符+也是函数,所以我们可以直接使用+号
let shortSum = fibs.reduce(0, +)
print("sum = \(sum),shortSum = \(shortSum)") //sum = 16,shortSum = 16

注意:输出的结果类型并不一定跟元素的类型一样,例如:我们想转换integerstring

let stringArray = number.reduce(""){str, num in str + "\(num)"}
print("stringArray = \(stringArray)") //stringArray = 0112345

reduce的内部实现

extension Array {
    func reduce<Result>(_ initialResult: Result, _ nextPartialResult: (Result, Element) -> Result) -> Result {
        var result = initialResult
        for x in self {
            result = nextPartialResult(result, x)
        }
        return result
    }
}
flatMap

通过为序列中的每一个元素进行转换,即执行闭包,返回的数组是包含串行的结果.

let numbers = [1, 2, 3, 4]
let mapped = numbers.map { Array(repeating: $0, count: $0) }
print("mapped = \(mapped)") //mapped = [[1], [2, 2], [3, 3, 3], [4, 4, 4, 4]]

let flatMapped = numbers.flatMap { Array(repeating: $0, count: $0) }
print("flatMapped = \(flatMapped)") //flatMapped = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4]

flatMap组合元素来自不同的数组

let suits = ["♠", "♥", "♣", "♦"]
let ranks = ["J","Q","K","A"]
let results = suits.flatMap { suit in
    ranks.map { rank in
        (suit,rank)
    }
}
print("results = \(results)")
//results = [("♠", "J"), ("♠", "Q"), ("♠", "K"), ("♠", "A"), ("♥", "J"), ("♥", "Q"), ("♥", "K"), ("♥", "A"), ("♣", "J"), ("♣", "Q"), ("♣", "K"), ("♣", "A"), ("♦", "J"), ("♦", "Q"), ("♦", "K"), ("♦", "A")]

flatMap内部实现

extension Array {
    func flatMap<T>(_ transform: (Element) -> [T]) -> [T] {
        var result: [T] = []
        for x in self {
            result.append(contentsOf: transform(x))
        }
        return result
    }
}
forEach

forEach,就像一个循环,传递一个函数功能用于执行序列中的每一个元素。但是不像mapforEach并不返回任何值。

for element in [1,2,3] {
   print(element)
}
 
[1,2,3].forEach { element in
    print(element)
}

上下对比一下也没有看到优势,但是它能够随意使用,如果你想为集合执行单一功能的操作,传递一个函数名给forEach而不是一个比包表达式,这样能够看起来更加简单和精准的代码。例如:在你的视图控制器之内,你想添加子视图( subviews)的数组到主视图(main view),仅仅只需要 theViews.forEach(view.addSubview)

然而,对于for循环和forEach还是存在一些区别的,例如:如果使用for循环执行返回一条语句,使用forEach重写将更好。对于多语句的遍历,不要使用forEach

数组的切片

除了通过单独的下标来访问数组的元素(fibs[0]),还可以通过下标来获取某个范围中的元素。比如,想要获取除了首个元素的其他元素

let slice = fibs[1..<fibs.endIndex]
slice // 1,1,2,3,5
type(of: slice) // ArraySlice<Int>

它将返回一个数组切片(slice),其中包含了愿数组中从第二个元素到最后一个元素的数据。得到的结果类型是ArraySlice而不是Array

切片类型只是数组的一种表示方式,它背后的数据仍然是原来的数组,只不过是用切片的方式来进行表示。

字典

字典是一种存储多个相同类型的值的容器。每个值(value)都关联唯一的键(key),键作为字典中的这个值数据的标识符。和数组中的数据项不同,字典中的数据项并没有具体顺序。我们在需要通过标识符(键)访问数据的时候使用字典,这种方法很大程度上和我们在现实世界中使用字典查字义的方法一样。

字典类型简化语法

Swift中的字典使用Dictionary<Key, Value>定义,其中Key是字典中键的数据类型,Value是字典中对应于这些键所存储值的数据类型。我们也可以用[Key: Value]这样简化的形式去创建一个字典类型。虽然这两种形式功能上相同,但是后者是首选。

注意:一个字典的Key类型必须遵循Hashable协议,就像Set的值类型。

创建一个空字典

我们可以像数组一样使用构造语法创建一个拥有确定类型的空字典:

var namesOfIntegers = [Int: String]()
// namesOfIntegers 是一个空的 [Int: String] 字典

这个例子创建了一个[Int: String]类型的空字典来储存整数的英语命名。它的键是Int型,值是String型。如果上下文已经提供了类型信息,我们可以使用空字典字面量来创建一个空字典,记作[:](中括号中放一个冒号):

namesOfIntegers[16] = "sixteen"
// namesOfIntegers 现在包含一个键值对
namesOfIntegers = [:]
// namesOfIntegers 又成为了一个 [Int: String] 类型的空字典

字典的字面量

我们可以使用字典字面量来构造字典,和数组字面量拥有相似语法。

字典字面量是一种将一个或多个键值对写作Dictionary集合的快捷途径。一个键值对是一个key和一个value的结合体。在字典字面量中,每一个键值对的键和值都由冒号分割。这些键值对构成一个列表,其中这些键值对由方括号包含、由逗号分割:

[key1: value1, key2: value2, key3: value3]

下面的例子创建了一个存储国际机场名称的字典。在这个字典中键是三个字母的国际航空运输相关代码,值是机场名称:

var airports: [String: String] = ["YYZ": "Toronto Pearson", "DUB": "Dublin"]

airports字典被声明为一种[String: String]类型,这意味着这个字典的键和值都是String类型。

注意:airports字典被声明为变量(用var关键字)而不是常量(let关键字)因为可能会有更多的机场信息会被添加到这个示例字典中。

airports字典使用字典字面量初始化,包含两个键值对。第一对的键是YYZ,值是Toronto Pearson。第二对的键是DUB,值是Dublin。这个字典语句包含了两个String: String类型的键值对。它们对应airports变量声明的类型(一个只有String键和String值的字典)所以这个字典字面量的任务是构造拥有两个初始数据项的airport字典。

和数组一样,我们在用字典字面量构造字典时,如果它的键和值都有各自一致的类型,那么就不必写出字典的类型。airports字典也可以用这种简短方式定义:

var airports = ["YYZ": "Toronto Pearson", "DUB": "Dublin"]

因为这个语句中所有的键和值都各自拥有相同的数据类型,Swift 可以推断出Dictionary<String, String>airports字典的正确类型。

访问和修改字典

我们可以通过字典的方法和属性来访问和修改字典,或者通过使用下标语法。和数组一样,我们可以通过字典的只读属性count来获取某个字典的数据项数量:

print("The dictionary of airports contains \(airports.count) items.")
// 打印 "The dictionary of airports contains 2 items."(这个字典有两个数据项)

使用布尔属性isEmpty作为一个缩写形式去检查count属性是否为0:

if airports.isEmpty {
    print("The airports dictionary is empty.")
} else {
    print("The airports dictionary is not empty.")
}
// 打印 "The airports dictionary is not empty."

我们也可以在字典中使用下标语法来添加新的数据项。可以使用一个恰当类型的键作为下标索引,并且分配恰当类型的新值:

airports["LHR"] = "London"
// airports 字典现在有三个数据项

我们也可以使用下标语法来改变特定键对应的值:

airports["LHR"] = "London Heathrow"
// "LHR"对应的值 被改为 "London Heathrow

作为另一种下标方法,字典的updateValue(_:forKey:)方法可以设置或者更新特定键对应的值。

就像上面所示的下标示例,updateValue(_:forKey:)方法在这个键不存在对应值的时候会设置新值或者在存在时更新已存在的值。

和上面的下标方法不同的是updateValue(_:forKey:)这个方法返回更新值之前的原值。这样使得我们可以检查更新是否成功。

updateValue(_:forKey:)方法会返回对应值的类型的可选值。举例来说:对于存储String值的字典,这个函数会返回一个String?或者“可选 String”类型的值。如果有值存在于更新前,则这个可选值包含了旧值,否则它将会是nil。

if let oldValue = airports.updateValue("Dublin Airport", forKey: "DUB") {
    print("The old value for DUB was \(oldValue).")
}
// 输出 "The old value for DUB was Dublin."

我们也可以使用下标语法来在字典中检索特定键对应的值。因为有可能请求的键没有对应的值存在,字典的下标访问会返回对应值的类型的可选值。如果这个字典包含请求键所对应的值,下标会返回一个包含这个存在值的可选值,否则将返回nil:

if let airportName = airports["DUB"] {
    print("The name of the airport is \(airportName).")
} else {
    print("That airport is not in the airports dictionary.")
}
// 打印 "The name of the airport is Dublin Airport."

我们还可以使用下标语法来通过给某个键的对应值赋值为nil来从字典里移除一个键值对:

airports["APL"] = "Apple Internation"
// "Apple Internation" 不是真的 APL 机场, 删除它
airports["APL"] = nil
// APL 现在被移除了

此外,removeValue(forKey:)方法也可以用来在字典中移除键值对。这个方法在键值对存在的情况下会移除该键值对并且返回被移除的值或者在没有值的情况下返回nil:

if let removedValue = airports.removeValue(forKey: "DUB") {
    print("The removed airport's name is \(removedValue).")
} else {
    print("The airports dictionary does not contain a value for DUB.")
}
// prints "The removed airport's name is Dublin Airport."

字典遍历

我们可以使用for-in循环来遍历某个字典中的键值对。每一个字典中的数据项都以(key, value)元组形式返回,并且我们可以使用临时常量或者变量来分解这些元组:

for (airportCode, airportName) in airports {
    print("\(airportCode): \(airportName)")
}
// YYZ: Toronto Pearson
// LHR: London Heathrow

通过访问keys或者values属性,我们也可以遍历字典的键或者值:

for airportCode in airports.keys {
    print("Airport code: \(airportCode)")
}
// Airport code: YYZ
// Airport code: LHR
 
for airportName in airports.values {
    print("Airport name: \(airportName)")
}
// Airport name: Toronto Pearson
// Airport name: London Heathrow

如果我们只是需要使用某个字典的键集合或者值集合来作为某个接受Array实例的 API 的参数,可以直接使用keys或者values属性构造一个新数组:

let airportCodes = [String](airports.keys)
// airportCodes 是 ["YYZ", "LHR"]
 
let airportNames = [String](airports.values)
// airportNames 是 ["Toronto Pearson", "London Heathrow"]

Swift的字典类型是无序集合类型。为了以特定的顺序遍历字典的键或值,可以对字典的keys或values属性使用sorted()方法。

合并两个字典

合并两个字典,用来做合并的字典需要覆盖重复的键

扩展Dictionary类型,为它添加一个merge方法,该方法接受带合并的字典作为参数。我们可以将参数指明为Dictionary类型,不过更好的选择是用更加通用的泛型方法来进行实现

我们对参数的要求是,它必须是一个序列,这样我们就可以对其进行枚举遍历,另外,序列的元素必须是键值对,而且它必须接受调用的字典的键值值拥有相同的类型。对于任意的Sequence,如果它的Iterator.Element(Key,Value)话,它就满足我们的要求

extension Dictionary {
    mutating func merge<S>(_ other: S)  where S: Sequence,S.Iterator.Element == (key: Key,value: Value) {
        for (k,v) in other {
            self[k] = v
        }
    }
}

再扩展一个字典的初始化方法,通过字典创建字典

extension Dictionary {
    init<S: Sequence>(_ sequence: S) where S.Iterator.Element == (key: Key,value: Value) {
        self = [:]
        self.merge(sequence)
    }
}

对字典的values进行映射

extension Dictionary {
    func mapValues<NewValue>(transform: (Value) -> NewValue) ->[Key: NewValue] {
        return Dictionary<Key,NewValue>(map { (key, value) in
            return (key, transform(value))
        })
    }
}
Hashable要求

字典其实是哈希表,字典通过键的hashValue来为每一个键指定一个位置,以及它所对应的存储。这也就是Dictionary要求它的key类型需要遵守Hashable协议的原因。标准库中所有的基本数据类型都是遵守Hashable协议的,它们包括字符串,整数,浮点数以及布尔值。不带关联值的枚举值类型也会自动遵守Hashable

如果想将自定义的类型用作字典的key,那么必须手动为自定义类型添加Hashable并满足它,这需要你实现hashValue属性。另外,因为Hashable本身是对Equatable的扩展,因此,还需要为自定义类型重载==运算符。

实现必须保证哈希不变原则:两个同样的实例,必须拥有同样的哈希值,反过来不必为真:两个哈希值相同的实例不一定需要相等。不同的哈希值的数量是有限的,然后很多可以被哈希的类型(比如:字符串)的个数是无穷的。

哈希可能重复这一特性,意味着Dictionary必须能够处理哈希碰撞。优秀的哈希算法总是能给出较少的碰撞,这将保持集合的性能特性。理想状态下,我们希望得到的哈希值在整个整数范围内均匀分布。在极端的例子下,如果你的实现对所有实例返回相同的哈希值,那么这个字典的查找性能下降到O(n)

优秀哈希算法的第二个特质是它应该很快,记住,在字典中进行插入,删除,或者查找时,这些哈希值都要被计算。如果你的hashValue实现要消耗太多时间,那么它很可能会拖慢你的程序,让你的字典从O(1)特性中得到的好处损失殆尽

下一个能同时做到这些要求的哈希算法并不容易,对于一些由本身就是Hashable的数据类型组成的类型来说,将成员的哈希值进行“异或”运算往往是一个不错的起点

struct Person {
    var name: String
    var zipCode: Int
    var birthday: Date
}

extension Person: Equatable {
    static func ==(lhs: Person, rhs: Person) -> Bool {
        return lhs.name == rhs.name && lhs.zipCode == rhs.zipCode && lhs.birthday == rhs.birthday
    }
}

extension Person: Hashable {
    var hashValue: Int {
        return name.hashValue ^ zipCode.hashValue ^ birthday.hashValue
    }
}

异或计算方法的一个限制是,这个操作本身是左右对称的(也就是说a^b == b^a),对于某些数据的哈希计算,这有时候会造成不必要的碰撞,你可以添加一个位旋转并混合使用它们来避免这个问题

最后,当你使用不具有值语义的类型(比如可变的对象)作为字典的键时,需要特别小心。如果你在将一个对象用做字典的键后,改变了它的内容,它的哈希值/或相等特性往往也会发生改变,这时候你将无法再在字典中找到它,这时字典在错误的位置存储对象,这将导致字典内部存储错误,对于值类型来说,因为字典中的键不会和复制的值共用存储,因此它也不会被从外部改变,所以不存在这个问题

Set

集合(Set)用来存储相同类型并且没有确定顺序的值。当集合元素顺序不重要时或者希望确保每个元素只出现一次时可以使用集合而不是数组。

注意
Swift 的 Set 类型被桥接到 Foundation 中的 NSSet 类。
关于使用 Foundation 和 Cocoa 中 Set 的知识,参见 Using Swift with Cocoa and Obejective-C(Swift 4.1) 中使用 Cocoa 数据类型部分。

集合类型的哈希值

一个类型为了存储在集合中,该类型必须是可哈希化的--也就是说,该类型必须提供一个方法来计算它的哈希值。一个哈希值是Int类型的,相等的对象哈希值必须相同,比如a==b,因此必须a.hashValue == b.hashValue

Swift 的所有基本类型(比如String,Int,Double和Bool)默认都是可哈希化的,可以作为集合的值的类型或者字典的键的类型。没有关联值的枚举成员值(在枚举有讲述)默认也是可哈希化的。

注意:

你可以使用你自定义的类型作为集合的值的类型或者是字典的键的类型,但你需要使你的自定义类型符合 Swift标准库中的Hashable协议。符合Hashable协议的类型需要提供一个类型为Int的可读属性hashValue。由类型的hashValue属性返回的值不需要在同一程序的不同执行周期或者不同程序之间保持相同。

public struct Set<Element> where Element : Hashable {}

public protocol Hashable : Equatable {
    public var hashValue: Int { get }
    public func hash(into hasher: inout Hasher)
}

public protocol Equatable {
    public static func == (lhs: Self, rhs: Self) -> Bool
}

因为Hashable协议符合Equatable协议,所以遵循该协议的类型也必须提供一个"是否相等"运算符(==)的实现。这个Equatable协议要求任何符合==实现的实例间都是一种相等的关系。也就是说,对于a,b,c三个值来说,==的实现必须满足下面三种情况:

a == a(自反性)
a == b意味着b == a(对称性)
a == b && b == c意味着a == c(传递性)

集合类型语法

Swift中的Set类型被写为Set<Element>,这里的Element表示Set中允许存储的类型,和数组不同的是,集合没有等价的简化形式。

创建一个空的集合

你可以通过构造器语法创建一个特定类型的空集合:

var letters = Set<Character>()
print("letters is of type Set<Character> with \(letters.count) items.")
// 打印 "letters is of type Set<Character> with 0 items."

注意:通过构造器,这里的letters变量的类型被推断为Set<Character>

此外,如果上下文提供了类型信息,比如作为函数的参数或者已知类型的变量或常量,我们可以通过一个空的数组字面量创建一个空的Set

letters.insert("a")
// letters 现在含有1个 Character 类型的值
letters = []
// letters 现在是一个空的 Set, 但是它依然是 Set<Character> 类型

用数组字面量创建集合

你可以使用数组字面量来构造集合,并且可以使用简化形式写一个或者多个值作为集合元素。

下面的例子创建一个称之为favoriteGenres的集合来存储String类型的值:

var favoriteGenres: Set<String> = ["Rock", "Classical", "Hip hop"]
// favoriteGenres 被构造成含有三个初始值的集合

这个favoriteGenres变量被声明为一个String值的集合”,写为Set<String>。由于这个特定的集合含有指定String类型的值,所以它只允许存储String类型值。这里的favoriteGenres变量有三个String类型的初始值("Rock","Classical"和"Hip hop"),并以数组字面量的方式出现。

注意:favoriteGenres被声明为一个变量(拥有var标示符)而不是一个常量(拥有let标示符),因为它里面的元素将会在下面的例子中被增加或者移除。

一个Set类型不能从数组字面量中被单独推断出来,因此Set类型必须显式声明。然而,由于 Swift的类型推断功能,如果你想使用一个数组字面量构造一个Set并且该数组字面量中的所有元素类型相同,那么你无须写出Set的具体类型。favoriteGenres的构造形式可以采用简化的方式代替:

var favoriteGenres1: Set = ["Rock", "Classical", "Hip hop"]
//由于数组字面量中的所有元素类型相同,Swift 可以推断出Set<String>作为favoriteGenres变量的正确类型。

访问和修改一个集合

你可以通过Set的属性和方法来访问和修改Set。为了找出Set中元素的数量,可以使用其只读属性count:

print("I have \(favoriteGenres.count) favorite music genres.")
// 打印 "I have 3 favorite music genres."

使用布尔属性isEmpty作为一个缩写形式去检查count属性是否为0:

if favoriteGenres.isEmpty {
    print("As far as music goes, I'm not picky.")
} else {
    print("I have particular music preferences.")
}
// 打印 "I have particular music preferences."

你可以通过调用Set的insert(_:)方法来添加一个新元素:

favoriteGenres.insert("Jazz")
// favoriteGenres 现在包含4个元素

你可以通过调用Setremove(_:)方法去删除一个元素,如果该值是该Set的一个元素则删除该元素并且返回被删除的元素值,否则如果该Set不包含该值,则返回nil。另外,Set中的所有元素可以通过它的removeAll()方法删除。

if let removedGenre = favoriteGenres.remove("Rock") {
    print("\(removedGenre)? I'm over it.")
} else {
    print("I never much cared for that.")
}
// 打印 "Rock? I'm over it."

使用contains(_:)方法去检查Set中是否包含一个特定的值:

if favoriteGenres.contains("Funk") {
    print("I get up on the good foot.")
} else {
    print("It's too funky in here.")
}
// 打印 "It's too funky in here."

遍历一个集合

你可以在一个for-in循环中遍历一个Set中的所有值。

for genre in favoriteGenres {
    print("\(genre)")
}
// Classical
// Jazz
// Hip hop

Swift 的Set类型没有确定的顺序,为了按照特定顺序来遍历一个Set中的值可以使用sorted()方法,它将返回一个有序数组,这个数组的元素排列顺序由操作符<对元素进行比较的结果来确定.

for genre in favoriteGenres.sorted() {
    print("\(genre)")
}
// prints "Classical"
// prints "Hip hop"
// prints "Jazz

集合操作

你可以高效地完成Set的一些基本操作,比如把两个集合组合到一起,判断两个集合共有元素,或者判断两个集合是否全包含,部分包含或者不相交。

基本集合操作

下面的插图描述了两个集合-a和b-以及通过阴影部分的区域显示集合各种操作的结果。

  Swift - 数组、字典、集合 20170422075031062.png

1 使用intersection(_:)方法根据两个集合中都包含的值创建的一个新的集合。
2 使用symmetricDifference(_:)方法根据在一个集合中但不在两个集合中的值创建一个新的集合。
3 使用union(_:)方法根据两个集合的值创建一个新的集合。
4 使用subtracting(_:)方法根据不在该集合中的值创建一个新的集合。

let oddDigits: Set = [1, 3, 5, 7, 9]
let evenDigits: Set = [0, 2, 4, 6, 8]
let singleDigitPrimeNumbers: Set = [2, 3, 5, 7]
 
oddDigits.union(evenDigits).sorted()
// [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
oddDigits.intersection(evenDigits).sorted()
// []
oddDigits.subtracting(singleDigitPrimeNumbers).sorted()
// [1, 9]
oddDigits.symmetricDifference(singleDigitPrimeNumbers).sorted()
// [1, 2, 9]

集合成员关系和相等

下面的插图描述了三个集合-a,b和c,以及通过重叠区域表述集合间共享的元素。集合a是集合b的父集合,因为a包含了b中所有的元素,相反的,集合b是集合a的子集合,因为属于b的元素也被a包含。集合b和集合c彼此不关联,因为它们之间没有共同的元素。

  Swift - 数组、字典、集合 20170422075428988.png

1 使用“是否相等”运算符(==)来判断两个集合是否包含全部相同的值。
2 使用isSubset(of:)方法来判断一个集合中的值是否也被包含在另外一个集合中。
3 使用isSuperset(of:)方法来判断一个集合中包含另一个集合中所有的值。
4 使用isStrictSubset(of:)或者isStrictSuperset(of:)方法来判断一个集合是否是另外一个集合的子集合或者。父集合并且两个集合并不相等。
5 使用isDisjoint(with:)方法来判断两个集合是否不含有相同的值(是否没有交集)。

let a: Set = ["1","2","3","4","5","6"]
let b: Set = ["1","2"]
let c: Set = ["7"]
 
b.isSubset(of: a)  // true
a.isSuperset(of: b) // true
a.isDisjoint(with: c) // true

Set扩展

集合唯一和有序性

Sequence添加一个扩展,用于获取Sequence中所有唯一的元素。因为我们是很容易将所有的元素放到Set中,并且返回内容,但是这并不稳定,因为Set的顺序是未定义的,为了保证输入元素的顺序和唯一性。进行如下扩展

extension Sequence where Iterator.Element: Hashable {
    func unique() -> [Iterator.Element] {
        var seen: Set<Iterator.Element> = []
        return filter({
            if seen.contains($0) {
               return false
            }else {
               seen.insert($0)
                return true
            }
        })
    }
}
 
[1,2,3,12,1,3,4,5,6,4,6].unique() // [1, 2, 3, 12, 4, 5, 6]

数组和集合的对比

  • Set用于无序的唯一对象,Array是有序的并且可以包含重复数据
  • Array迭代速度比Set看,Set搜索速度比Array快

参考

《Swift进阶》
Collection Types

 

上一篇:如何运行50k +并发用户的负载测试?


下一篇:GoogLeNet学习笔记